【信報財經新聞】稀宇科技(MiniMax)(00100)發布新一代Agent旗艦大模型M2.7,首次展示「模型自我進化」路徑。
據介紹,M2.7通過構建Agent Harness體系,深度參與自身訓練與優化流程,在部分研發場景中可承擔30%至50%的工作量,並在內部評測集上實現約30%的效果提升。
在核心能力上,M2.7在SWE-bench Pro中取得56.22%成績;同時在VIBE-Pro、Terminal Bench 2等真實工程測試中,支持端到端項目交付與複雜系統理解。辦公場景方面,其在GDPval-AA的ELO得分是1495,為開源最高,並提升Office文檔處理與多輪編輯能力。