MiniMax 發佈 M2.5模型,這是其 M2系列108天內的第三個版本,模型開源權重同步上線魔搭 ModelScope,實現了能力、效率、成本的三重突破,在編程、搜索、辦公多場景表現領先,還提供了從零代碼使用到私有化部署的全流程接入方案,以及工具調用、推理參數調優的完整實戰指南,推動低成本 Agent 時代到來。

image.png

核心能力實現多維度突破

M2.5在多項權威評測中成績亮眼,SWE-Bench Verified 達80.2%,超越 GPT-5.2且逼近 Claude Opus4.5,Multi-SWE-Bench 以51.3% 位居多語言編程能力行業第一,BrowseComp 達76.3%,搜索與工具調用能力大幅領先。編程上,模型涌現出架構師級別的規劃能力,覆蓋完整開發生命週期,支持多平臺全棧開發,框架泛化能力優於 Claude Opus4.6;搜索方面能減少20% 輪次消耗,專家級搜索任務表現卓越;辦公場景融合金融、法律等行業知識,高階辦公能力突出,內部評測對主流模型勝率達59.0%。同時,M2.5速度較 M2.1提升37%,與 Claude Opus4.6耗時持平,成本僅爲其1/10。

技術創新造就快速迭代

M2.5的快速進化源於三大核心技術創新:一是 Forge 原生 Agent RL 框架,實現約40倍訓練加速;二是 CISPO 算法保障大規模訓練穩定性,解決長上下文信用分配難題;三是創新 Reward 設計,平衡模型效果與響應速度。該技術讓 MiniMax 內部30% 日常任務、80% 新提交代碼由 M2.5完成,M2系列108天內 SWE-Bench Verified 從69.4% 飆升至80.2%,迭代速度領先行業主流模型。

多方式部署適配不同場景

M2.5提供零代碼、API 調用、本地部署三種接入方式,滿足不同用戶需求。非技術用戶可通過 MiniMax Agent 網頁端開箱即用,平臺已有超10000個用戶創建的可複用 “Expert”;開發者可調用魔搭免費 API 或官方 API,官方還推出 Lightning 和標準版兩個 API 版本,成本僅爲同類模型的1/10-1/20;本地部署支持 SGLang、vLLM、Transformers、MLX 四種方案,分別適配高併發生產、中小規模生產、快速驗證、Mac 本地開發等場景,並給出了各方案的硬件要求和操作步驟。

工具調用與參數調優有專屬方案

M2.5原生支持結構化工具調用,可並行調用多個工具,通過 vLLM/SGLang 部署可直接使用 OpenAI SDK 格式,其他框架需手動解析 XML 格式輸出,同時給出了工具結果回傳模型的完整流程和最佳實踐。推理方面,官方推薦 temperature=1.0、top_p=0.95、top_k=40的參數配置,不同場景可靈活調優;編程提示詞可利用模型的架構師思維,且模型對10+ 編程語言和多種腳手架均有優秀的適配性。