MiniMax M2.5 開源低成本 Agent 時代來臨

MiniMax 發佈 M2.5模型，這是其 M2系列108天內的第三個版本，模型開源權重同步上線魔搭 ModelScope，實現了能力、效率、成本的三重突破，在編程、搜索、辦公多場景表現領先，還提供了從零代碼使用到私有化部署的全流程接入方案，以及工具調用、推理參數調優的完整實戰指南，推動低成本 Agent 時代到來。

核心能力實現多維度突破

M2.5在多項權威評測中成績亮眼，SWE-Bench Verified 達80.2%，超越 GPT-5.2且逼近 Claude Opus4.5，Multi-SWE-Bench 以51.3% 位居多語言編程能力行業第一，BrowseComp 達76.3%，搜索與工具調用能力大幅領先。編程上，模型涌現出架構師級別的規劃能力，覆蓋完整開發生命週期，支持多平臺全棧開發，框架泛化能力優於 Claude Opus4.6;搜索方面能減少20% 輪次消耗，專家級搜索任務表現卓越;辦公場景融合金融、法律等行業知識，高階辦公能力突出，內部評測對主流模型勝率達59.0%。同時，M2.5速度較 M2.1提升37%，與 Claude Opus4.6耗時持平，成本僅爲其1/10。

技術創新造就快速迭代

M2.5的快速進化源於三大核心技術創新:一是 Forge 原生 Agent RL 框架，實現約40倍訓練加速;二是 CISPO 算法保障大規模訓練穩定性，解決長上下文信用分配難題;三是創新 Reward 設計，平衡模型效果與響應速度。該技術讓 MiniMax 內部30% 日常任務、80% 新提交代碼由 M2.5完成，M2系列108天內 SWE-Bench Verified 從69.4% 飆升至80.2%，迭代速度領先行業主流模型。

多方式部署適配不同場景

M2.5提供零代碼、API 調用、本地部署三種接入方式，滿足不同用戶需求。非技術用戶可通過 MiniMax Agent 網頁端開箱即用，平臺已有超10000個用戶創建的可複用 “Expert”;開發者可調用魔搭免費 API 或官方 API，官方還推出 Lightning 和標準版兩個 API 版本，成本僅爲同類模型的1/10-1/20;本地部署支持 SGLang、vLLM、Transformers、MLX 四種方案，分別適配高併發生產、中小規模生產、快速驗證、Mac 本地開發等場景，並給出了各方案的硬件要求和操作步驟。

工具調用與參數調優有專屬方案

M2.5原生支持結構化工具調用，可並行調用多個工具，通過 vLLM/SGLang 部署可直接使用 OpenAI SDK 格式，其他框架需手動解析 XML 格式輸出，同時給出了工具結果回傳模型的完整流程和最佳實踐。推理方面，官方推薦 temperature=1.0、top_p=0.95、top_k=40的參數配置，不同場景可靈活調優;編程提示詞可利用模型的架構師思維，且模型對10+ 編程語言和多種腳手架均有優秀的適配性。

MiniMax M2.5 開源低成本 Agent 時代來臨

核心能力實現多維度突破

技術創新造就快速迭代

多方式部署適配不同場景

工具調用與參數調優有專屬方案

相關推薦

Kimi K3 攻防考卷翻車：漏洞利用只到美國前沿模型四成，蒸餾疑雲被安全機構擺上臺

Runway推出Media Router：自動切換AI模型幫你省Token，創意驗證到成片一條龍搞定

小鵬人形機器人廣州工廠開啓小批量試生產預計2026年實現量產

快手入局AI互動內容賽道，開放首批創作者招募

Google Q2 資本開支翻番破紀錄：449 億美元砸向 AI 基建，雲業務利潤率幾乎翻倍

MiniMax M2.5 開源 低成本 Agent 時代來臨

核心能力實現多維度突破

技術創新造就快速迭代

多方式部署適配不同場景

工具調用與參數調優有專屬方案

相關推薦

Kimi K3 攻防考卷翻車：漏洞利用只到美國前沿模型四成，蒸餾疑雲被安全機構擺上臺

Runway推出Media Router：自動切換AI模型幫你省Token，創意驗證到成片一條龍搞定

小鵬人形機器人廣州工廠開啓小批量試生產 預計2026年實現量產

快手入局AI互動內容賽道，開放首批創作者招募

Google Q2 資本開支翻番破紀錄：449 億美元砸向 AI 基建，雲業務利潤率幾乎翻倍

MiniMax M2.5 開源低成本 Agent 時代來臨

小鵬人形機器人廣州工廠開啓小批量試生產預計2026年實現量產