國產大模型再攀高峯。MiniMax今日正式開源其最新編碼與智能體專用大模型——M2.1,以100億激活參數的稀疏架構,在多語言編程、真實代碼生成與工具調用等核心場景實現全面突破。在權威基準SWE-Multilingual與VIBE-Bench上,M2.1不僅大幅領先同類開源模型,更超越谷歌Gemini3Pro、Anthropic Claude4.5Sonnet等閉源旗艦,標誌着開源編碼模型正式進入“性能碾壓閉源”新階段。

image.png

真實編程場景全面領先,多語言SOTA

M2.1專爲開發者日常編碼需求與原生AI智能體(Agent)打造,其核心優勢體現在:  

- 多語言編程SOTA:在Python、JavaScript、Java、Go、Rust、C++等主流語言中均達到當前開源模型最高水平,尤其在跨語言遷移能力與複雜項目上下文理解上表現突出;  

- 真實工程任務更強:在SWE-Multilingual(軟件工程多語言基準)中,M2.1的代碼修復準確率與端到端任務完成率顯著優於Gemini3Pro與Claude4.5Sonnet;  

- 智能體協作優化:針對工具調用、API集成、錯誤診斷等Agent核心能力,在VIBE-Bench(Visual-Agent & Interactive Behavior Evaluation)中表現優異,爲構建高可靠AI開發者代理提供強大基座。

稀疏激活架構,高性能低推理成本

M2.1採用混合專家(MoE)稀疏激活機制,在推理時僅激活約100億參數(總參數量更大),在保證性能的同時顯著降低算力消耗,使開發者能在消費級GPU或雲實例上高效運行,推動高性能編碼模型“平民化”。

開源生態加速爆發,國產模型迎頭趕上

值得注意的是,就在M2.1發佈前一日,智譜AI開源GLM系列新模型,在SWE-Bench單語言測試中與M2.1表現接近,共同彰顯中國開源大模型在專業領域的爆發力。MiniMax團隊在發佈中特別感謝早期測試合作伙伴的反饋,強調M2.1是“爲真實開發者而生”的工程化產物,而非單純刷榜模型。

AIbase認爲,M2.1的發佈不僅是技術里程碑,更釋放關鍵信號:在垂直專業領域,開源模型已具備全面挑戰甚至超越閉源巨頭的實力。當開發者無需依賴API、可自由部署、微調並審計代碼模型,AI編程的真正民主化時代才真正開啓——而這場由MiniMax引領的開源革命,正重塑全球開發者工具鏈的未來格局。

官方文檔:https://www.minimax.io/news/minimax-m21