
針對複雜智能體任務中的上下文擴展瓶頸,M3在底層自主研發了稀疏注意力架構(MSA),相比傳統方案實現更精確的KV分塊與算子層優化,計算速度較同類開源方案提升4倍以上;在1M上下文下,其每Token計算量僅爲上代模型的二分之一十分之一,預填與解碼階段分別實現超9倍和15倍的加速。

在原生百萬億量級交錯數據的混合訓練下,M3的語義空間高度融合,在SWE-Bench Pro等軟件工程及多模態權威評測中超越GPT-5.5和Gemini3.1Pro。在極限任務實測中,M3展現出極強的長線程自主規劃力,不僅歷時12小時自主復現ICLR頂級論文實驗,更在無參考代碼下連續運行24小時、調用工具近兩千次,將Hopper架構上的FP8矩陣乘硬件利用率從7.6%提升至71.3%,並在開放式PostTrainBench中自主調度模型完成“數據-訓練-迭代”全流程。
伴隨M3發佈,專爲長程複雜協作設計的MiniMax Code智能體產品與極具價格競爭力的Token Plan及API服務也同步上線,並承諾在10天內開源模型權重。MiniMax M3的推出不僅打破了前沿多模態與長上下文技術由海外閉源模型壟斷的格局,更以全要素開源的形式重塑了國內開發者生態的性價比邊界。
