AIbase 報道 北京時間最新消息,國內 AI 獨角獸 MiniMax 即將推出新一代大模型 M3。MiniMax AI 工程負責人 Skyler Miao 近日在社交平臺釋放預告,稱“Something BIG is coming!”,引發業界廣泛關注。

M3核心架構創新:稀疏注意力機制
據透露,M3採用了全新稀疏注意力(Sparse Attention)架構,通過 Index Branch 快速索引與 Sparse Branch 精準計算相結合的方式,有效解決了超長上下文場景下的計算瓶頸。
傳統 Transformer 在處理百萬 Token 級別上下文時,計算量會隨序列長度呈平方級增長。而 M3的稀疏設計能大幅降低這一開銷,在保持高性能的同時實現顯著的效率躍升,爲長文本理解、長對話、多文檔分析等應用場景提供有力支撐。
實測性能大幅領先 M2
對比前代 M2(支持1M Token 上下文),M3在關鍵指標上取得突破性提升:
- Prefill 階段速度提升9.7倍
- Decoding 階段速度提升15.6倍
這意味着在實際部署中,M3能夠以極低的算力成本高效處理超長上下文,顯著降低推理成本,併爲更復雜的 AI 應用打開想象空間。
行業意義:長上下文時代的效率新標杆
MiniMax 此次 M3的預告再次凸顯了國內 AI 企業在架構創新上的競爭力。稀疏注意力等技術的突破,有望推動大模型從“參數規模競賽”轉向“效率與實用性競賽”,爲企業級落地和消費者應用帶來更實惠、高效的體驗。
目前 MiniMax 尚未公佈 M3的具體發佈時間與完整參數規模,但從工程負責人的預告及性能數據來看,這款模型有望成爲長上下文處理領域的有力競爭者。AIbase 將持續關注 MiniMax M3的後續動態,第一時間帶來最新報道。
