重磅！MiniMax M3 即將發佈：稀疏注意力架構突破，百萬 Token 上下文效率暴增

AIbase 報道 北京時間最新消息，國內 AI 獨角獸 MiniMax 即將推出新一代大模型 M3。MiniMax AI 工程負責人 Skyler Miao 近日在社交平臺釋放預告，稱“Something BIG is coming!”，引發業界廣泛關注。

據透露，M3採用了全新稀疏注意力（Sparse Attention）架構，通過 Index Branch 快速索引與 Sparse Branch 精準計算相結合的方式，有效解決了超長上下文場景下的計算瓶頸。

傳統 Transformer 在處理百萬 Token 級別上下文時，計算量會隨序列長度呈平方級增長。而 M3的稀疏設計能大幅降低這一開銷，在保持高性能的同時實現顯著的效率躍升，爲長文本理解、長對話、多文檔分析等應用場景提供有力支撐。

對比前代 M2（支持1M Token 上下文），M3在關鍵指標上取得突破性提升:

這意味着在實際部署中，M3能夠以極低的算力成本高效處理超長上下文，顯著降低推理成本，併爲更復雜的 AI 應用打開想象空間。

MiniMax 此次 M3的預告再次凸顯了國內 AI 企業在架構創新上的競爭力。稀疏注意力等技術的突破，有望推動大模型從“參數規模競賽”轉向“效率與實用性競賽”，爲企業級落地和消費者應用帶來更實惠、高效的體驗。

目前 MiniMax 尚未公佈 M3的具體發佈時間與完整參數規模，但從工程負責人的預告及性能數據來看，這款模型有望成爲長上下文處理領域的有力競爭者。AIbase 將持續關注 MiniMax M3的後續動態，第一時間帶來最新報道。

美團闢謠LongCat模型負責人離職，持續推進國產算力萬億大模型落地

美團7月27日否認LongCat團隊基礎模型負責人裴鵬離職傳聞，稱消息不實。裴鵬畢業於北大，2023年加入美團，先後任基座模型預訓練負責人及LongCat基礎模型負責人，全面主導大語言模型、多模態模型與Agent智能體的研發，並牽頭萬億參數大模型LongCat-2.0的研發與落地。

千問辦公悄然開啓內測主打25項企業 IM 能力與多形態產物一站式交付

智能辦公平臺“千問辦公”已啓動內測，定位專業人士的AI協同中樞。其圍繞“任務到交付”首次推出六大核心能力，包括企業IM協作、Office一站式生成編輯、多模態理解生成、全棧網頁交付、專業數據源聚合及技能市場，覆蓋HR、律師、財務等崗位的專屬工作套件。

螞蟻百靈發佈新一代原生混合推理模型Ling-3.0-Flash