國產 AI 領頭羊DeepSeek近期動作頻頻,繼 R1 模型發佈一週年後,其技術動向再次引發開發者圈震動。根據最新GitHub代碼提交記錄顯示,在DeepSeek更新的 FlashMLA 代碼中,被發現存在大量指向未知模型“MODEL1”的標識符。

這份橫跨上百個文件的代碼庫中,有多處將“MODEL1”與現有的V3.2 版本並列提及,暗示這並非現架構的簡單迭代,而極有可能是一個全新的模型序列。技術層面的細節差異進一步印證了這一猜想:新架構在鍵值(KV)緩存佈局、稀疏性處理邏輯以及對 FP8 數據格式的解碼支持上,均展現出與V3 系列不同的設計思路,這通常意味着模型在計算效率與顯存優化上實現了新的突破。

此前已有消息指出,DeepSeek計劃在 2026 年農曆新年期間發佈名爲DeepSeek V4的旗艦模型,主打更強悍的代碼編寫能力。結合近期官方發佈的關於“優化殘差連接(mHC)”以及“AI 記憶模塊(Engram)”的兩篇重磅論文,外界普遍猜測“MODEL1”正是這些尖端科研成果的工程化落地。