中国国内のAIリーディングカンパニーDeepSeekは最近活発な動きを示しており、R1モデルのリリースから1年が経過した後にも、技術的な動向が開発者コミュニティで大きな話題となっています。最新のGitHubコードのコミット記録によると、DeepSeekが更新したFlashMLAコードに、「MODEL1」という未知のモデルを指す多くの識別子が見つかりました。

この数百ファイルにわたるコードベースでは、「MODEL1」が既存のV3.2バージョンと並んで言及されており、これは単なるアップグレードではなく、おそらく新たなモデルシリーズであることを示唆しています。技術的な詳細な違いはこの推測をさらに裏付けています。新アーキテクチャは、キーバイト(KV)キャッシュレイアウト、スパース性処理ロジック、およびFP8データ形式のデコードサポートにおいて、V3シリーズとは異なる設計思想を示しており、これは計算効率やVRAM最適化における新たな進歩を意味しています。

これまでの情報によると、DeepSeekは2026年の旧暦新年に「DeepSeek V4」というエントリーモデルをリリースする予定であり、特に強力なコード作成能力が特徴です。また、最近公式に発表された「残差接続の最適化(mHC)」および「AIメモリモジュール(Engram)」に関する2つの重要な論文を考慮すると、業界関係者は「MODEL1」がこれらの最先端の研究成果の実用化であると考えています。