グーグルは2026年6月10日に、実験的なオープンソース言語モデルであるDiffusionGemmaを正式にリリースしました。このモデルは従来の大規模モデルが1文字ずつ生成する自己回帰の枠組みを打ち破り、画像AIで使われていた拡散メカニズムをテキスト生成分野に初めて導入しました。このモデルは、ランダムなノイズから繰り返し最適化を行うことで、一度に256トークンのブロックを並列出力できます。

QQ20260611-102527.jpg

ハードウェア性能においては、NVIDIAの深い最適化により、単一GPUでの単ユーザーモードでの実行速度が同種の従来モデルと比べて約4倍向上しています。H100グラフィックカードで単一のリクエストを処理する際には、出力速度が秒間1000トークンに達します。RTX5090などのハイエンドコンシューマー向けグラフィックカードでも秒間700トークンを超えることが可能です。

DiffusionGemmaは260億パラメータを持ち、混合専門家(MoE)アーキテクチャを基盤としており、1ステップでアクティブにするパラメータは38億です。標準的なベンチマークテストでは、テキスト生成の質や正確性は従来のGemma4シリーズモデルにわずかに劣るものの、独自の「すべてのブロックを感知する」能力によって、自己回帰モデルが後方のみ推論できるという制限を打ち破りました。生成過程においてすべてのトークンが相互に参照可能であるため、このモデルはテキストの後補、コードの穴埋め、数独の解法およびアミノ酸配列などの非線形で構造化されたデータ処理タスクにおいて顕著な優位性を示しています。

QQ20260611-102535.jpg