4月3日午前、Google DeepMindは新世代のオープンソースモデルシリーズ「Gemma4」を正式に公開しました。今回のアップデートは前回の製品リリースから1年間が経過したものです。グーグルはパフォーマンス面で「世代を超える飛躍」を実現し、さらにオープンソースへの取り組みにおいても大規模な進歩を遂げました。ライセンス契約を自社プロトコルから世界中で利用可能なApache2.0に完全変更したことで、開発者は商用や再開発をより自由に行うことが可能になりました。

1.jpg

仕様が網羅的: スマートフォンからワークステーションまでの「4つの主力モデル」

Gemma4 は今回は4つの異なる仕様のモデルを一気にリリースし、すべてのシナリオをカバーしています:

31B Dense(エクセレント版): 全激活パラメータは310億で、256Kという超長文脈をサポートします。Arena AIのオープンソースランキングでは第3位を記録しており、非量化的バージョンは1枚のH100で動作可能です。

26B A4B MoE(コストパフォーマンス最強): ハイブリッドエキスパートアーキテクチャを採用し、総パラメータ数は252億、アクティブパラメータはわずか38億です。推論速度は4Bモデルに近いものの、品質は同レベルの製品を大きく上回り、ランキングでは第6位を記録しています。

E4B & E2B(エッジ側エリート): スマートフォンや埋め込みデバイスに特化して最適化されています。Per-Layer Embeddings技術により、有効パラメータはそれぞれ45億と23億に圧縮されます。特にE2Bは一部のデバイスではメモリ使用量を1.5GB以下に抑えることができます。

2.png

性能向上: コードと数学能力が世代を超えて飛躍

前回のGemma327Bと比較すると、Gemma4の主要指標の向上は驚くべきものとなっています:

数学コンテスト: AIME2026テストの正解率は20.8%から89.2%に急騰しました。

プログラミングの進化: Codeforces ELOスコアは110から2150へと大幅に向上し、LiveCodeBenchテストでは29.1%から80.0%へと急上昇しました。これは現在最も使いやすいオープンソースプログラミング補助モデルの一つです。

総合的な推論: 大学院レベルの科学質問(GPQA Diamond)のスコアは42.4%からほぼ倍増して84.3%となりました。

多言語対応: 140種類以上の言語をネイティブでサポートしており、MMMLUスコアは88.4%です。

3.png

核心特性: 内蔵の「思考モード」とAgentの遺伝子

Gemma4 は単なるパラメータの増加ではなく、エリートモデルのGeminiに近づけたインタラクションロジックを持っています:

Thinking Mode: 切り替え可能な思考モードを内蔵しており、答えを出力する前に内部的に推論を行います。これにより、多段階計画型タスクの正確性が大幅に向上します。

ネイティブなAgentサポート: 関数呼び出しと構造化されたJSON出力をサポートしています。グーグルは同時にオープンソースAgent開発ツールキット(ADK)をリリースし、エッジ側モデルでも「スマートエージェント」に変身することが可能です。

深いマルチモーダル: すべてのバージョンが画像と動画の入力をサポートしており、小規模モデルには追加で音声エンコーダーが搭載されており、音声認識と翻訳にも対応しています。

業界観察: オープンソース競争の「権力再編成」

過去1年間、国内のオープンソースモデル(DeepSeek、Qwen、GLMなど)は非常に高速に更新され、グーグルのオープンソース分野における影響力は一時的に低下しました。Gemma4のリリースは、グーグルが「極限のエッジ側エンジニアリング」と「より徹底的なプロトコル開放」を通じて、再び主戦場に戻る動きを示しています。

結論: 大手企業が「誠意」を語るとき