記事本文

グーグルがGemma4 E2Bアーキテクチャを発表、スマートフォンでローカルにAIを実行する技術に質的な進化

公開AI二ュ-ス

時間 :Jun 3, 2026

読む :1分

オープンソース大規模モデルのエコシステムは、下位構造において重要な突破を遂げました。グーグルGoogle DeepMindはこのほど、史上最大のオープンモデルであるGemma4を正式にリリースしました。このモデルのパラメータ数は前世代と同様で約300億ですが、「パラメータ1つあたりの知能密度」が大幅に向上し、いくつかの主要なタスクにおける性能は1年半前のトップクラスの非公開大規模モデルに匹敵しています。

Gemma4で最も注目されている技術的革新は、新しい「E2B（パラメータアンロード）」アーキテクチャの導入です。従来のTransformerアーキテクチャでは、大きな埋め込み層が膨大なVRAMを占有していました。新アーキテクチャは各レイヤーに埋め込みテーブルを追加し、重い全行列乗算計算を検索表メカニズムで代替します。500億パラメータのモデルの例として、E2Bアーキテクチャにより実際のGPU VRAMにロードされる「有効パラメータ」は200億に過ぎず、残りの300億パラメータはCPUやディスクに安全にアンロードできます。これにより、わずか2GBのVRAMで高速な推論が可能となり、モバイル端末、スマートフォン、Raspberry Piなどのエッジデバイスでの展開のボトルネックを完全に突破しました。

今回の非常に野心的な複雑なリリースにおいて、Google DeepMindチームは、Hugging Face、llama.cpp、Ollama、NVIDIA、AMDなどを含む約50社の外部パートナーと協調しました。現在、Gemma4はAndroid Studioと深く統合されており、エージェントモードで何のコードもクラウドAPIにアップロードしなくても、ローカルのオフライン環境でAIを使ってAndroidコードを安全に作成できます。これは職場でのデータプライバシーやオフライン作業の剛性あるニーズを大きく満たしています。

マルチモーダルおよび核心体験の面では、Gemma4はGemini3と同じ研究成果を引き継いでいます。2Bまたは4Bのエッジ側の小さなモデルでも、140種類の言語をサポートする優れた多言語およびマルチモーダル理解力を持っており、音声認識、音声質問、30〜60秒のビデオ分析を簡単に扱えます。現在のところ、このモデルは知識の量では大規模モデルにはまだ及んでいませんが、テキスト拡散（Diffusion Transformer）などの先端的な実験的探索や専門家混合モデル（MoE）の微調整では業界的に認められた課題に直面していますが、その高密度の知能は見過ごせません。

大規模モデルの即座に使える能力が強化されるにつれて、垂直分野の開発エコシステムは深刻な再構築を経験しています。純粋な伝統的なファインチューニングの人気は徐々に冷えてきています。未来に向けて、Google DeepMind

ブラジルのAI新興勢力リオ3.5がトラブル：中国製の大規模モデルのカスタマイズと統合と指摘

ブラジルのリオデジャネイロ市政府が公開したオープンソース大規模モデル「Rio 3.5 397B」がAI業界で注目を集めたが、発表から24時間以内にNex-AGI連合が数学的分析で、このモデルが実は既存モデルを組み合わせた「シェルモデル」であることを指摘。核心的な重みが露呈され、業界内で論争を引き起こしている。....

Jun 15, 2026

206.1k

アップルのローカルAIが急成長！oMLX 0.3.9の大規模更新：Gemma 4の視覚処理高速化＋ワンクリックでCopilotにアクセス。クラウド大規模モデルの優位性が全面的に均等化

Apple SiliconのローカルAIエコシステムに重要なアップデート：oMLXフレームワークv0.3.9.dev2リリース。Gemma4のMTP視覚パス、DFlashエンジン、ParoQuant量子化技術を深く統合し、画像・テキストのマルチモーダル処理速度と使いやすさを大幅向上。AppleのエッジAI競争力を強化。....

May 13, 2026

311.0k

グーグルGemma4 推理速度が3倍に高速化オフライン大モデルの時代が本当に訪れた

Googleは最近、オープンソースモデルGemma4向けにマルチトークン予測（MTP）ドラフターを発表。投機的デコードアーキテクチャを活用し、推論速度を最大3倍に向上させつつ、出力品質と論理能力を維持。リリース後、ダウンロード数が急増し、世界で最も注目されるオープンソースモデルの一つとなった。....

May 7, 2026

302.6k

人気記事予約：トークンの不安から卒業！ブラウザでローカルにGemma4を走らせる手描きフロー図はすべて無料

モバイル端末で大規模モデルを実行することはすでに一般的となり、ブラウザ内に強力なAI機能が組み込まれる流れとなっています。開発者はGoogleのTurboQuantアルゴリズムを利用して、Gemma4モデルをブラウザに配置することに成功しました。ユーザーはAPIの設定やサブスクリプション費用を必要とせず、ローカルでスムーズなAIインタラクションを実現できます。そのコアは、TurboQuantアルゴリズムによる記憶の革命です。

Apr 27, 2026

234.1k

グーグルが静かに「Google AI Edge Eloquent」をリリース、Gemma4をベースにした無料オフラインAI音声変換ツール

グーグルはiOSプラットフォームで実験的な音声入力アプリ「Google AI Edge Eloquent」をリリースし、オフライン優先とスマートな文章修正機能を特徴としています。エッジAI技術を使用して、会話形式の音声をリアルタイムで専門的なテキストに変換します。この行動は、グーグルが高級AI音声からテキストへの市場に進出するものであり、Wispr FlowとSuperWhisperと競合することになります。アプリにはGemma4シリーズの技術が搭載されており、リアルタイム処理とテキスト最適化能力を強調しています。

Apr 7, 2026

228.6k

インテリジェントな未来、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご