検索速度が948倍に高速化！Google DeepMind、STATICフレームワークを発表してLLMの生成型検索の難題を解決

現代の産業向け推薦システムにおいて、大規模言語モデル（LLM）を基盤とする「生成型検索（GR）」は伝統的な埋め込み検索に取って代わっています。しかし、この手法は実際の応用において困難な問題に直面しています。それは、モデルが「無意味なことを言う」ことで、存在しない商品IDを生成したり、在庫ロジックに反する出力を生じたりすることです。

この課題を解決するために、Google DeepMind と YouTube の研究チームは最近、STATIC（制約付きデコードを加速するためのスパース転送行列による Trie インデックス）という新しいフレームワークを発表しました。この技術は、革新的な数学的アプローチによって、LLM の制約付きデコード速度を驚くほど 948倍向上させました。

主要な技術的突破:

「木」から「行列」へ:従来の制約チェックは接頭辞木（Trie）に依存していましたが、GPU/TPUなどのハードウェア上で効率が極めて低かったものです。STATICは複雑な木構造を静的圧縮スパース行（CSR）行列に平坦化し、チェックプロセスをハードウェアが得意とするベクトル演算に変換します。
極めて高速なレスポンス:30億パラメータのモデルでテストしたところ、STATICの1ステップ遅延はわずか 0.033ミリ秒でした。従来のCPU検索方式と比較すると千倍以上速く、現在のハードウェア加速方式と比較しても40倍以上の優位性があります。
YouTubeでの実証成功:この技術はすでにYouTubeの動画推薦に導入されており、「過去7日間の新鮮さ」といったビジネス上の制約を確保するために使用されています。実験結果によると、新鮮な動画の視聴数は 5.1%上昇し、クリック率（CTR）も顕著に増加しました。

Unsloth Studioが発表：初めてのローカルな視覚的な大規模モデルのファインチューニングプラットフォーム显存使用量を70%削減

Unsloth AIはオープンソースでコード不要な視覚ツールであるUnsloth Studioをリリースし、大規模言語モデルのファインチューニングプロセスを簡素化し、開発のハードルを下げることを目的としています。このツールはカスタムの逆伝播カーネルを使用して、トレーニング速度を倍にし、GPUメモリを70%節約します。複雑な環境設定や高価なハードウェアコストなしで利用可能です。

1ドルで200のブラウザタスクを実行！オープンソースブラウザ操作キットBU-30B-A3B-Previewが登場

BrowserUseが新たに開発した大規模言語モデルBU-30B-A3B-Previewを公開。MoEアーキテクチャを採用し、総パラメータ300億ながら推論時の活性化を一部に限定することで、高性能と軽量化を両立。AIブラウザ操作のコストと導入障壁を大幅に低減した。....

中国初のアクセシブルなAI読み聞かせシステム「スターライト AI 読み聞かせ」・シャン・コングが視覚障害児童の読書を支援

中国初の視覚障害児向けAI読み聞かせシステム「小星」が正式リリース。大規模言語モデルを搭載し、スマホやPCから無料で利用可能。本の内容や語義、ストーリーに関する質問に対応し、視覚障害者の読書ニーズをサポートします。....

Googleが画期的な進展！AIエージェントが自己進化を実現エラーから学んでスーパーインテリジェントへ

Googleが推論記憶フレームワークを発表し、AIエージェントが経験に基づいたエラーから学び知識を蓄積し、自己進化を実現するようにしています。この技術は、現在の大きなモデルエージェントが経験から成長できないという欠点を解決することを目的としており、AIがより自律的で知能的な方向へ進化するのを促進します。

検索速度が948倍に高速化！Google DeepMind、STATICフレームワークを発表してLLMの生成型検索の難題を解決

関連推奨

Unsloth Studioが発表：初めてのローカルな視覚的な大規模モデルのファインチューニングプラットフォーム显存使用量を70%削減

1ドルで200のブラウザタスクを実行！オープンソースブラウザ操作キットBU-30B-A3B-Previewが登場

中国初のアクセシブルなAI読み聞かせシステム「スターライト AI 読み聞かせ」・シャン・コングが視覚障害児童の読書を支援

Googleが画期的な進展！AIエージェントが自己進化を実現エラーから学んでスーパーインテリジェントへ

AI採用スタートアップJuiceboxが3600万ドルの資金調達を実現：4人チームが千億円規模のARRを達成レッド・シーブルがAラウンドを主導

検索速度が948倍に高速化！Google DeepMind、STATICフレームワークを発表してLLMの生成型検索の難題を解決

関連推奨

Unsloth Studioが発表：初めてのローカルな視覚的な大規模モデルのファインチューニングプラットフォーム 显存使用量を70%削減

1ドルで200のブラウザタスクを実行！オープンソースブラウザ操作キットBU-30B-A3B-Previewが登場

中国初のアクセシブルなAI読み聞かせシステム「スターライト AI 読み聞かせ」・シャン・コングが視覚障害児童の読書を支援

Googleが画期的な進展！AIエージェントが自己進化を実現 エラーから学んでスーパーインテリジェントへ

AI採用スタートアップJuiceboxが3600万ドルの資金調達を実現：4人チームが千億円規模のARRを達成 レッド・シーブルがAラウンドを主導

Unsloth Studioが発表：初めてのローカルな視覚的な大規模モデルのファインチューニングプラットフォーム显存使用量を70%削減

Googleが画期的な進展！AIエージェントが自己進化を実現エラーから学んでスーパーインテリジェントへ

AI採用スタートアップJuiceboxが3600万ドルの資金調達を実現：4人チームが千億円規模のARRを達成レッド・シーブルがAラウンドを主導