最近、AIロボットスタートアップのGeneralistは、画期的な基礎モデルであるGEN-0を正式に発表し、ロボット分野におけるスケーリング法則(Scaling Laws)を初めて明らかにしました。これにより、ロボット技術が「タスクカスタマイズ」から「汎用的知能」への時代へと進化していることが示されました。このモデルは27万時間以上の現実世界での操作データで訓練され、初めてハードウェアプラットフォーム間で「考えるながら行動する」能力を実現しました。業界では、この出来事をロボット版の「ChatGPTの時」と見なしています。

image.png

27万時間のリアルデータ:シミュレーションではなく、混乱した現実を捉える

競合企業がシミュレーション環境や人間のデモ動画に依存しているのとは異なり、GEN-0は高精細な物理的インタラクションデータ上で直接学習しています。これらのデータは、世界中の数千の家庭、倉庫、職場の現実的な状況から収集されたもので、じゃがいもをむく、ねじを締める、パッケージを開ける、部品を組み立てるなどの数百種類の繊細な作業タスクを含んでいます。毎週1万時間以上が追加されています。このような「現実の混沌さ」への徹底的な捕捉により、従来のシステムでは到達できなかった汎化能力を備えています。つまり、理想の動作を学ぶのではなく、滑りや遮蔽、照明の変化などの干渉の中でタスクを遂行する方法を学んだのです。

7Bパラメータは知能の「相転移」の臨界点

Generalistの画期的な貢献は、ロボット知能のスケーリング法則を初めて定量化したことです。下流タスクの誤差と予測トレーニングデータ量との間にべき乗関係(L(D) ∝ D⁻⁰·⁵)があることが判明しました。さらに重要なのは、70億パラメータが能力の飛躍のカギとなる閾値であるという研究結果です。それ以下の値では、モデルは大量のデータの中で「固定」され、移行が難しくなる一方、一度突破すると汎化能力が指数的に増加します。この発見は業界にとって明確な道筋を示しており、本格的なリアルデータの拡大により、ロボットの知能レベルを体系的に向上させることができるのです。

Harmonic Reasoningアーキテクチャ:「考えるながら行動する」を実現

GEN-0の核心的な革新は、Harmonic Reasoning(調和推論)アーキテクチャです。これは、ロボットの「思考」と「行動」の断絶を完全に解決するものです。従来のシステムではまず計画してから実行する必要がありますが、GEN-0は非同期の連続的な時間フローを通じて、感知、推論、および動作を統一的なタイミングで協働させます。デモンストレーションでは、ロボットが「カメラのセットを組み立てる」全工程を自主的に行っています。トレイを折りたたみ、物を取り、袋を開け、配置し、包装し、片付けを行うという一連の動作は、一切の人の指示なしに、滑らかで自然で、まるで「人間のような直感」を持ったように見えます。

クロスプラットフォームの汎用性:1つのモデルで多様なロボットを駆動

GEN-0は「クロスエディン」設計を採用しており、同じモデルが6自由度のロボットアーム、7自由度のアーム、さらには16以上の自由度を持つ半人形ロボットなど、異なるハードウェアにすばやく展開できます。それぞれのハードウェアごとに戦略を再トレーニングする必要はありません。これは、企業が統一された知能中枢を構築し、多様なロボット端末を管理できるようになり、導入と保守コストを大幅に削減することを意味しています。

データフライホイールが動き始め、汎用ロボットの時代が加速

Generalistは、グローバルな展開ネットワークを通じて「データ-知能」のフライホイールを構築しています。より多くのロボットがより多くのリアルな相互作用データを生成し、そのデータがモデルの改善に役立ち、新しいロボットの能力を向上させるのです。このモデルは、現在の「一つのタスクに一つのモデル」の散在した生態系を終わらせる可能性があります。ロボットが専用ツールから、自己学習可能な汎用的な仲間へと進化するのを促進するのです。