ゲームAIが画期的な突破を遂げました。NVIDIAとスタンフォード大学は近日、新しくて汎用性の高いゲームエージェント「NitroGen」を共同で発表しました。このモデルは1000種類以上の異なるゲームにおいて、合計4万時間に及ぶ高品質なゲームデータをもとに訓練され、これまでにない跨ゲームの一般化能力を備えています。さらに注目すべきは、研究チームがトレーニングデータセットとモデルの重みを完全オープンソース化し、世界中のAIおよびゲーム研究コミュニティに強力なインフラストラクチャを提供していることです。

 どんなゲームでも遊べる汎用的な知能

NitroGenの主な目的は、現在のゲームAIにおける「一つのゲームごとに一つのモデル」という制約を乗り越えることです。従来の強化学習モデルは通常、単一のゲームに対してから始めて訓練されることが多いですが、NitroGenは大量かつ多様なゲーム環境(プラットフォームジャンプ、戦略、シューティング、パズル、シミュレーション経営など)で学習することで、一般的な認識・意思決定・操作能力を獲得しています。実験の結果、このモデルは見たことのない新しいゲームにおいても迅速に適応し、人間レベルのプレイを達成できることが確認されています。

image.png

 プロジェクトのアドレス:https://nitrogen.minedojo.org/

4万時間分のデータを開示し、ゲームAIの民主化を推進

研究チームは、NitroGenの成功はモデル構造だけでなく、高品質で大規模なトレーニングデータにも大きく依存していると強調しています。そのため、GameVerse-1Kという名前のデータセットも同時に公開しました。その内容は以下の通りです:

- 商業的およびオープンソースゲームの1000以上に及ぶ完全なインタラクティブな軌跡;

- 人間とAIによるゲームプレイの4万時間分の録画;

- 各フレームの画像、操作コマンド、報酬信号、および状態メタデータの正確な同期。

すべてのデータとモデルの重みはGitHubとHugging Faceを通じて公開され、学術研究および非商業的な用途にサポートされます。

 技術の特徴:エンドツーエンドの視覚入力 + 汎用的な動作空間

NitroGenは純粋な視覚入力(元のピクセル)を使用し、ゲーム内のAPIや状態へのアクセスなしに、本物の「人間のようにゲームを遊ぶ」ことを実現しています。また、その設計では統一された動作抽象層を設け、異なるゲームの複雑なコントロール(キーボード、コントローラー、タッチスクリーンなど)を標準化された動作空間にマッピングし、モデルがマルチプラットフォームでの一般化が可能となっています。

 業界的な意義:ゲームを超えて、汎用的な知能の実験場として

AIbaseによると、NitroGenの価値はエンターテイメントの領域を超えています。ゲームは複雑で動的、そして高次元のシミュレーション環境であり、汎用人工知能(AGI)を訓練するための理想的な実験場です。NitroGenが検証した「大規模なマルチゲームの事前学習+高速な移行」の枠組みは、今後ロボット制御、自動運転、産業シミュレーションなどの分野へと移行可能です。

今回のNVIDIAとスタンフォードが完全オープンソースを選択したことは、研究の進捗を加速させるだけでなく、業界に明確なメッセージを送っています。それは、開発協力こそが汎用的な知能への最短ルートであるということです。