李飛飛チームが最新に公開したRTFM(Read The Field Model)は、現在最も画期的な3D世界生成モデルの一つとなっています。このモデルは、単一のNVIDIA H100 GPUでインタラクティブなフレームレートでのリアルタイム推論を実現し、「3D世界生成」を概念から実用化へと導いた成功例です。

RTFMの最大の特徴は、持続性と3Dの一貫性を備えたリアルタイム動作能力です。このモデルは完全な3Dシーンを生成するだけでなく、インタラクティブなプロセスにおいても幾何構造、物体の位置および外観を安定して一致させることができます。反射、影、鏡面高光、光輪などの複雑な視覚効果もサポートし、ゲームエンジンとほぼ同等のリアリズムを実現しています。

これまでの短時間生成の3Dモデルとは異なり、RTFMは「持続的記憶メカニズム」を導入しており、生成された仮想世界が長期的に連続性を持つようになっています。ユーザーはモデルによって構築された3D空間内で無制限の時間にわたってインタラクティブに探索でき、視点や動作の変化によってシーンが消えることはありません。これにより、本質的に「持続可能」なAIの世界を実現しました。

業界では、RTFMの登場はAI世界モデル(World Model)が高精度なリアルタイムレンダリングに向かって重要な一歩を踏み出したものと評価されており、バーチャルリアリティ、ゲームエンジン、ロボットの身体知などさまざまな分野に新たなインフラストラクチャを提供します。