人工知能分野において、3Dビジョンと空間理解技術は、具象知能、自律ナビゲーション、仮想現実などのアプリケーションを推進する鍵となっています。2025年3月、杭州群核科技はGTC2025グローバルカンファレンスで、自主開発した3Dビジョン大規模言語モデルSpatialLMを正式にオープンソース化すると発表し、業界の注目を集めました。

このモデルは、その強力な空間認知能力と低コストのデータ処理方法により、ロボットトレーニング、建築設計、AR/VRなどの分野に革命的なブレークスルーをもたらしました。AIbaseは最新の情報を基に、SpatialLMの技術的ハイライトと業界への影響を整理し、詳細に分析します。
SpatialLM:スマホ動画から物理的に正確な3Dシーンへ
