第8回虹桥国際経済フォーラム「人型ロボットの革新発展協力」サブフォーラムにおいて、宇樹科技の創設者兼CEOである王興興氏は主題講演を行い、身体知能とロボット大規模モデルの今後の発展について最新の見解を共有しました。
王興興氏は、「現在のロボット大規模モデルの発展段階は、ChatGPTが登場する前の1〜3年程度に相当します。人々は正しい方向性を見つけていますが、実際に実現するための臨界点にはまだ明確なギャップがあります」と述べました。

彼は、過去2年間で生成型AIが言語や視覚分野で画期的な進展を遂げたことを指摘しつつ、「本質的な『身体知能』を実現するには、感覚、運動制御、インタラクション理解などの多次元のシステム的課題を解決する必要があります」と語りました。
「身体知能のChatGPTの瞬間」がいつ訪れるかについて、王興興氏は具体的な判断を示しました。「ロボットが新しい生活環境において、音声や文章による指示だけで約80%のタスクを完了できるようになったとき、ようやくそれが真にChatGPTの瞬間だと考えられるでしょう」と述べました。
彼は、この目標の実現には、強力な物理的世界モデリング能力やデータフィードバックメカニズム、リアルタイム学習システムといった基盤が必要であり、単に大規模モデルの推論や生成能力に依存するだけでは不十分であると考えています。
