最近、身体知能の現実データ収集技術に重要な突破が生まれました。アントグループのテジー研究所チームが開発したAoE(Always-On Egocentric)継続的な第一人称動画収集フレームワークは、軽量で低コストな身体データ収集方案を提案しました。スマートフォンと20ドル以下の首かけスタンドさえあれば、何万ドルもする専門機器に代わって、身体知能の高品質なデータ収集が可能です。この技術方案の導入により、身体データ収集のコストが高く、スケーラビリティが難しいという課題が効果的に解決されました。現在、この技術論文はArxivに掲載されています。

基礎モデルの継続的な進化とともに、モデルの汎化能力や多シナリオへの適応能力は、現実世界でのインタラクションデータの規模、質、カバー範囲にますます依存しています。AoEの核心的な突破点は、「人+スマートフォン」を持続的なデータノードに変換することです。そのメディアは人体工学に基づいた首かけスタンドで、機械クリップやマグネットなどによりスマートフォンを胸の前で安定させ、ユーザーの視点に近い第一人称映像を継続的に収集し、自然なインタラクションプロセスを完全に記録します。
この方案では、ミリメートル単位の軌跡精度と90%以上の手部キーポイント認識精度を維持しながら、数千台のデバイスによる同時収集とクラウド上の自動処理を実現しました。実験結果によると、Unitree G1ロボットの電源オフタスクにおいて、50本の遠隔操作データだけで成功確率は45%だったものの、AoEデータを200本追加すると成功確率は95%に跳ね上がりました。データが不足している状況では、AoEは「起動学習」の重要な補完役を担っています。

低コストな収集は始まりに過ぎません。論文によると、アントグループは「長時間動画をトレーニングデータに変換する」技術的課題を克服しました。この方案では、端末側の軽量なビジョンモデルが手と物の相互作用を自動的に識別し、録画をトリガーします。大言語-ビジョンモデルを使用して連続的な動画を意味のあるラベル付きの原子的なアクションセグメントに分割し、最終的にクラウド上で自動的にラベリング、フィルタリング、クリーンアップを行い、スマートフォンで録画された動画を高品質で標準化されたトレーニングデータに自動変換します。
さらに、AOEはエッジとクラウドを連携させる仕組みを構築し、収集、前処理、クリーンアップ、選別、スケジュールなどの自動処理を実現しました。人工介入を最小限に抑えることで、全体のトゥループットを向上させています。
記者は、アントグループがAI toBに力を入れていることに注目しています。AIを産業に実装することを方向として、テジー研究所はAI+データ、AI+セキュリティ、AI+金融、AI+身体知能などの分野に重点を置き、技術の成果物化と応用を加速しています。2026年以降、アントグループはAI関連で活発な動きを見せ、これまでに「大規模モデル技術革新部」の設立を発表し、企業向けの大規模モデル製品の提供を計画しています。
