宇樹がオープンソースのUnifoLM-VLA-0大モデルを公開：汎用人型ロボットに物理的常識を注入

ウイシューは、UnifoLM-VLA-0の大規模モデルを正式にオープンソース化したことを発表しました。UnifoLMシリーズにおいて、一般的な人型ロボット操作を専門に設計された視覚-言語-動作（VLA）モデルとして、ロボットの脳が単なる「画像と文章の理解」から、「物理的な常識」を持つ embodied 智能へと重要な一歩を踏み出しました。

技術的突破：感知から行動への深く融合

UnifoLM-VLA-0は、従来の視覚言語モデル（VLM）が物理的相互作用において抱える制約を打破することを目的としています：

身体的脳の進化：ロボット操作データに基づいた継続的な事前学習を通じて、モデルは物理的世界の相互作用の法則を理解できるようにし、単なる意味論のレベルにとどまらず、です。

空間的な詳細の一致：モデルはテキスト指示と2D／3Dの空間的な詳細を統合しており、複雑な環境における空間的認識と位置推論能力を著しく向上させています。

動力学的制約：アクションのブロック予測および前向き・逆向きの動力学的制約を統合し、長時間にわたるアクションシーケンスの統一的なモデリングを実現しています。

開発アーキテクチャ：Qwen2.5-VLに基づく二次進化

ウイシューは、システム的にクリーニングされた多タスクデータセットを用いてモデルを磨き上げました：

コアベース：Qwen2.5-VL-7Bというオープンソースモデルを基盤として構築されています。

効率的なトレーニング：わずか340時間の本物の機械データを使用して離散的なアクション予測のトレーニングを行った結果、高品質なタスクの汎化が実現されました。

パフォーマンス評価：空間理解のベンチマークテストでは、その性能はベースラインモデルを大幅に上回り、特定のモードではGemini-Robotics-ER1.5と同等に達するまでになりました。

実戦的な性能：1つの戦略で12種類の複雑なタスクに対応

ウイシューのG1人型ロボットプラットフォームでの検証結果は注目を集めています：

マルチタスクの汎用性：このモデルは、同じ戦略ネットワーク（checkpoint）下で、物体の掴みや配置などの12種類の複雑な作業タスクを安定して完了できます。

強力な耐障害性：実機実験により、外部の乱れにもかかわらず、ロボットは良好な実行の安定性と耐障害性を維持できることを示しています。

現在、ウイシューはGitHubおよびプロジェクトの公式ウェブサイトでモデルコードと関連資料を完全に公開しており、世界中の開発者と共に一般向けの人型ロボットの商業化を促進することを目的としています。

メタがWhatsAppのポリシーを調整：一部のサードパーティAIロボットはメッセージごとに料金を支払う

メタは、イタリアの規制当局の圧力により、WhatsAppのサードパーティAIロボットのポリシーを調整し、特定の地域の開発者に対しメッセージ単位で料金を支払う「メッセージごとの課金」モードを通じて再びサービスにアクセスできるようにする予定です。以前は、メタが自社のAI製品を保護するために、ChatGPTなどのサードパーティロボットをブロックしていました。

グーグル Gemini 3.5のリーク：コード名 Snow Bunny。一度のプロンプトで3000行のコードを生成

グーグルの次世代AIモデルGemini 3.5がリークされた。コード名Snow Bunnyのテスト版は強力なエンジニアリング能力を示し、一度に完全なアプリケーションを構築でき、一度のプロンプトで最大3000行の実行可能なコードを生成できる。グーグルはまた、特定の分野に特化したモデルも準備しており、例えば特定の分野に特化したFierce Falconなど、プログラミング分野における大きな進歩を示している。

5億ドルの誘惑を拒否！Hugging FaceがNVIDIAの大きな投資を断った理由とは？

オープンソースAIプラットフォームであるHugging FaceはNVIDIAからの5億ドルの投資を拒否し、業界に注目を集めました。世界中で活発なAIモデルのライブラリとして、この行動は資金が豊富であるためではなく、以前からNVIDIAなどの大手企業から投資を受けていることが原因です。

宇樹がオープンソースのUnifoLM-VLA-0大モデルを公開：汎用人型ロボットに物理的常識を注入

関連推奨

メタがWhatsAppのポリシーを調整：一部のサードパーティAIロボットはメッセージごとに料金を支払う

グーグル Gemini 3.5のリーク：コード名 Snow Bunny。一度のプロンプトで3000行のコードを生成

5億ドルの誘惑を拒否！Hugging FaceがNVIDIAの大きな投資を断った理由とは？

ウルトラマンが夢游的なAIのリスクに警告：利便性の過度な消耗に注意 OpenAIは採用を遅らせる

AIの巨大企業アントロピック、資金調達目標を20億ドルに倍増　評価額は3500億ドルに達する可能性

宇樹がオープンソースのUnifoLM-VLA-0大モデルを公開：汎用人型ロボットに物理的常識を注入

関連推奨

メタがWhatsAppのポリシーを調整：一部のサードパーティAIロボットはメッセージごとに料金を支払う

グーグル Gemini 3.5のリーク：コード名 Snow Bunny。一度のプロンプトで3000行のコードを生成

5億ドルの誘惑を拒否！Hugging FaceがNVIDIAの大きな投資を断った理由とは？

ウルトラマンが夢游的なAIのリスクに警告：利便性の過度な消耗に注意 OpenAIは採用を遅らせる

AIの巨大企業アントロピック、資金調達目標を20億ドルに倍増 評価額は3500億ドルに達する可能性

AIの巨大企業アントロピック、資金調達目標を20億ドルに倍増　評価額は3500億ドルに達する可能性