アリババグループに所属する身体知能企業であるリンボー科技は、本日、自社の身体知能ベースモデル「LingBot-VLA」の実機後学習ツールチェーンを全面的にオープンソース化したことを発表しました。開発チームはこのツールチェーンを基盤として、自前のデータを使用してLingBot-VLAを迅速に自社ロボットや具体的なタスクに移行できます。

 

現在、身体知能分野でのオープンソースモデルが増加していますが、モデルを実際に自社のロボットにデプロイするには一連の調整作業が必要です。異なるロボットはアーム構造、エンドエフェクター、センサー構成、制御インターフェースなどにおいて違いがあるため、開発チームは実機への導入に多くのエンジニアリング作業を行う必要があります。このエンジニアリングフローは各チームにとって重要なノウハウであり、これまで完全に公開されていませんでした。

 

今回のオープンソースは、実機への適合プロセスにおける中心的なニーズに焦点を当てており、4つの重要なステップをカバーしています。それは、多種のLeRobotデータを統合できるサポート、関節次元マッピングを標準化するデータ処理ツール、実機シーン向けに最適化されたトレーニング設定、オフライン評価ツール、およびコンパイル加速をサポートする実機配置モジュールです。モデルは深さ付きと非深さ付きの2つのバージョンを提供しており、開発チームが自身のニーズに応じて選択できるようにしています。

 

アリババリンボーがオープンソース化した身体知能ベースモデルであるLingBot-VLAは、2万時間に及ぶリアルなロボットデータで事前学習されており、9種類の主流となる二本腕ロボット構造をカバーしています。これは、本体間・タスク間での汎化能力を持っています。実機およびシミュレーションの両方で、LingBot-VLAは業界の基準値π0.5を上回っており、楽聚、ソンリン、星海図などのメーカーと複数機種での検証を完了しています。

 

情報によると、LingBot-VLAは150件のデモンストレーションデータだけで高品質なタスク移行が可能です。下位のコードライブラリの深い最適化により、そのトレーニング効率はStarVLA、OpenPIなどの主要フレームワークの1.5〜2.8倍となり、モデル適合に必要なデータと計算リソースコストをさらに低減しています。

 

現在、LingBot-VLAのコードライブラリはGitHub上でオープンソース(github.com/Robbyant/lingbot-vla)となっており、モデル重みはHugging FaceとModelScopeにも同期して公開されています。