2025年12月30日、騰訊混元チームはHY-Motion1.0(Hunyuan-Motion-1.0)を大規模オープンソースとしてリリースしました。このモデルは10億パラメータ級のテキストから3Dアクション生成を行う大規模なモデルです。このモデルはDiffusion Transformer(DiT)アーキテクチャとフローマッチング機構を基盤としており、自然言語による単一の記述だけで高精度で滑らかで多様な3Dキャラクターの骨格アニメーションを生成できます。Blender、Unity、UEなどの主要な3Dツールと直接互換性があり、アニメーション制作の門檻を大きく低下させます。

主な技術的特徴
HY-Motion1.0は全段階トレーニング戦略を採用しています。まず、3000時間以上に及ぶ多様な動きデータで事前トレーニングを行い、一般的な運動の事前知識を構築します。その後、400時間の選りすぐられた高品質なデータで微調整を行い、細部の滑らかさを向上させます。最後に、強化学習(RLHF)により人間のフィードバックと報酬モデルを組み合わせて、物理的な合理性と意味の一致を最適化します。
このモデルは6つの大きなカテゴリにわたる200種類以上の動作をカバーしており、基本的な移動、スポーツ競技、フィットネスアウトドア、社交的なリラックス、日常的な活動およびゲームキャラクターの動作(例:剣で防御する、ゾンビのように歩く)が含まれます。出力形式はSMPL-Hの骨格フォーマットであり、原子的な動作、複合シーケンスおよび同時動作の生成が可能です。
実際のテスト結果は優れています
コミュニティでのテストでは、このモデルは日常生活のシナリオにおいて非常に高い再現性を示しています。例えば、「走る」「椅子に座る」「脚を2回上げる」などのプロンプトに対して、自然でつながった動作が生成されます。また、『マトリックス』の銃弾時間を含む複雑な動作も正確に再現され、滑らかな姿勢を保っています。
性能評価において、指示に従う能力は78.6%(SSAE指標)で、動作の質は平均3.43点(5点満点)となり、MoMaskやDARTなどのオープンソースベースラインを全面的に上回っています。特に複雑な指示や多数のカテゴリへの対応において優れています。
極限の挑戦:プロのアスリートの動作(ジャンプスキーやスケートボードなど)の再現には不十分であり、関節の遷移が偶に不自然になる場合もありますが、全体的な物理的妥当性は前世代を大幅に超えています。
ゲームアニメーションの応用可能性は広がります
このエンドツーエンドモデルはゲーム開発に特に適しています。NPCの日常的な動作(歩行、相互作用)の迅速な生成により、予備研究とイテレーションが著しく加速されます。主要なキャラクターのデザインは後工程での微調整が必要ですが、エンジンにスムーズにインポートでき、MMOやアクションゲームの制作を支援します。映画の分鏡、広告の動き、VRコンテンツの作成にも役立ちます。
軽量版のHY-Motion-1.0-Lite(0.46Bパラメータ)も同時にオープンソースされていますので、導入がより楽になります。
プロジェクトの場所:https://hunyuan.tencent.com/motion?tabIndex=0
