昆仑万維は、天工AI大モデルSkyReels V4がArtificial Analysisの文生動画(音声を含む)カテゴリで世界第1位に輝いたことを発表しました。このモデルはKling3.0、Google Veo3.1、Vidu Q3、OpenAI Sora2などの主流モデルを大きく上回り、現在世界で最も強力なAIビデオ生成モデルとなりました。

コア的な革新:マルチモーダル強化学習と論理的推論
SkyReels V4は技術構造において2つの重要な変化を実現し、ビデオ生成における一貫性とストーリー展開の課題を解決しました:
強化学習システム(RL):マルチモーダルなセマンティック Reward モデルを構築し、段階的なカリキュラム学習経路を採用することで、モデルに論理的推論能力を注入し、1080p 15秒の商用レベルの長系列生成を実現しました。
高度な参照タスク:「キーフレーム参照」と「グリッド図参照」の機能を追加しました。前者はノード間の連続した画像を正確に推論することができ、後者は複数のストーリー画像をアップロードし、ショートドラマの作成においてキャラクターの特徴とシーンスタイルの統一を確保します。
ランキング首位を達成したことで、SkyReels V4のAPIエントリポイントも全シナリオ向けに正式に開放されました。その機能はモデルのすべての核心的な機能を完全にカバーしています:
全機能カバー:テキストから動画生成、画像から動画生成、マルチモーダル参照生成、動画編集・修復、および音声と映像の同時生成を含みます。
低コストでの支援:EC、教育、コンテンツプラットフォーム、開発チームは高額な研究開発費用を投資することなく、世界トップクラスの音声・映像生成能力を直接呼び出すことができます。
昆仑万維は以前からSkyReelsシリーズの複数のモデルを順次公開してきました。V1では人物駆動、V2では長時間動画生成、そして今やV4では音声と映像の同期と論理表現に大きな飛躍を遂げています。これにより、SkyReelsは「生成できる」から「生成が上手くなる」へと進化しました。
現在、SkyReels V4の技術報告書も同時に公開されています。開発者は公式ウェブサイトを通じてAPIドキュメントを取得し、業務の統合を行うことができます。この進展は中国のAIが視聴覚コンテンツ生成という分野で世界をリードしていることを示しています。
