1月29日、クンルン・ワンウェイ(スカイワーク・AI)は自社開発の「万能型」ビデオ生成大規模モデル「スカイリールズ-V3」を正式にオープンソース化したことを発表しました。 このモデルのリリースにより、ビデオ生成技術は高保真度と多モーダルな新時代に入りました。単一のモデル構造で参照画像からビデオへの変換、ビデオの延長、および音声駆動の仮想キャラクターの3つの主要な機能を深く統合しています。
在**参照画像からビデオへの変換(I2V)**分野では、スカイリールズ-V3は1枚〜4枚の参照画像入力をサポートし、主体の特徴と空間構図を正確に保持します。テスト結果によると、このモデルは参照の一貫性と視覚的な品質指標において優れた性能を示しており、Vidu Q2やKling1.6などの主流な商用モデルを上回っています。

ビデオ制作における長さとストーリーの課題に対して、スカイリールズ-V3は強力なビデオの延長機能を導入しました。この機能は単なる視点の継続だけでなく、「カメラ切り替え延長モード」もサポートしており、内蔵されたカットイン、正面と背面のカメラなど、プロの映画用トランジション技術により、AI生成ビデオが単なる「時間の拡張」から論理的な「ストーリーの拡張」へと進化しています。
また、**音声駆動の仮想キャラクター(トークアバタール)**モジュールは、正確な音声と映像の同期技術を通じて、非常に高い口元の一致率を実現し、数分間の長編ビデオ生成および複数のキャラクター間のインタラクションをサポートしています。これにより、デジタル人間のライブ配信やオンライン教育においてより自然なインタラクティブな体験が提供されます。

現在、
URL: GitHub: https://github.com/SkyworkAI/SkyReels-V3
