バイトダンスは最近、Phantomという革新的な動画生成ツールを発表しました。このツールは、参照対象に基づいて動画を生成し、対象の一貫性に優れており、業界で大きな注目を集めています。
バイトダンス、動画生成ツール「Phantom」発表:被写体の一貫性に優れる

公開AI二ュ-ス
時間 :Feb 19, 2025
読む :1分

バイトダンスは最近、Phantomという革新的な動画生成ツールを発表しました。このツールは、参照対象に基づいて動画を生成し、対象の一貫性に優れており、業界で大きな注目を集めています。
ByteDanceとNTUが開発したオープンソースフレームワーク「StoryMem」は、革新的な「視覚的記憶」メカニズムにより、単一ショット動画生成モデルをマルチショット長編動画生成ツールに進化させ、1分以上の自然なカット割りでキャラクターとシーンの一貫性を保つ物語動画を自動生成し、オープンソースAI動画技術の映画級ナラティブへの発展を促進します。....
レノボはCESでグローバル戦略アプリ「AIスーパーエージェント」を発表、バイトダンスの「豆包アシスタント」に対抗。機能がより複雑で、エコシステム連携が強化され、単一の音声アシスタントを超えるAI応用に本格参入。....
生数科技と清華大学TSAIL実験室が共同でオープンソースのTurboDiffusion動画生成高速化フレームワークを開発し、最大200倍の推論高速化を実現しました。生成品質にほとんど影響を与えないことで、動画生成の重要なブロックとなる課題を突破しました。
知譜チームは4つの動画生成コア技術をオープンソース化しました。GLM-4.6Vの視覚理解、AutoGLMデバイス操作、GLM-ASR音声認識およびGLM-TTS音声合成モデルを含み、マルチモーダル分野における最新の進展を示し、動画生成技術の発展に基盤を築きました。
バイトダンスが120億パラメーターを持つ動画理解モデルVidi2を発表しました。このモデルは数時間分の原始素材を処理し、ストーリーの構成を理解し、プロンプトに従ってTikTokの動画や映画のカットを生成できます。その核心的突破は、正確な時空間定位(STG)機能で、動画内の時空間的な詳細を同時に認識でき、動画編集業界を大きく変えると期待されています。