國內領先的視頻大模型 Vidu 今日宣佈,其開放平臺正式上線“一鍵生成 MV”功能。這一技術的推出,標誌着視頻創作從素材拼接邁向了全自動的端到端生成時代。用戶現在只需提供背景音樂、參考圖像以及簡單的文本指令,系統即可在分鐘級別內輸出畫質精美、敘事連貫的高質量 MV。

該功能的核心在於一套深度協同的多智能體(Multi-Agent)系統。在接收到用戶指令後,系統內部的多個專用 AI 智能體會立即開啓精密協作。首先,導演智能體會對音樂結構和歌詞進行深度解析,規劃出整體的敘事脈絡;隨後,分鏡腳本智能體會將創意轉化爲詳細的鏡頭描述,涵蓋景別、運鏡和時長等專業參數。
在視覺生成階段,該系統表現出了極高的工業級穩定性。通過“多圖參考生視頻”技術,創作者最多可上傳7張參考圖作爲視覺錨點,視覺生成智能體據此在長達五分鐘的視頻中精準維持角色、場景和美學風格的高度統一。最後,剪輯與合成智能體會負責鏡頭的轉場卡點,並自動生成與歌詞逐幀同步的動態字幕。
這種“全自動製片”模式無需人工干預,極大地降低了專業視頻創作的門檻。對於創作者而言,Vidu 不再僅僅是一個生成工具,而是一個集成化的虛擬製片廠,讓複雜的 MV 製作變得像發送指令一樣簡單。
劃重點:
🎬 全自動多智能體協同:系統內置導演、分鏡、視覺生成及剪輯四大智能體,實現從解析音樂到成片輸出的全流程自動化。
🖼️ 工業級風格一致性:支持最多7張參考圖定位,確保在長達5分鐘的視頻中,角色與場景風格不發生漂移。
🎵 音畫同步精準卡點:AI 能自動識別背景音樂節奏並完成轉場,同時生成逐幀同步的動態字幕,分鐘級即可交片。
