近日,阿里通義萬相團隊在社交媒體平臺X上發佈預告,即將推出其最新的AI模型——Wan2.2-S2V。這款新模型的核心亮點在於,它不僅具備強大的視頻生成能力,還能同步生成音頻,實現了視頻與音頻的深度融合。
根據團隊發佈的示例視頻,該模型能夠生成包含唱歌音頻的AI視頻,這標誌着其在多模態AI生成技術上邁出了重要一步。傳統的視頻生成模型通常僅限於視覺內容,音頻部分需要單獨處理或後期合成。而Wan2.2-S2V的出現,有望解決這一技術瓶頸,爲內容創作者提供更高效、更具表現力的創作工具。
該模型的正式發佈,或將重新定義AI視頻生成領域的標準,預示着一個更具沉浸感和真實感的AI內容生成時代的到來。
