崑崙萬維宣佈其天工 AI 大模型 SkyReels V4在 Artificial Analysis 的文生視頻(含音頻)賽道中榮登全球第一。該模型性能顯著超越了 Kling3.0、Google Veo3.1、Vidu Q3及 OpenAI Sora2等主流模型,成爲目前全球視頻生成能力最強的 AI 大模型。

核心突破:全模態強化學習與邏輯推理
SkyReels V4在技術架構上實現了兩大核心變革,解決了視頻生成中的一致性與敘事邏輯難題:
強化學習體系(RL):通過搭建全模態語義 Reward 模型並採用階梯式課程學習路徑,爲模型注入了邏輯推理能力,實現了1080p15秒商用級長序列生成。
高階參考任務:新增“關鍵幀參考”與“網格圖參考”能力。前者可精準推演節點間的連貫畫面;後者支持上傳多張劇情圖,確保短劇創作中角色特徵與場景風格全程統一。
隨着榜單登頂,SkyReels V4的 API 入口也正式面向全場景開放。其能力完整覆蓋了該模型的所有核心功能:
全功能覆蓋:包括文生視頻、圖生視頻、多模態參考生成、視頻編輯與修復以及音畫聯合生成。
低門檻賦能:電商、教育、內容平臺及開發者團隊無需投入鉅額研發成本,即可直接調用全球頂尖的音視頻生成能力。
崑崙萬維此前已陸續發佈並開源了 SkyReels 系列多個模型。從 V1的人像驅動到 V2的長視頻生成,再到如今 V4在音畫同步與邏輯表現上的全面爆發,SkyReels 展現了從“能生成”到“生成得好”的跨越。
目前,SkyReels V4的技術報告已同步發佈,開發者可通過其官網平臺獲取 API 文檔並開展業務集成。這一進展標誌着中國 AI 在視聽內容生成的垂直賽道上已處於全球領先位置。
