快手旗下 可靈 AI 今日正式發佈「主體庫」(Subject Library),爲 O1多模態視頻模型添加“長期記憶”能力。用戶上傳單張角色圖,系統即可生成3D 視角補全、多光線變體,並支持跨場景「@角色名」一鍵調用,官方宣稱「主體一致性>96%,徹底告別 AI 變臉」。

1.jpg

從單圖到3D 記憶——主體庫三步流程

1. 上傳:支持 JPG/PNG/RAW,自動摳圖、對齊、色彩歸一

2. 補全:AI 生成側臉、背面、局部細節,提供3組方案供選擇

3. 調用:提示詞輸入「@角色名」即可在任意鏡頭、光照、風格下保持同一面孔與服飾細節

2.jpg

AI 智能描述——讓模型讀懂你的創意

- 系統自動提取「髮色+服飾+風格」並生成60字以內關鍵詞,用戶可二次編輯

- 實驗顯示,使用智能描述後,複雜場景一次生成成功率提升27%,平均節省12分鐘手動調參

3.jpg

O1模型統一入口——文本-圖像-視頻無縫銜接

主體庫與 O1的「文本生視頻」「圖像生視頻」「首尾幀控制」共用底層 latent 空間,實現:

- 同一角色在多段視頻裏連續出現,ID 漂移<0.03

- 支持48fps/1080p 輸出,單條最長達5分鐘

- 官方統計,自2024年上線以來 Kling AI 已迭代30+ 次,累計生成2億條視頻

行業衝擊——短視頻進入“一致性”時代

- 影視預覽:製片方可用主體庫鎖定主角造型,快速生成故事板,降低外景復拍成本

- 跨境電商:商家一次性上傳模特圖,即可批量產出多語種試穿視頻,製作成本降至1/10

- 虛擬偶像:IP 方將 V 形象存入庫內,粉絲通過「@角色」即可生成二創視頻,無需再擔心“換臉”

開放計劃與價格

- 免費版:最多存儲5個主體,每月50次調用

- Pro 版:29元/月,主體數無上限,送600次調用+5分鐘高清生成

- Enterprise API:按調用量計費,0.005元/次,支持私有化部署與品牌定製

下一步:多人協同與實時風格化

可靈 AI 透露,2025Q1將上線「多人主體庫」與「實時風格化」——同一畫面可鎖定3位角色,並實時切換卡通、復古、賽博等全局風格,進一步向長劇、廣告、遊戲動畫管線滲透。

編輯觀點

當行業仍在爲“單條視頻4K60fps”卷參數時,可靈 把戰場拉到“跨鏡頭一致性”,相當於給創作者一顆「數字記憶芯片」。一旦主體庫成爲行業標準,AI 視頻將完成從“好玩”到“好用”的躍遷,短視頻、廣告乃至長劇工業化流程或被重寫。AIbase 將持續關注其多人協同功能開放與 Enterprise 版定價。