根據公開數據顯示,今年1月,快手可靈AI全球月訪問用戶總數環比增長113%。
瑞銀近期表示,在線娛樂與教育乃是 AI 落地的核心場景,快手作爲應用層的標杆企業,其自主研發的可靈 AI 在全球視頻生成模型領域佔據領先地位。
前不久可靈AI正式上線多圖參考參考功能,支持同時參考多個主體。用戶可以上傳1到4張參考圖片,並框選出其中的人物、物品、道具或場景。
阿里巴巴12月16日發佈新一代萬相2.6系列模型,針對影視製作和圖像創作全面升級,號稱“全球功能最全的視頻生成模型”。該模型已上線阿里雲百鍊和官網,核心亮點包括國內首個“角色扮演”功能,並支持音畫同步、多鏡頭生成及聲音驅動等,在畫質、音效等方面實現技術突破。
快手旗下可靈AI發佈“主體庫”,爲O1多模態視頻模型增加長期記憶功能。用戶上傳單張角色圖,系統可生成3D視角補全和多光線變體,支持跨場景一鍵調用角色,主體一致性超96%。流程包括上傳圖片自動處理、AI補全多角度視圖,實現從單圖到3D記憶的轉換。
蘋果推出視頻生成模型STARFlow-V,採用“歸一化流”技術而非主流擴散模型,專注於提升長視頻穩定性。該模型在視覺質量和生成速度上可與擴散模型媲美,輸出分辨率爲640×480像素,幀率爲每秒16幀。
蘋果發佈視頻生成模型STARFlow-V,採用歸一化流技術替代主流擴散模型,旨在提升長視頻生成的穩定性和減少錯誤累積。該技術直接學習數據分佈,簡化生成過程,與Sora等競爭對手形成差異化競爭。
快手可靈AI發佈數字人模型Avatar2.0,用戶僅需提供一張照片和一段音樂,即可生成長達5分鐘的唱歌視頻。該模型顯著提升了數字人的表現力,使其能夠自然展現表情和肢體動作,告別僵硬“對口型”模式。這標誌着AI內容創作從靜態向動態敘事的重大進步。