阿里最新推出的基於音頻驅動的肖像視頻生成框架EMO,可以根據輸入音頻生成任意持續時間的視頻。該框架由阿里巴巴智能計算研究院團隊開發,是一種富有表現力的視頻生成技術。EMO與之前的AI視頻生成方法相比有較大提升,但也存在耗時較長的缺點。團隊成員包括薄列峯等人,他們在論文中詳細介紹了EMO的技術路線和特性。這一新技術爲AI領域帶來了新的突破,讓人們對未來的發展充滿期待。
相關推薦
阿里ATH事業羣HappyHorse模型登頂AI視頻榜,Elo積分力壓Seedance2.0
國產多模態模型“HappyHorse-1.0”在文本轉視頻評測中以1332分登頂,領先字節跳動模型近60分。其海外社交賬號首位關注者爲阿里巴巴,暗示其研發背景。
Apr 10, 2026
222.9k
千問 3.6 正式發佈:100 萬長上下文,硬剛 Claude Code
阿里發佈新一代大語言模型Qwen3.6-Plus,被譽爲當前最強國產編程模型。相比3.5版本性能顯著提升,在多項編程評測中位居國產首位,整體能力接近國際標杆Claude系列。該模型在前端開發、複雜倉庫任務等方面展現出高度自主化能力。
Apr 3, 2026
722.4k
告別AI標準臉!阿里Wan2.7-Image發佈:能寫A4紙論文,還能像素級“捏臉”
阿里發佈Wan2.7-Image模型,突破傳統AI生圖侷限,告別“標準臉”實現“千人千面”。模型強化虛擬角色捏臉功能,支持從骨相、眼眸到五官細節的全方位定製,精準控制臉型、眼型等特徵,提升視覺效果與個性化體驗。
Apr 1, 2026
238.0k
打車只需“一句話”!阿里千問上線 AI 辦事:本地生活流量迎來大洗牌
阿里旗下千問AI助手推出“AI打車”功能,用戶通過自然語言對話即可完成叫車和行程規劃。此舉不僅是技術升級,更是阿里以AI原生服務重塑本地生活流量入口的關鍵佈局,展現其向“全能助理”進化的戰略加速。
Mar 23, 2026
227.6k
阿里 CEO 吳泳銘親自掛帥!“悟空”事業部立項:AI 轉型下半場的生死突圍
阿里成立ATH事業羣,由CEO親自掛帥,整合通義實驗室、MaaS、千問、AI創新及悟空事業部,旨在應對AI行業“模型過剩、場景飢渴”現狀,從“卷參數”轉向“卷應用”,發力下半場競爭。
Mar 19, 2026
196.7k
