阿里最新推出的基於音頻驅動的肖像視頻生成框架EMO,可以根據輸入音頻生成任意持續時間的視頻。該框架由阿里巴巴智能計算研究院團隊開發,是一種富有表現力的視頻生成技術。EMO與之前的AI視頻生成方法相比有較大提升,但也存在耗時較長的缺點。團隊成員包括薄列峯等人,他們在論文中詳細介紹了EMO的技術路線和特性。這一新技術爲AI領域帶來了新的突破,讓人們對未來的發展充滿期待。
相關推薦
千問全面接入阿里生態:點外賣、買機票一句話搞定,開啓“AI 辦事”時代
阿里千問App全面接入淘寶、支付寶等核心業務,上線超400項AI辦事功能,支持全球用戶通過一句話指令完成點外賣、購物等操作,實現AI交互新突破。
Jan 15, 2026
163.0k
阿里 Qoder 升級補全功能,AI 代碼採納率大幅提升65%
阿里Qoder升級爲Qoder NEXT,智能補全功能大幅提升。它能主動感知代碼庫和編輯歷史,分析上下文後精準推斷後續聯動變更,爲開發者提供高效智能的編程建議。
Jan 7, 2026
159.2k
阿里千問APP公測,與ChatGPT展開全面競爭
阿里巴巴11月17日推出“千問”APP公測版,基於開源模型Qwen3,免費結合生活場景生態,與ChatGPT競爭。管理層視其爲AI時代關鍵戰役,已上線應用商店及網頁、PC版,國際版即將發佈。
Nov 17, 2025
438.5k
通義千問宣佈正式推出 Qwen Chat Memory 功能
阿里通義千問推出Qwen Chat Memory功能,實現“長記憶”能力。它能主動保留用戶偏好、習慣及過往對話內容,在多輪交流中關聯回憶,提供更連續、個性化的自然交互體驗。
Oct 16, 2025
157.4k
阿里發佈新一代Agentic Coding編程平臺Qoder
阿里發佈Qoder編程平臺,具備強大上下文工程和編程智能體能力,集成頂尖編程模型,可檢索10萬代碼文件,極大提升開發效率。AI自主研發功能將數天開發縮短至十分鐘,有望徹底改變軟件開發模式。
Aug 22, 2025
340.1k
