Character AI 與耶魯大學攜手推出 Ovi，實現音畫完美同步視頻生成

近日，Character AI 與耶魯大學的研究團隊聯合推出了一款名爲 Ovi 的新型音畫同步視頻生成技術。這一開源項目標誌着音頻和視頻生成技術的一次重大突破，打破了以往音畫生成的傳統方式。

Ovi 採用了一種創新的雙骨幹交叉模態融合架構，將音頻和視頻視爲一個不可分割的整體。在這個系統中，音頻和視頻的處理過程是並行的，彼此之間進行深度交流，從而實現了音畫的完美同步。這一設計理念徹底改變了以往先生成畫面再添加聲音或反之的做法，解決了音畫不同步的問題。

在 Ovi 的架構中，有兩個功能相同的分支，分別負責處理視頻和音頻。這兩個分支採用了相同的擴散變換器架構，使得音頻與視頻在生成過程中能夠直接互動，消除了不必要的參數和計算開銷。這種實時的信息交互使得 Ovi 能夠精準地學習音頻和視頻之間的對應關係，例如嘴脣運動與發音之間的精確匹配。

爲了確保音頻和視頻在時間上的精確對齊，Ovi 引入了一種名爲旋轉位置嵌入的技術。通過數學縮放，音頻和視頻的時間步點實現了完美匹配，確保了在生成過程中二者能夠同步出現。此外，Ovi 在處理用戶輸入時，也使用了統一的文本提示策略，以提高生成效果的準確性和豐富性。

在數據集的構建上，Ovi 團隊設計了複雜的處理流程，確保了訓練數據的多樣性和高質量。他們利用音視頻對的數據集和純音頻數據集相結合的方式，爲模型提供了全面的學習基礎。這種嚴謹的訓練方案爲 Ovi 的成功奠定了堅實的基礎。

github:https://github.com/character-ai/Ovi

劃重點:
🌟 Ovi 是 Character AI 與耶魯大學聯合開發的一款開源音畫同步視頻生成技術。
🎥 採用雙骨幹交叉模態融合架構，實現音頻與視頻的實時互動和完美同步。
📊 團隊構建了高質量、多樣化的數據集，以支持 Ovi 的訓練和應用。

Character AI 申請撤銷訴訟，稱其受第一修正案保護

近期，AI 聊天機器人平臺 Character AI 因一起涉及青少年自殺的案件而陷入法律困境。該平臺向佛羅里達中區地方法院提交了一份撤訴動議，聲稱依據第一修正案，他們不應對相關訴訟承擔責任。圖源備註：圖片由AI生成，圖片授權服務商Midjourney案件的起因是梅根・加西亞（Megan Garcia）在10月份對 Character AI 提起的訴訟。加西亞的兒子，14歲的斯圖爾・塞茨爾三世(Sewell Setzer III)，在使用 Character AI 的聊天機器人 “達尼”(Dany)後，形成了強烈的情感依賴，最終導致了悲劇的發生。加西亞表示，兒

聊天機器人平臺 Character AI 以第一修正案爲由申請駁回與青少年自殺案的訴訟

Character AI，一家允許用戶與 AI 聊天機器人進行角色扮演的平臺，近日在佛羅里達州中區美國地方法院申請駁回由一名青少年家長提起的訴訟。該家長 Megan Garcia 指控 Character AI 的技術對她14歲的兒子 Sewell Setzer III 造成了傷害，稱其在與名爲 “Dany” 的聊天機器人交流時，逐漸與現實世界隔絕，並最終導致自殺。在 Setzer 去世後，Character AI 表示將推出一系列安全功能，以提升對違反服務條款的聊天內容的檢測和干預能力。然而，Garcia 希望平臺能夠實施更嚴格的限制，例如禁止聊天機器人講述

Character AI 與耶魯大學攜手推出 Ovi，實現音畫完美同步視頻生成

相關推薦

加州率先立法監管AI聊天機器人：保護未成年人，最高罰款25萬美元

Character AI 申請撤銷訴訟，稱其受第一修正案保護

聊天機器人平臺 Character AI 以第一修正案爲由申請駁回與青少年自殺案的訴訟

飛利浦如何在 7 萬名員工中推廣 AI 素養

OpenAI 首次推出 ChatGPT 羣聊功能，將在韓國與新西蘭率先試點