谷歌近日宣佈,將成立一支新團隊,專注於開發能夠模擬物理世界的人工智能(AI)模型。該團隊由曾在 OpenAI 擔任視頻生成模型 Sora 的共同負責人 Tim Brooks 領導。Brooks 在社交平臺 X 上表示,這個新團隊將歸屬於谷歌的 AI 研究實驗室 Google DeepMind。

Brooks 在其公告中提到:“DeepMind 的計劃雄心勃勃,目標是開發大規模的生成模型來模擬世界。” 他還表示,團隊將致力於與谷歌的 Gemini、Veo 和 Genie 團隊合作,解決 “關鍵新問題”,並將模型規模擴展到最高計算能力。Gemini 是谷歌旗艦級 AI 模型系列,主要用於圖像分析和文本生成,而 Veo 則是谷歌自主的視頻生成模型。至於 Genie,這是谷歌的世界模型嘗試,能夠實時模擬遊戲和3D 環境。

image.png

據 Brooks 所述,該團隊將開發 “實時互動生成” 工具,並研究如何將他們的模型與現有的多模態模型如 Gemini 進行整合。工作描述中提到:“我們相信,基於視頻和多模態數據的 AI 訓練規模化是實現人工通用智能(AGI)的關鍵路徑。”AGI 是指能夠完成任何人類能完成的任務的人工智能。

許多初創公司和大型科技企業也在追尋世界模型的開發,例如由著名 AI 研究員 Fei-Fei Lee 主導的 World Labs、以色列初創企業 Decart 和 Odyssey 等。這些公司認爲,未來世界模型可以用於創造互動媒體,如視頻遊戲和電影,以及運行像訓練機器人這樣的真實模擬。

然而,創意領域對這項技術持有不同的看法。最近一項《連線》雜誌的調查顯示,遊戲開發公司如動視暴雪正在利用 AI 來節省成本、提高生產效率,但這也導致大量員工被裁。根據2024年動畫工會的一項研究,預計到2026年,美國電影、電視和動畫行業將有超過10萬個工作崗位受到 AI 的影響。

儘管如此,一些新興的世界建模初創企業如 Odyssey 承諾將與創意專業人士合作,而不是取代他們。這是否會成爲谷歌的做法,仍有待觀察。此外,關於版權的問題也尚未得到解決。部分世界模型的訓練可能使用了未經授權的視頻遊戲實況片段,導致相關公司面臨訴訟風險。

谷歌聲稱其在 YouTube 上訓練模型是依據平臺的服務條款獲得了許可,但尚未透露具體使用了哪些視頻。