谷歌組建新團隊，致力於構建能夠模擬物理世界的 AI 技術

谷歌近日宣佈，將成立一支新團隊，專注於開發能夠模擬物理世界的人工智能（AI）模型。該團隊由曾在 OpenAI 擔任視頻生成模型 Sora 的共同負責人 Tim Brooks 領導。Brooks 在社交平臺 X 上表示，這個新團隊將歸屬於谷歌的 AI 研究實驗室 Google DeepMind。

Brooks 在其公告中提到:“DeepMind 的計劃雄心勃勃，目標是開發大規模的生成模型來模擬世界。” 他還表示，團隊將致力於與谷歌的 Gemini、Veo 和 Genie 團隊合作，解決 “關鍵新問題”，並將模型規模擴展到最高計算能力。Gemini 是谷歌旗艦級 AI 模型系列，主要用於圖像分析和文本生成，而 Veo 則是谷歌自主的視頻生成模型。至於 Genie，這是谷歌的世界模型嘗試，能夠實時模擬遊戲和3D 環境。

據 Brooks 所述，該團隊將開發 “實時互動生成” 工具，並研究如何將他們的模型與現有的多模態模型如 Gemini 進行整合。工作描述中提到:“我們相信，基於視頻和多模態數據的 AI 訓練規模化是實現人工通用智能（AGI）的關鍵路徑。”AGI 是指能夠完成任何人類能完成的任務的人工智能。

許多初創公司和大型科技企業也在追尋世界模型的開發，例如由著名 AI 研究員 Fei-Fei Lee 主導的 World Labs、以色列初創企業 Decart 和 Odyssey 等。這些公司認爲，未來世界模型可以用於創造互動媒體，如視頻遊戲和電影，以及運行像訓練機器人這樣的真實模擬。

然而，創意領域對這項技術持有不同的看法。最近一項《連線》雜誌的調查顯示，遊戲開發公司如動視暴雪正在利用 AI 來節省成本、提高生產效率，但這也導致大量員工被裁。根據2024年動畫工會的一項研究，預計到2026年，美國電影、電視和動畫行業將有超過10萬個工作崗位受到 AI 的影響。

儘管如此，一些新興的世界建模初創企業如 Odyssey 承諾將與創意專業人士合作，而不是取代他們。這是否會成爲谷歌的做法，仍有待觀察。此外，關於版權的問題也尚未得到解決。部分世界模型的訓練可能使用了未經授權的視頻遊戲實況片段，導致相關公司面臨訴訟風險。

谷歌聲稱其在 YouTube 上訓練模型是依據平臺的服務條款獲得了許可，但尚未透露具體使用了哪些視頻。

谷歌組建新團隊，致力於構建能夠模擬物理世界的 AI 技術

相關推薦

谷歌Gemini月活突破9.5億大關，逼近ChatGPT十億用戶里程碑

Monday.com 裁員 630 人，聚焦人工智能戰略

OpenAI 擬投資 200 億美元在美新建超大規模數據中心

Claude 長出“經濟觸角”：一句話就能問出 AI 正在改寫哪些飯碗

AI終於變成印鈔機：Alphabet二季度營收漲24%，Gemini月活衝到9. 5 億