正文

谷歌DeepMind計劃整合Gemini與Veo，打造智能全能助手

發布於AI新閒資訊

時間 :Apr 13, 2025

閱讀 :1分鐘

在人工智能領域不斷創新的谷歌，近日宣佈了一項激動人心的計劃。谷歌 DeepMind 的首席執行官 Demis Hassabis 在播客節目 Possible 中透露，公司將把其 Gemini AI 模型與 Veo 視頻生成模型進行整合。這一舉措旨在提升 Gemini 對物理世界的理解能力，助力開發出一個真正能夠在現實生活中爲用戶提供幫助的通用數字助手。

Hassabis 指出，從一開始，Gemini 模型就被設計爲一個多模態系統，能夠處理多種類型的數據和信息。他表示:“我們的願景是構建一個能夠整合各種媒體形式的助手，這樣它才能更好地理解和與世界互動。” 目前，Gemini 模型已經能夠生成圖像、文本和音頻，展示出強大的多模態能力。

值得注意的是，整個 AI 行業正在向 “全能” 模型發展，許多公司都在探索類似的方向。例如，OpenAI 的 ChatGPT 不僅可以處理文本對話，還能生成藝術風格的圖像。此外，亞馬遜也計劃推出一款全新的 “任意到任意” 的模型，旨在實現更高水平的多模態功能。

Hassabis 透露，Veo 模型的訓練數據主要來自谷歌旗下的 YouTube 平臺。通過分析大量 YouTube 視頻，Veo 能夠有效學習世界的物理規律。他指出:“Veo2通過觀看大量的視頻，能夠更好地理解現實世界的運作方式。” 這表明，Veo 在訓練過程中所使用的數據不僅豐富，而且具有實際應用價值。

谷歌在去年已擴大了其服務條款，以便獲取更多的 YouTube 內容用於 AI 模型訓練，確保模型的多樣性和準確性。這樣的數據獲取策略無疑將爲 Gemini 和 Veo 的結合提供堅實的基礎，使得即將推出的智能助手能夠更全面、更深刻地理解和響應用戶的需求。

隨着技術的不斷進步，谷歌的這一計劃預示着 AI 助手將不再侷限於單一任務，而是能夠在多個領域提供實用的支持，爲用戶的生活帶來更多的便利。

騰訊雲李鬱韜談世界盃直播：AI 首次大規模走進生產，雲廠商卡位多模態 Harness

騰訊雲支撐美加墨世界盃17國直播，覆蓋亞太及國內多數授權平臺。AI首次大規模介入直播生產，畫質增強、智能導播、自動剪輯、橫轉豎等環節全自動完成，標誌着AIGC邁入大規模應用階段。

Jul 27, 2026

190.1k

谷歌旗艦模型Gemini 3.5 Pro難產延期，人才流失與軍方合作引發內部士氣危機

谷歌DeepMind因員工士氣低迷推遲發佈Gemini 3.5 Pro，模型已落後原計劃數月。近期推出的小模型市場反應褒貶不一，遭Meta AI負責人汪滔公開嘲諷。團隊正經歷嚴重人才流失，軍方合約被指加劇離心，Gemini聯合負責人諾姆·沙澤爾亦被曝離職。

Jul 24, 2026

164.9k

三星 Galaxy 新設備深度整合 Gemini AI，開啓智能新時代

三星在Unpacked發佈會上推出新一代Galaxy設備，包括摺疊手機、智能手錶及智能眼鏡，重點在於與谷歌Gemini AI深度整合。新款Z Flip 8允許長按電源鍵喚出Gemini助手，通過原生集成提升智能體驗與操作效率。

Jul 23, 2026

177.1k

谷歌 Chrome 安卓版重構底部欄:新增 Gemini 專屬按鈕並支持多標籤頁 AI 分析

谷歌在Chrome 150安卓版測試全新底部導航欄，首次嵌入Gemini AI專屬按鈕。新版AI突破單頁摘要限制，可跨多個打開標籤頁交叉比對、總結內容，將桌面側邊欄深度檢索體驗完整移植至手機，標誌着移動瀏覽器AI交互迎來結構性升級。

Jul 15, 2026

264.2k

歐盟出手“破冰”!ChatGPT 攜 GPT-5.5強勢重返歐洲 WhatsApp

OpenAI的ChatGPT經歷半年封禁後，得益於歐盟委員會強力干預，於2026年7月13日重返歐洲WhatsApp，但僅限歐洲經濟區（27個歐盟國及列支敦士登、冰島、挪威）。用戶免註冊，直接撥打官方電話1-800-CHATGPT，即可體驗多模態對話。

Jul 15, 2026

211.7k

智啟未來，您的人工智能解決方案智庫