在2025年Google I/O開發者大會上,谷歌展示了其AI與XR技術的最新成果,覆蓋創作工具、開發者平臺和用戶體驗三大核心領域。新一代視頻生成器Veo3、圖像生成器Imagen4、全新XR平臺Android XR以及頂配AI訂閱服務“AI Ultra”成爲發佈會焦點。

作爲AI創作工具的重磅升級,Veo3可生成原生音軌視頻,區別於OpenAI Sora等當前不支持音頻的產品,現已面向美國Ultra訂閱用戶及Vertex AI企業客戶開放。Imagen4則提供更佳排版與圖像細節,並支持多格式輸出。兩者均已集成至Gemini應用、Workspace、Whisk及全新AI電影製作平臺Flow中。

QQ20250521-090033.png

Flow集合場景生成、鏡頭控制、素材管理等功能,允許用戶混合AI與原創內容,打造完整電影級內容流程。與此同時,谷歌還開放音樂生成模型Lyria,通過YouTube Shorts和Vertex AI面向音樂創作者提供AI創作能力。

爲滿足高階創作者和企業需求,谷歌推出月費249.99美元的AI Ultra訂閱,提供Veo3、Imagen4、Project Mariner代理工具、YouTube Premium、30TB雲存儲等頂級服務。另有Pro版作爲次級選擇。

Gemini Live即將登陸Gemini應用,支持通過攝像頭和屏幕共享實時協作,適用於故障排查與活動策劃。Gemini功能也已嵌入Chrome,實現網頁內容分析與摘要。

在通信方面,Google Meet將新增模仿語氣與表情的AI翻譯功能,初期支持英語與西班牙語,僅向Pro和Ultra用戶開放。Gmail也將引入基於用戶歷史郵件數據的個性化智能回覆,需用戶授權啓用。

開發者方面,Gemini API新增異步函數、原生音頻、工具上下文協議(MCP)等高級功能。新模型如Gemma3n(輕量級移動模型)、**MedGemma(醫療應用)和SignGemma(手語識別)**進一步拓展谷歌的AI模型版圖。

爲加強AI內容可信度,谷歌還推出SynthID Detector門戶,通過隱形水印識別圖像、文本、音頻和視頻的AI生成來源,已有超百億項目使用該標記系統。

最後,谷歌宣佈推出全新AR/MR平臺Android XR,爲未來XR設備(包括AR眼鏡與頭顯)提供操作系統支持。結合Gemini智能,設備將支持實時翻譯、環境分析、消息處理等功能。谷歌已與Gentle Monster、Warby Parker等品牌展開合作,並將在年內推出SDK。

本次發佈會表明,Google正將AI能力深度融入產品、內容創作與終端平臺,全面進軍AI原生生態建設。