正文

Gemini2.5Computer Use:谷歌推出“看”懂網頁的 AI 代理模型

發布於AI新閒資訊

時間 :Oct 8, 2025

閱讀 :1分鐘

谷歌近日預覽了一款全新的 Gemini AI 模型——Gemini2.5Computer Use，旨在賦予 AI 代理通過瀏覽器導航和交互網頁的能力。這款模型利用其強大的“視覺理解和推理能力”，能夠像人類一樣分析用戶請求，並在原本爲人類而非機器人設計的界面內執行復雜操作，例如填寫和提交表單。

AI 代理的新前沿

Gemini2.5Computer Use 使得 AI 能夠執行過去需要人類干預的任務。它的主要應用場景包括 UI 測試，以及爲那些沒有 API 或直接連接的用戶導航網頁界面。該模型的早期版本曾用於 Mariner 項目——一個使用 AI 代理在瀏覽器中自行完成任務的研究原型，比如根據配料列表將商品添加到購物車。

這款新模型的發佈正值 AI 代理功能競爭白熱化之際。就在谷歌宣佈的前一天，OpenAI 在其開發者日上發佈了新的 ChatGPT 應用並持續關注其 Agent 功能，該功能可爲用戶完成複雜任務。同時，Anthropic 去年也發佈了一個帶有“計算機使用”功能的 Claude AI 模型版本。

性能與限制

谷歌聲稱，其 Gemini2.5Computer Use 模型“在多個網絡和移動基準測試中均優於領先的替代方案”。

然而，與 ChatGPT Agent 和 Anthropic 的類似工具不同，谷歌的新 AI 模型目前只能訪問瀏覽器環境，而不能控制整個計算機環境。谷歌指出，該模型“尚未針對桌面操作系統級別的控制進行優化”，當前支持 13種操作，包括打開網絡瀏覽器、輸入文本以及拖放元素。

如何體驗

開發者現在可以通過 Google AI Studio 和 Vertex AI 體驗 Gemini2.5Computer Use。

對於普通用戶和感興趣者，Browserbase 提供了一個演示，可以觀看該模型完成諸如“玩2048遊戲”或“瀏覽 Hacker News 以瞭解熱門辯論”等任務。

軟銀獨家合作Sierra，大模型智能客服正式進軍日本市場

軟銀集團7月14日宣佈，與美國AI初創公司Sierra達成戰略合作，併成爲其在日本獨家合作伙伴。雙方將聯合推出基於智能AI代理的新一代客服解決方案。軟銀旗下線上品牌Linemo已率先接入該技術，後續將推廣至軟銀、Y!mobile等核心品牌及其他業務線。

Jul 14, 2026

226.8k

AI初創公司Lyzr利用自主研發代理自主完成1億美元B輪融資

7月9日，成立三年的企業級AI代理公司Lyzr完成1億美元B輪融資，估值約5億。其自研AI系統SivaClaw獨立主導全程談判與核心流程，彭博社稱此爲AI代理在複雜商業資本運作中的突破。

Jul 10, 2026

218.2k

英偉達Vera CPU來了：專爲AI代理從零設計，速度快1. 5 倍，OpenAI和Anthropic都要用

Perplexity計劃採用英偉達全新CPU Vera，該芯片專爲AI代理時代從零設計，非傳統GPU延伸。它直擊英特爾、AMD等傳統CPU“筆記本時代的遺產”痛點，因AI代理需不間斷自主編寫代碼、執行任務並協調複雜工作流，傳統架構難以勝任這一持續運行場景。

Jul 8, 2026

211.7k

Cloudflare 出臺爬蟲管控新規，9 月 15 日起默認攔截 AI 訓練類爬蟲訪問廣告頁面

Cloudflare 7月1日更新爬蟲規則，標記搜索、AI代理、訓練等行爲，定於2026年9月15日起默認攔截AI類爬蟲訪問含廣告頁面。站長雖願被搜錄但需保護版權收益，而大量混合爬蟲難以區分。其管理器將識別爬蟲全部用途，任一被禁屬性即觸發攔截。

Jul 2, 2026

215.4k

隨時隨地調教AI智能體！最火編程神器Cursor正式推出移動端應用

AI編程工具Cursor在傳出被SpaceX收購後，隨即推出移動應用“Cursor Mobile”，使開發者能通過手機隨時隨地啓動與指導AI編碼代理。該應用契合其向獨立編碼代理的轉型，用戶既可新建代理，也可與桌面端正在運行的代理保持實時連接。

Jun 30, 2026

287.5k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご