谷歌在其最新發佈的 Chrome 149 瀏覽器中原生深度集成了 Gemini 3.5 Flash 模型,並推出了全新的“從屏幕選擇”(Select from screen)交互功能。

這一新功能賦予了用戶直接框選屏幕局部內容並與 AI 進行定向對話的能力。開發者和普通用戶無需再在不同的模型或複雜的工具間進行切換,大大提升了瀏覽網頁時的 AI 交互效率。

image.png

告別全局上傳,精準鎖定網頁局部信息

根據谷歌官方的更新公告,當用戶在 Chrome 瀏覽器中使用 Gemini 時,可以利用光標精準勾勒出想要提問的特定區域。被框選的圖片或文本片段會自動作爲附件,實時組合進用戶輸入的提示詞中。

這種操作邏輯非常類似於廣爲人知的 Google Lens(谷歌鏡頭),但其核心優勢在於不會跳轉到傳統的網頁搜索結果頁。相反,它會將選中的局部內容直接送入對話式 AI 架構中,讓智能體能夠針對細節給出更具針對性的解答。

賦能三大場景,端側體驗迎來全面革新

該功能的上線將爲用戶帶來直觀的體驗升級,例如在購物網站上框選幾雙鞋子,便能讓 AI 分析哪款更適合自己的運動風格。此外,用戶還可以框選複雜的圖表以獲取更清晰的解釋,或是選擇網頁的某個設計元素進行創意重塑。

與此同時,Gemini 3.5 Flash 模型還整合了原生計算機操作工具。這使得 AI 智能體在各類環境中,都能更流暢地執行訪問網站、填寫長表單、點擊按鈕和收集數據等跨平臺的複雜任務。