Google DeepMind 今日展示了其在生成式 AI 速度領域的突破性成果:Gemini3.1Flash-Lite。該模型憑藉極高的推理效率,能夠實現幾乎“實時”的網頁渲染,將 AI 從簡單的文本交互推向了動態 UI 構建的前沿。
性能飛躍與成本權衡
根據官方數據,Gemini3.1Flash-Lite 的首次響應速度較前代 Gemini2.5Flash 提升了 2.5倍。其吞吐量驚人,每秒可產出超過 360個 Token。在第三方機構 Artificial Analysis 的多模態任務測試中,該輕量化模型的表現甚至超越瞭如 Claude Opus4.6等體量更大的競爭對手。

然而,速度的提升也伴隨着價格的調整。目前該模型的輸出成本已從每百萬 Token0.40美元上升至 1.50美元,反映了高性能低延遲技術背後的算力溢價。

“僞瀏覽器”演示與應用場景
谷歌同步推出了一個基於該模型的“僞瀏覽器”演示應用。用戶只需輸入描述性指令,系統便能在毫秒間直接生成並渲染出對應的網頁內容。雖然目前的演示在處理複雜邏輯時仍存在不穩定性(內容可能隨時間變得混亂),但其在以下領域展現了巨大潛力:
快速原型設計:瞬間可視化 UI 模型與創意。
動態交互界面:根據用戶實時意圖調整網頁結構。
低延遲多模態任務:在需要極速反饋的場景中替代重型模型。
目前,Gemini3.1Flash-Lite 已正式上線 Google AI Studio 及 Vertex AI 平臺,用戶可前往體驗這一極速生成的魅力。
