谷歌再次改寫大模型性能與成本的邊界。今日,公司正式發佈新一代輕量級模型 Gemini3Flash——不僅響應速度達到前代三倍、近乎“零延遲”,更在多項高難度基準測試中反超同代旗艦Gemini3Pro,成爲史上首個在同期對比中“小弟幹翻大哥”的Flash模型。更令人意外的是,這一頂尖性能版本全球免費開放,默認集成於Gemini App、AI Studio、Google Antigravity及CLI工具中。
Gemini3Flash的突破性表現堪稱“降維打擊”:
- 在代碼修復權威榜單 SWE-bench 上,以78% 的得分小幅領先Gemini3Pro(76.2%);
- 在博士級推理測試 GPQA Diamond 中拿下90.4% 的高分;
- 在極難綜合評估 Humanity’s Last Exam(無工具模式)中取得33.7% 的成績,顯著優於前代旗艦Gemini2.5Pro;
- 在LMArena文本能力排名中躍居全球第三。

這一性能奇蹟源於谷歌對模型架構的深度優化:在保持極低推理成本的同時,通過知識蒸餾、推理路徑壓縮與多模態對齊等技術,使小模型具備接近大模型的邏輯深度。用戶上傳一張圖像或視頻,Flash可在數秒內解析內容並生成可執行計劃——從識別電路故障到規劃旅行路線,響應快如閃電。
爲適配不同場景,新版Gemini App推出三種交互模式:
- 極速模式:默認啓用Gemini3Flash,適合日常問答;
- 思考模式:激活Flash的深度推理鏈,處理複雜邏輯問題;
- 專業模式:保留Gemini3Pro,專注高難度數學與編程任務。
這意味着,普通用戶無需付費,即可享受過去僅限高端訂閱的智能體驗。你在Google搜索中提出的複雜問題,背後已是融合頂級推理能力的AI引擎在驅動。

市場數據印證了這一策略的成功:Gemini App月活用戶在短短一個季度內從4.5億飆升至6.5億,開發者超1300萬,API調用量同比激增3倍。隨着Flash的加入,Gemini3產品線已形成清晰梯隊——Deep Think(深度推理)、Pro(專業攻堅)、Flash(普惠極速)——全面覆蓋從大衆用戶到科研開發者的全譜系需求。
當免費模型開始超越付費旗艦,AI的競爭已不再只是參數規模的比拼,而是效率、體驗與普惠性的綜合較量。谷歌用Gemini3Flash宣告:下一代AI,既要聰明,更要快、要省、要人人可用。
