Google 旗下的 Gemini3Deep Think 今日迎來重磅升級。這款主打深度推理的模型不僅在編程領域展現出“世界冠軍級”實力,更在科學研究和硬核工程領域刷新了多項目標,標誌着 AI 推理能力進入全新維度。

Gemini3Deep Think 的核心戰績:
編程封神:在算法競賽平臺 Codeforces 上刷出了 3455Elo 的驚人高分。這意味着它已躋身人類頂級行列,全球目前僅有7名人類選手能擊敗它。作爲對比,一年前最強的 o3模型得分僅爲2727。
科研“最強大腦”:該模型展現出極強的邏輯嚴密性,曾發現一篇高深物理數學論文中連人類同行評審都遺漏的細微漏洞。此外,它還成功證明了“Erdős 猜想”中的多個難題。
從草圖到實物:在工程領域,它可以直接將一張手繪草圖分析並渲染成高保真的3D 模型文件(如筆記本支架),使物理零部件的建模效率提升了10倍。
基準測試全線突破:在“人類最後考試”(HLE)中拿下了48.4% 的成績,並在 ARC-AGI-2基準上以84.6% 的高準確率遙遙領先。
目前,Google 已向 AI Ultra 訂閱用戶開放了新版體驗,並首次通過 API 向部分研究人員和企業開放。此次 Gemini 的史詩級進化,被視爲對競爭對手推理模型的有力回擊。
