谷歌發佈Gemini2.5Pro預覽版:編碼性能擊敗DeepSeek R1和Grok 3 Beta

谷歌近日推出了其最新的 Gemini2.5Pro 預覽版，這款被譽爲 “最智能” 模型的產品，首次在3月份宣佈，隨後在5月份進行了升級。此次發佈的預覽版旨在爲企業提供一個測試新應用程序或替換早期版本的機會。根據谷歌的官方博客，這一新版本在迴應速度和創意上表現更佳，同時在編碼和推理能力上超越了其他模型。

在5月份的 I/O 開發者大會上，谷歌透露，Gemini2.5Pro 的升級使其性能有了顯著提高。谷歌 DeepMind 首席執行官德米斯・哈薩比斯（Demis Hassabis）表示，I/O 版是該公司迄今爲止最好的編碼模型。然而，此次的 Gemini2.5Pro Preview06-05Thinking 比 I/O 版更爲出色，已準備好滿足企業級應用的需求。

新版本的 Gemini2.5Pro 在性能測試中表現優異，相較於早期版本，LMArena 測試分數提高了24分，WebDevArena 則提升了35分，當前在排行榜上名列前茅。谷歌的基準測試顯示，該模型在編碼能力上超過了 OpenAI 的 o3、o3-mini、o4-mini，Anthropic 的 Claude4Opus，以及 xAI 的 Grok3Beta 和 DeepSeek R1等競爭對手。

谷歌在其博客中指出，他們已根據前期版本的反饋，改進了 Gemini2.5Pro 的風格和結構，使其在迴應上更具創意且格式更加規範。儘管谷歌在不斷改進 Gemini2.5Pro，但這對許多用戶來說可能會造成一定困惑。新版本的定價爲每百萬個 tokens $1.25（不含輸入緩存），輸出價格爲 $10。

自3月份 Gemini2.5Pro 首次發佈以來，這款模型已被廣泛集成到許多新應用和服務中，包括 “Deep Think”，該功能使 Gemini 在迴應前可以考慮多個假設。在 Gemini2.5Pro 及其兩次升級版本發佈後，谷歌重新在大型語言模型市場上佔據了一席之地，此前的市場注意力更多地集中在 DeepSeek 和 OpenAI 等競爭對手的推理模型上。

在更新發布的短短几小時內，開發者們已經開始探索這一新版本。雖然許多人認爲更新確實如谷歌所承諾的那樣更快，但關於 Gemini2.5Pro 的實際性能提升尚需進一步驗證。

劃重點:
🌟 谷歌推出了新的 Gemini2.5Pro 預覽版，聲稱在編碼性能上超越了主要競爭對手。
🚀 新版本在多個性能測試中得分大幅提升，特別是在 LMArena 和 WebDevArena 中表現突出。
💰 定價信息爲每百萬 tokens $1.25，輸出價格爲 $10，企業可以在 Google AI Studio 和 Vertex AI 平臺上使用該模型。

谷歌發佈Gemini2.5Pro預覽版:編碼性能擊敗DeepSeek R1和Grok 3 Beta

相關推薦

NVIDIA 發佈 Nemotron 3 Embed 系列，8B 版本登頂 RTEB 檢索基準

銀河通用機器人創始人王鶴： 2028 年，具身智能的 “ChatGPT 時刻” 即將來臨！

超低延遲 AI 對話神器！Wan-Streamer v0.2 讓你與 AI 零距離溝通

文遠知行推出物理 AI 大模型 WITT

百度沈抖：每位員工每月發 1000 元額度自由體驗主流大模型，強制推行AI辦公難見效

​谷歌發佈Gemini2.5Pro預覽版:編碼性能擊敗DeepSeek R1和Grok 3 Beta

相關推薦

NVIDIA 發佈 Nemotron 3 Embed 系列，8B 版本登頂 RTEB 檢索基準

銀河通用機器人創始人王鶴： 2028 年，具身智能的 “ChatGPT 時刻” 即將來臨！

超低延遲 AI 對話神器！Wan-Streamer v0.2 讓你與 AI 零距離溝通

文遠知行推出物理 AI 大模型 WITT

百度沈抖：每位員工每月發 1000 元額度自由體驗主流大模型，強制推行AI辦公難見效

谷歌發佈Gemini2.5Pro預覽版:編碼性能擊敗DeepSeek R1和Grok 3 Beta