語音轉文字新標杆：ElevenLabs 奪冠，谷歌 Gemini 憑“全能”位居次席

Artificial Analysis 近日發佈了其語音轉文字（Speech-to-Text）基準測試的2.0版本(AA-WER v2.0)。測試結果顯示，ElevenLabs 與谷歌在音頻轉錄領域展現出極強的統治力。

在覈心的詞錯率（WER）指標上，ElevenLabs 推出的 Scribe v2 以 2.3% 的極低錯誤率位居榜首。緊隨其後的是谷歌的 Gemini3Pro，錯誤率爲 2.9%。值得注意的是，谷歌並未針對轉錄任務對 Gemini 進行專項訓練，這一優異表現完全得益於其強大的多模態通用能力。

其他主流模型表現如下:

Mistral Voxtral Small:以 3.0% 的錯誤率位列第三。
谷歌 Gemini3Flash:表現穩健，錯誤率爲 3.1%。
OpenAI Whisper Large v3:作爲最受歡迎的開源模型，此次以 4.2% 的錯誤率排在中游位置。
墊底陣營:阿里巴巴的 Qwen3ASR Flash（5.9%）、亞馬遜的 Nova2Omni（6.0%）以及 Rev AI（6.1%）在測試中排名靠後。

在專門針對語音助手指令的 AA-AgentTalk 測試中，排名格局依然穩定。ElevenLabs Scribe v2和 Google Gemini3Pro 分別以 1.6% 和 1.7% 的錯誤率遙遙領先，展現了在處理短促、直接的語音交互時的極高可靠性。

Anthropic 緊急叫停 Claude Agent SDK 計費變更，重度用戶暫續現有訂閱限額

Anthropic突然叫停原定6月15日實施的Claude Agent SDK計費調整。原計劃將外部SDK使用統一轉爲API費率，與網頁端及官方CLI界面區分，訂閱用戶僅獲月度等額抵扣。現決定暫緩執行，維持現有定價不變，開發者和重度用戶可繼續使用舊有模式。

徹底告別複雜操作！蘋果iPadOS27 全面進化讓平板秒變電腦

蘋果iPadOS 27系統迎來重大升級，聚焦生產力與日常效率提升。新系統在自動化、搜索及網頁瀏覽方面帶來顛覆性體驗，多任務處理更智能快捷，顯著拉近平板與電腦的距離。最大亮點是妙控鍵盤的自動化觸發功能，用戶可根據鍵盤連接狀態自定義操作，進一步優化工作流。

防止AI依賴風險升級:蘋果擬在Siri中加入“休息一下”提示機制

代碼泄露顯示，iOS27測試版中Siri將新增防護機制：若用戶連續對話達數小時，系統會彈出提示“您已與Siri對話[n]小時，請考慮休息一下”，並強調Siri並非真人但可隨時繼續。此舉表明蘋果正從系統層面主動干預長時間AI交互，引導用戶適度使用。

語音轉文字新標杆：ElevenLabs 奪冠，谷歌 Gemini 憑“全能”位居次席

相關推薦

OpenAI被曝正籌備發佈新一代雙向語音模型“GPT-Bidi-1”

Anthropic 緊急叫停 Claude Agent SDK 計費變更，重度用戶暫續現有訂閱限額

大廠也吃不消 AI 鉅額賬單！微軟智能體考慮換用幻方 DeepSeek

徹底告別複雜操作！蘋果iPadOS27 全面進化讓平板秒變電腦

防止AI依賴風險升級:蘋果擬在Siri中加入“休息一下”提示機制