當地時間週一,谷歌正式在 iOS 平臺推出了主打全離線使用的語音聽寫應用 Google AI Edge Eloquent。這款應用不僅打破了對網絡環境的依賴,更憑藉大模型的潤色能力,直擊語音轉錄中“廢話多、不通順”的行業痛點。

image.png

核心亮點:離線運行,隱私與效率兼得

Eloquent 的核心競爭力在於其完全基於本地算力的處理機制:

  • 原生大模型驅動: 該應用基於谷歌輕量化模型 Gemma 構建,在完成對應的 ASR(自動語音識別)模型下載後,即可實現100% 離線工作。

  • 隱私護城河: 所有音頻處理均在本地設備完成,有效解決了商務會議、私人訪談等高敏感場景下的數據泄露隱憂。

image.png

特色功能:智能“去水”與文本潤色

不同於傳統的機械式聽寫,Eloquent 具備極強的理解能力:

  • 自動剔除語氣詞: 系統能精準識別並自動過濾掉“嗯、啊、那個”等無意義語氣助詞,輸出更爲精煉的文本。

  • 文本自動潤色: 在轉錄過程中提供實時潤色,使口語表達轉化爲更具邏輯性的書面語言。

  • 靈活處理模式: 用戶既可選擇極致隱私的本地處理,也可調用雲端 Gemini 模型進行更高質量的深度優化。

生產力工具:深度適配專業場景

爲了滿足專業用戶需求,谷歌在細節功能上進行了大量打磨:

  • 自定義詞彙: 支持導入特定行業術語或自定義詞彙,顯著提升生僻詞識別率。

  • 多格式轉換: 轉錄完成後支持多種文件格式導出,方便後續編輯與分享。

  • 智能檢索: 內置會話歷史管理系統,支持通過關鍵字快速定位歷史錄音內容。

行業觀察:端側 AI 正在接管“工具類”應用

Google AI Edge Eloquent 的發佈,標誌着谷歌正在加速將大模型能力下沉到端側硬件。雖然目前該應用僅上線了 iOS 平臺,但官方已明確表示後續將適配安卓系統。對於同類 AI 轉錄產品而言,谷歌憑藉模型底座與免費策略的入局,無疑將加速該賽道的洗牌。

結語:告別“後期整理”的煩惱

當 AI 能夠離線過濾廢話並自動潤色,語音聽寫將不再只是記錄工具,而是真正的生產力加速器。對於頻繁需要整理錄音的媒體人、學生和辦公族來說,這款“語氣詞殺手”或許將成爲手機裏的標配。