當地時間4月6日(週一),谷歌在 iOS 平臺低調上線了一款名爲 “Google AI Edge Eloquent” 的實驗性語音輸入應用。該應用主打“離線優先”與“智能潤色”,旨在利用邊緣側 AI 技術,將自然的口語實時轉化爲專業、精煉的文本。此舉標誌着谷歌正式切入由 Wispr Flow 和 SuperWhisper 領跑的高端 AI 語音轉文字賽道。

核心技術與功能亮點:

Eloquent 搭載了谷歌最新發佈的 Gemma4 系列(E2B/E4B 規格)自動語音識別(ASR)模型。該模型支持完全離線運行,用戶在下載模型包後即可實現本地轉錄,有效保障隱私並降低延遲。應用具備強大的“智能去雜”功能,能自動識別並過濾“嗯”、“啊”等語氣詞及重複修正,輸出邏輯連貫的文本。

產品深度集成與交互:

  • 多模態風格轉換: 提供“要點”、“正式”、“簡短”和“完整”四種文本處理模式。

  • 雲端協同(可選): 開啓雲模式後,應用將調用雲端 Gemini 模型進行深層文本清理。

  • 個性化語境: 支持從 Gmail 導入用戶專屬的關鍵詞、人名及術語,並允許建立自定義詞彙表。

  • 生產力統計: 實時顯示聽寫字數、每分鐘字速(WPM)及歷史會話記錄。

市場策略與未來佈局:

目前該應用在 iOS App Store 免費提供,無訂閱費或使用限制,相比每年收費85美元的 SuperWhisper 等競品具有極強衝擊力。儘管首發於 iOS,但官方描述確認了 Android 版本的開發計劃,並預告將支持系統級鍵盤集成及類似 Wispr Flow 的懸浮按鈕功能。作爲 Google AI Edge 品牌下的重要成員,Eloquent 的發佈不僅是工具類應用的嘗試,更是谷歌展示 Gemma 模型在移動端部署能力的標杆案例。