正文

谷歌發佈首款離線 AI 聽寫應用 Eloquent：手機秒變專業速錄員

aibase

發布於AI新閒資訊

時間 :Apr 7, 2026

閱讀 :1分鐘

當地時間週一，谷歌正式在 iOS 平臺推出了主打全離線使用的語音聽寫應用 Google AI Edge Eloquent。這款應用不僅打破了對網絡環境的依賴，更憑藉大模型的潤色能力，直擊語音轉錄中“廢話多、不通順”的行業痛點。

核心亮點:離線運行，隱私與效率兼得

Eloquent 的核心競爭力在於其完全基於本地算力的處理機制:

原生大模型驅動: 該應用基於谷歌輕量化模型 Gemma 構建，在完成對應的 ASR（自動語音識別）模型下載後，即可實現100% 離線工作。
隱私護城河: 所有音頻處理均在本地設備完成，有效解決了商務會議、私人訪談等高敏感場景下的數據泄露隱憂。

特色功能:智能“去水”與文本潤色

不同於傳統的機械式聽寫，Eloquent 具備極強的理解能力:

自動剔除語氣詞: 系統能精準識別並自動過濾掉“嗯、啊、那個”等無意義語氣助詞，輸出更爲精煉的文本。
文本自動潤色: 在轉錄過程中提供實時潤色，使口語表達轉化爲更具邏輯性的書面語言。
靈活處理模式: 用戶既可選擇極致隱私的本地處理，也可調用雲端 Gemini 模型進行更高質量的深度優化。

生產力工具:深度適配專業場景

爲了滿足專業用戶需求，谷歌在細節功能上進行了大量打磨:

自定義詞彙: 支持導入特定行業術語或自定義詞彙，顯著提升生僻詞識別率。
多格式轉換: 轉錄完成後支持多種文件格式導出，方便後續編輯與分享。
智能檢索: 內置會話歷史管理系統，支持通過關鍵字快速定位歷史錄音內容。

行業觀察:端側 AI 正在接管“工具類”應用

Google AI Edge Eloquent 的發佈，標誌着谷歌正在加速將大模型能力下沉到端側硬件。雖然目前該應用僅上線了 iOS 平臺，但官方已明確表示後續將適配安卓系統。對於同類 AI 轉錄產品而言，谷歌憑藉模型底座與免費策略的入局，無疑將加速該賽道的洗牌。

結語:告別“後期整理”的煩惱

當 AI 能夠離線過濾廢話並自動潤色，語音聽寫將不再只是記錄工具，而是真正的生產力加速器。對於頻繁需要整理錄音的媒體人、學生和辦公族來說，這款“語氣詞殺手”或許將成爲手機裏的標配。

相關推薦

三星計劃投資 Mistral AI，力求打破美國科技巨頭的壟斷

三星正洽談向法國AI初創Mistral投資約10億歐元，助其打造與美國科技巨頭抗衡的主流AI。此輪融資後Mistral估值將達約200億歐元。三星此前已通過風投部門投資，反映了當前行業重大趨勢。

OpenRouter把語音轉錄塞進同一個API：一份key搞定聊天和轉寫，Whisper與按token計價STT一併接入

OpenRouter上線音頻轉寫端點，統一API密鑰。開發者只需發送Base64音頻，即可直接獲取轉錄文本，無需再額外集成Whisper或第三方SDK，徹底消除聊天與轉寫間的割裂感。

太空數據砸進AI！馬斯克掏出SpaceX家底， 2 萬億參數Grok大模型即刻煉成

馬斯克宣佈將SpaceX自2002年積累的製造工藝、材料科學及星鏈硬件設計等海量工程數據，用於訓練下一代Grok大模型，以打造更強AI。受出口管制限制，火箭發動機、制導控制等國防敏感技術已被嚴格剔除，確保合規。此舉展現了其跨界整合尖端資源的能力。

真假視頻一鑑便知！英偉達推出SVD檢測服務，識別AI造假準確率高達92%

英偉達推出合成視頻檢測服務SVD，應對AI深度僞造挑戰。該服務集成於推理微服務平臺，逐幀切割視頻爲裁剪幀，利用視覺模型分析空間特徵並打分，精準識別AI生成內容。

Substack 接入 Pangram 檢測工具，上線網頁與移動端 AI 文本識別功能

Substack推出AI內容檢測功能，由Pangram技術支持，覆蓋文章、筆記、回覆等全場景，幫助讀者辨別人類與AI生成內容。該功能已登陸網頁端和iOS，安卓版近期上線。

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2026AIBase