正文

通義千問推出全新語音識別模型 Qwen3-ASR-Flash，革新語音轉文字技術

發布於AI新閒資訊

時間 :Sep 9, 2025

閱讀 :1分鐘

近日，在全球語音識別技術日益發展的背景下，通義千問今日正式推出其最新語音識別模型 ——Qwen3-ASR-Flash。該模型基於 Qwen3基座模型，經過海量多模態數據及數千萬小時的自動語音識別（ASR）數據訓練而成，旨在爲用戶提供高精度、高魯棒性的語音識別解決方案。

Qwen3-ASR-Flash 的核心特性包括領先的識別準確率和驚豔的歌聲識別能力。模型在多箇中英文及多語種的基準測試中表現出色，尤其是在支持歌唱識別方面，實測錯誤率低於8%。這意味着無論是清唱還是伴隨背景音樂的整歌，Qwen3-ASR-Flash 都能夠有效地識別並轉錄。

另一個顯著特點是其定製化識別能力。用戶可以以任意格式提供文本上下文，模型能夠智能識別並匹配命名實體和關鍵術語，從而輸出個性化的識別結果。這一功能的實現使得 Qwen3-ASR-Flash 在處理複雜語境時更具靈活性和適應性。

此外，Qwen3-ASR-Flash 支持多達11種語言及多種方言和口音，能夠實現精準轉錄。其語種支持包括普通話及主要方言（如四川話、粵語等）、英式和美式英語，甚至包括法語、德語、俄語、意大利語、西班牙語、日語、韓語和阿拉伯語等多種語言。這爲用戶提供了更爲廣泛的選擇，滿足了不同地域和語言使用者的需求。

Qwen3-ASR-Flash 還具備強大的魯棒性，能夠在長難句、句中語言切換和複雜聲學環境中保持高準確率，有效過濾非語音片段，如靜音和背景噪聲，確保用戶獲得最佳的語音識別體驗。

爲了讓用戶能夠體驗到 Qwen3-ASR-Flash 的強大功能，通義千問在多個平臺上提供了體驗方式，包括 ModelScope、HuggingFace 和阿里雲百鍊 API 等，用戶可以便捷地試用該模型。

未來，通義千問表示，Qwen3-ASR-Flash 將持續迭代升級，不斷提高識別準確率，並開發更多功能，致力於爲用戶提供更智能、更高效的語音轉文字服務。通過這項技術創新，通義千問希望在語音識別領域開創更廣闊的未來。

通義千問重磅升級：實時語音識別模型 Fun-ASR-Realtime 正式發佈

通義千問推出實時語音識別模型Fun-ASR-Realtime，首字延遲降至百毫秒級，實現“即說即反饋”的流暢交互。其識別準確度接近離線模型，在保證高精度同時突破實時性瓶頸，標誌語音交互體驗邁向新高度。

Jul 6, 2026

216.4k

豆包、通義千問雙雙下線"AI擬人化"功能： 7 月 15 日新規落地，行業集體收縮

《人工智能擬人化互動服務管理暫行辦法》7月15日生效，字節跳動“豆包”與阿里“通義千問”率先響應，即將下線自定義擬人化代理功能。豆包已通知用戶，該功能自7月15日起下線，10月15日起徹底停用相關服務，成爲新規下首批調整的頭部AI應用。

Jul 6, 2026

368.2k

通義千問上線足球預測AI助手連紅牌和絕殺都能算準?

2026年美加墨世界盃開幕當天，阿里通義千問App上線足球預測AI助手，精準預測墨西哥2:0勝南非及紅牌趨勢，併成功預判韓國2:1絕殺逆轉捷克，被網友稱爲AI版“章魚哥”。該助手基於海量大數據訓練，除歷史戰績和球員數據外，還引入舉辦地因素，展現高精度預測能力。

Jun 12, 2026

504.0k

壓軸題全押錯？AI軍團折戟 2026 高考作文，教育部發聲反炒作

2026年高考語文作文題聚焦科技前沿：北京卷微寫作探討“人工智能與幸福晚年”，上海卷則圍繞“科技改造世界與人類想象力變化”展開哲學思辨。國內頂尖AI模型DeepSeek、通義千問和豆包同臺迴應，凸顯科技與人文融合的時代命題。

Jun 8, 2026

278.2k

通義千問升級“拍照問健康”:能圈圖、懂推理，三甲醫生實測認可

阿里旗下通義千問APP於2026年5月27日升級“拍照問健康”功能，突破傳統OCR限制，實現醫學圖像理解與臨牀推理。新功能包括視覺圈選，可自動標記化驗單或患處異常區域；以及聯動推理，結合年齡、性別和多指標關聯進行排除法分析，提升診斷準確性。

May 27, 2026

264.2k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご