在人工智能語音領域,通用性與精準度的平衡一直是行業攻克的難點。 4 月 20 日,阿里通義實驗室宣佈正式推出語音識別大模型Fun-ASR1.5。這款模型憑藉統一的大模型架構,實現了在多語言、多方言以及複雜語境下的跨越式突破。
據瞭解,Fun-ASR1. 5 的“聽力”表現堪稱全能。它不僅能夠覆蓋全球 30 種主流語言,還深度適配了漢語的七大方言體系及 20 多種地方口音。更令行業關注的是,該模型在傳統文化領域的表現同樣亮眼,即便面對語調跌宕、斷句獨特的古詩詞吟誦,也能實現極高精度的實時轉寫。
目前,Fun-ASR1. 5 已正式上架阿里雲百鍊平臺。阿里通義實驗室表示,該模型將通過API服務的方式,爲教育、傳媒、金融、科技及文化等多個行業客戶提供高效的語音技術支撐,助力各產業實現智能化辦公與內容生產的升級。
