階躍星辰公司宣佈,其開源的原生語音推理模型 Step-Audio-R1.1在全球知名的人工智能模型評測榜單上獲得了第一名的佳績。這一榜單由 Artificial Analysis Speech Reasoning 發佈,專注於評估語音模型在音頻處理和邏輯推理方面的能力,涵蓋了準確率、響應時間等多個維度。

image.png


Step-Audio-R1.1以96.4% 的準確率超越了諸如 Grok、Gemini、GPT-Realtime 等一線閉源模型,刷新了歷史最好成績。在性能和速度的綜合評估中,Step-Audio-R1.1展現了強大的實力,成爲業界關注的焦點。

這款模型具有深度語音推理能力和實時響應功能,能夠在沒有額外延遲的情況下,端到端理解語音內容,具備 “像人類一樣聽到對話即思考” 的特點。其最新版本不僅提升了實時對話能力,還增強了複雜語音推理能力,完整的實時語音 API 計劃於明年2月上線。目前,用戶可以通過開放的聊天模式體驗到 R1.1的核心功能,支持邊想邊說的流式推理。

在發佈會上,階躍星辰展示了模型在實際應用中的能力,例如分析貓咪的爭鬥聲音和理解韓語歌詞。這些案例展示了 Step-Audio-R1.1的分析能力和語音理解水平,進一步證明了其在複雜語音環境中的出色表現。

目前,Step-Audio-R1.1的權重已上傳至 HuggingFace,開發者和研究人員可以免費下載和使用。同時,用戶也可以前往階躍星辰開放平臺體驗中心進行試用。對於關注 AI 技術和語音模型的人士而言,這無疑是一個值得期待的機會。

huggingface:https://huggingface.co/stepfun-ai/Step-Audio-R1.1

劃重點:  

🌟 Step-Audio-R1.1在國際評測中以96.4% 準確率榮登全球第一!  

📈 該模型具備深度語音推理和實時響應能力,支持流式推理功能。  

💻 用戶可通過 HuggingFace 免費下載模型,並前往開放平臺體驗。