階躍星辰近日宣佈推出Step系列模型矩陣的新成員——Step-1o端到端語音大模型,據稱這是國內首個千億參數端到端語音大模型。這一新模型的發佈標誌着語音技術領域的一大進步,它通過端到端的語音方案,能夠實現語音理解和生成的一體化,從而提升模型智商和情商的上限,並實現超自然、高質量的交流體驗。

Step-1o模型支持語音和文本等混合形式的輸入和輸出,能夠快速反應並隨時打斷,提供便捷的互動體驗。它還能深度理解和模仿音色、韻律、方言、個性化的口語表達習慣等聲音特徵,帶來如同真人一般靈動、情緒豐富的表達效果。此外,Step-1o也是一款“聰明”的語音大模型,通過自學和模仿不斷提升回覆質量,擁有豐富的知識儲備,能提供專業建議和高情緒價值的陪伴。

微信截圖_20241216081425.png

Step-1o語音大模型的三大特色包括:情商在線,能夠理解人類複雜語義、語音語調背後的情緒信息,對社會倫理和規則有深刻認知;智商在線,能高質量回答各個專業領域的問題,擁有思辨能力;極強的理解、模仿和創造能力,能精準掌握聲音表達中的細節,並實時創作並講述光怪陸離的語音故事。

Step-1o的應用範圍廣泛,可以支持新聞播報、聊天陪伴、有聲讀物、在線教育、智能硬件、汽車等各行各業對語音交互技術的需求。

近期,Step-1o將接入躍問App端,提供實時語音通話服務,屆時用戶可以通過電話與Step-1o進行交流,享受其耐心傾聽和出謀劃策的服務。這一新功能的推出,將進一步拓展Step-1o的應用場景,爲用戶提供更加豐富的語音交互體驗。