2025 年 8 月 20 日,全球領先的 AI 語音技術公司 ElevenLabs 正式宣佈推出其最新的 Eleven v3 Alpha API,爲開發者提供了一個突破性的文本轉語音(Text-to-Speech, TTS)工具。
Eleven v3 Alpha API 被譽爲“地球上最具表現力的文本轉語音模型”,其核心優勢在於支持超過 70 種語言,能夠生成自然、流暢且富有情感的語音輸出。
該 API 引入了全新的對話模式(Dialogue Mode),允許開發者創建多角色對話場景,支持無限數量的虛擬角色,並能處理語氣變化、情感波動和對話中的自然中斷。這種功能使其特別適用於製作多角色互動的音頻內容,例如有聲書、互動遊戲敘述和多媒體項目。
此外,Eleven v3 Alpha API 還支持高級音頻標籤(Audio Tags)功能,開發者可以通過在腳本中插入如 [happy]、[whispering] 或 [sighs] 等標籤,精確控制語音的語氣、情感和節奏。這種技術突破使得 AI 語音不僅能“說話”,還能“表演”,爲用戶帶來更真實、更具沉浸感的聽覺體驗。例如,開發者可以輕鬆實現從戲劇性獨白到輕鬆幽默對話的動態語音生成。
