延遲低於250毫秒！MiniMax Speech 2.6發佈，Fluent LoRA一鍵復刻任意音色，語音合成邁入實時交互時代

當AI語音不僅能“像人說話”，還能“像你說話”，且快到幾乎無感，語音交互的邊界正在被徹底重構。 10 月 30 日凌晨，MiniMax稀宇科技正式發佈其新一代語音合成模型——MiniMax Speech 2.6，以端到端延遲低於 250 毫秒的實時性能與革命性的Fluent LoRA音色復刻技術，將語音生成推向高自然度、低延遲、強個性化的全新階段。

250 毫秒以內：逼近人類對話的實時響應

在語音交互場景中，延遲是體驗的生命線。Speech 2. 6 通過底層架構優化，實現從文本輸入到音頻輸出全程低於 250 毫秒，接近人類自然對話的響應節奏。這意味着在智能客服、實時字幕、虛擬主播等高要求場景中，AI語音不再“慢半拍”，真正實現流暢對答與沉浸式交互。

Fluent LoRA： 30 秒音頻即可克隆專屬音色

本次最大突破在於Fluent LoRA（Low-Rank Adaptation）技術的深度集成。用戶僅需提供 30 秒以上的參考音頻，模型即可精準捕捉說話人的音色、語調、節奏甚至情感風格，並生成與目標文本高度匹配的自然語音。無論是復刻自己的聲音講述睡前故事，還是爲品牌定製專屬虛擬代言人，音色克隆從未如此簡單、高效且逼真。

更關鍵的是，Fluent LoRA在保證音色一致性的前提下，顯著提升語音流暢度，避免傳統TTS常見的“機械斷句”或“情感錯位”問題，讓合成語音真正具備“表達力”。

全場景覆蓋：從個人創作到企業級部署

MiniMax Speech 2. 6 同時面向個人創作者與企業客戶開放：

教育領域：教師可快速生成帶講解的課件音頻；
客戶服務：企業能部署具備品牌音色的智能語音機器人；
智能硬件：車載、家居設備可實現低延遲、高擬真語音交互；
內容生產：UP主、播客主一鍵生成多角色配音，大幅提升創作效率。

作爲MiniMax多模態大模型生態的關鍵一環，Speech 2. 6 不僅強化了其在AIGC領域的技術縱深，更標誌着語音合成正從“功能可用”邁向“情感可信、個性可定製”的新紀元。

在AI競爭日益聚焦“體驗細節”的今天，MiniMax用 250 毫秒的延遲與一句“像你一樣說話”的能力，證明了：真正的智能，不僅在於算得快，更在於說得像人、說得動人。

ElevenLabs CEO預言：AI語音模型將走向“商品化”，公司押注“模型+應用”雙輪驅動

在TechCrunch Disrupt2025大會上，ElevenLabs CEO馬蒂·斯塔尼斯澤夫斯基預測，AI語音模型將在未來兩三年內走向“商品化”。短期內模型性能仍是核心競爭力，但長期看，主流語言和通用音色的差異將縮小，企業需轉向產品、數據和生態構建以保持優勢。

Meta 收購 AI 語音初創公司 WaveForms，加碼音頻人工智能佈局

據《The Information》報道，Meta 已收購 AI 語音初創公司 WaveForms，交易金額未披露。這是 Meta 旗下新 AI 部門 Superintelligence Labs 的最新收購，也是該公司一個月內的第二筆 AI 音頻領域重要併購，上月 Meta 剛完成對 PlayAI 的收購。WaveForms 成立僅八個月，曾在由 Andreessen Horowitz 領投的融資中獲得4000萬美元，融資前估值達1.6億美元。據悉，WaveForms 兩位聯合創始人——前 Meta 與 OpenAI 研究員 Alexis Conneau 和前谷歌廣告策略師 Coralie Lemaitre——已加盟 Meta。Conneau 在 OpenAI 期間曾參與創建 GPT-4o Advanced Voice Mo

百川智能聯合創始人焦可、陳煒鵬相繼離職，投身AI創業熱潮

近日，據界面報道，AI獨角獸百川智能聯合創始人焦可已正式離職，而另一位聯合創始人陳煒鵬也將離開，目前仍在辦理內部離職手續。這一消息引發業內廣泛關注。據知情人士透露，焦可已開啓AI語音領域的創業項目，並積極尋求融資支持。陳煒鵬雖未完成離職流程，但已開始籌備AI Coding方向的創業計劃，並與部分投資人展開接觸。截至發稿，雙方暫未做出迴應。百川智能由前搜狗CEO王小川於2023年創立，焦可與陳煒鵬作爲早期核心成員，爲公司發展奠定了重要基礎。此次兩位聯合創始人

語音AI的顛覆者！PlayAI：用聲音重塑數字交互的邊界

從一個簡單的Chrome擴展，到如今估值超2000萬美元的AI語音帝國，PlayAI正用聲音技術重新定義人機交互的想象邊界。創始人Hammad Syed和Mahmoud Felfel用代碼和算法編織出一個充滿可能性的聲音世界。這不僅僅是一家語音技術公司，更是一個能將文字瞬間轉化爲栩栩如生聲音的魔法工廠。PlayAI的核心魅力在於其驚人的聲音克隆和生成能力。想象一下，只需幾分鐘，你就能擁有一個完全屬於自己的AI聲音助理，能以任何你想要的語調和風格講述故事。PlayNote等產品更是將AI語音推向令人驚歎的極致。它