正文

英偉達發佈 PersonaPlex-7B-v1:重塑實時語音交互的“全雙工”黑科技

發布於AI新閒資訊

時間 :Jan 19, 2026

閱讀 :1分鐘

英偉達研究團隊近日正式發佈了名爲 PersonaPlex-7B-v1 的全雙工語音對語音對話模型。這款模型徹底打破了傳統 AI 語音助手“聽一句、回一句”的呆板模式，旨在實現更接近真人的自然對話體驗。

與過去需要通過 ASR（語音轉文本）、LLM(大語言模型)、TTS(文本轉語音)多個環節串聯的架構不同，PersonaPlex採用了一個單一的 Transformer 架構，直接完成語音理解與生成的全過程。AIbase 瞭解到，這種“端到端”的設計極大降低了響應延遲，並賦予了 AI 處理自然中斷、語音重疊以及即時反饋的能力。簡單來說，就像真人聊天一樣，AI 在說話的同時也在持續傾聽，即便用戶突然打斷，它也能迅速做出反應。

此外，該模型在個性化控制方面表現卓越。通過“語音+文本”的雙重引導，用戶不僅能定義 AI 的角色背景，還能精確控制其音色和語調。AIbase 獲悉，英偉達在訓練中結合了海量真實通話數據與合成場景，使模型既具備自然的語言習慣，又能嚴格遵守特定行業的業務規則。目前的評估結果顯示，PersonaPlex-7B-v1在對話流暢度和任務達成率上均優於多數開源及閉源系統。

研究:https://research.nvidia.com/labs/adlr/personaplex/

劃重點:

🎙️ 全雙工交互: PersonaPlex-7B-v1支持實時語音流處理，允許用戶在 AI 說話時隨時插話或重疊對話，實現極速響應。
🧠 單模型架構: 捨棄了繁瑣的插件式管道，採用單一Transformer結構同步預測文本和語音標記，從底層提升對話自然度。
🎭 深度個性化: 支持高達200token 的系統提示詞及特定的語音嵌入，可靈活定製 AI 的角色性格、業務知識及情感音色。

智己汽車發佈會定檔！超級智能體即將亮相，揭示未來出行新趨勢

智己汽車將於3月18日晚7點發布基於阿里千問大模型的“超級智能體”，主題爲“IM Ultra Agent 跨時代而來”。該智能體由30多個協同工作的智能體組成，可獨立完成方案選型、需求分發等多項任務。

Mar 13, 2026

233.3k

百度搜索 Skill 登頂 ClawHub：下載量突破 3.6 萬次，位居全球第一

百度搜索Skill在OpenClaw平臺下載量超3.6萬次，成爲全球最受歡迎的搜索引擎插件，入選官方精選推薦。其核心優勢在於深度集成AI技術，實現全網實時信息檢索，覆蓋權威內容且時效性強，爲生成式AI提供有力支持。

Mar 13, 2026

299.7k

美團王興:物理世界數字化是AI底座，已上線AI搜索產品“問小團”

美團CEO王興在內部溝通會上指出，AI變革將遠超互聯網時代，不僅提升生產力，還將重塑組織與工作模式。他強調企業必須積極擁抱AI，鼓勵創新，以應對這一根本性技術浪潮。

Mar 13, 2026

209.8k

技術優化仍需打磨:Meta 宣佈 Llama4發佈計劃推遲至5月

Meta推遲Llama4發佈至5月，因技術挑戰影響性能優化。該模型是Meta AI戰略關鍵，延期或影響其與OpenAI等競爭。

Mar 13, 2026

184.5k

美團 CEO 王興：AI Agent 對我的衝擊比 ChatGPT 衝擊更大

美團CEO王興在2026年3月13日管理層溝通會上表示，人工智能（AI）的變革將遠超互聯網影響。他將移動互聯網與傳統互聯網比作“玫瑰與芍藥”，而將AI與互聯網的關係比作“猴與花”，強調AI在量級和影響力上更具優勢。王興認爲，面對AI浪潮，企業和個人應積極擁抱變化，並指出AI Agent對他本人產生了衝擊。

Mar 13, 2026

237.0k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

英偉達發佈 PersonaPlex-7B-v1:重塑實時語音交互的“全雙工”黑科技

相關推薦

智己汽車發佈會定檔！超級智能體即將亮相，揭示未來出行新趨勢

​百度搜索 Skill 登頂 ClawHub：下載量突破 3.6 萬次，位居全球第一

美團王興:物理世界數字化是AI底座，已上線AI搜索產品“問小團”

​技術優化仍需打磨:Meta 宣佈 Llama4發佈計劃推遲至5月

​美團 CEO 王興：AI Agent 對我的衝擊比 ChatGPT 衝擊更大

百度搜索 Skill 登頂 ClawHub：下載量突破 3.6 萬次，位居全球第一

技術優化仍需打磨:Meta 宣佈 Llama4發佈計劃推遲至5月

美團 CEO 王興：AI Agent 對我的衝擊比 ChatGPT 衝擊更大