正文

騰訊AI Lab首創並行思維框架，讓大模型解鎖全新推理方式！

發布於AI新閒資訊

時間 :Sep 18, 2025

閱讀 :1分鐘

隨着 AI 技術的不斷進步，如何讓大模型具備 “並行思維” 能力，成爲了研究者們關注的熱點話題。最近，騰訊 AI Lab 聯合多所高校的研究團隊推出了一個名爲 Parallel-R1的全新強化學習（RL）框架，旨在教會大模型如何同時探索多條推理路徑。這一創新的框架爲應對複雜的數學推理任務開闢了新思路。

傳統的方法往往依賴於監督微調（SFT），這種方式不僅對數據質量要求極高，而且模型通常只會模仿已有的數據，缺乏自主學習和泛化能力。爲了解決這些問題，Parallel-R1框架應運而生。研究團隊的關鍵發現是，利用簡單的提示，可以讓模型在處理簡單數學題時生成高質量的並行思維數據。隨後，通過一套 “漸進式課程” 的訓練模式，模型先從簡單任務開始學習並行思維的 “語法格式”，再逐步過渡到更復雜的數學問題中進行強化學習。

此外，團隊還針對獎勵設計的問題提出了一種交替式獎勵策略，巧妙地平衡了 “解題準確率” 和 “思維多樣性”。在訓練過程中，模型大部分時間以 “準確率獎勵” 爲主，而少部分時間則給予並行思維使用的額外獎勵。這種策略顯著提高了模型的並行思維使用率，最終在多個數學基準測試中取得了顯著提升。

實驗結果顯示，Parallel-R1框架不僅使模型在多個數學基準上提升了高達8.4% 的平均準確率，在 AIME25測試中更是實現了42.9% 的性能飛躍。研究者們發現，經過訓練，模型的思維策略會逐漸從初期的 “廣撒網” 式探索，轉變爲後期的 “精準驗證”，充分展現了並行思維帶來的優勢。

Parallel-R1的成功不僅爲大模型的推理能力開闢了新方向，也爲今後的 AI 研究提供了新的思路，顯示了並行思維在解決複雜任務中的潛力。

百度推出小度 AI 眼鏡 Pro，2299 元、支持多種智能功能

小度AI眼鏡Pro上市，售價2299元，提供波士頓和貓眼兩款設計，可選墨鏡或光致變色鏡片，支持配近視鏡片，無需夾片。重39克，採用鈦合金轉軸和可調節鼻託，確保舒適佩戴。搭載索尼1200萬像素鏡頭，支持4K照片拍攝和1440p/30fps視頻錄製。

Nov 10, 2025

147.9k

印度財富管理新秀計劃招募新畢業生，人工智能助力行業轉型

印度財富管理市場蓬勃發展，但面臨私人銀行家短缺。新興公司Dezerv通過招募應屆畢業生，培訓他們成爲能運用AI技術的財富顧問，以應對人才缺口。此舉凸顯AI在傳統行業的潛力及市場對高素質人才的需求。

Nov 10, 2025

117.9k

Step-Audio-EditX 發佈:30億參數音頻 LLM 打開語音“可編輯時代”

StepFun AI發佈開源項目Step-Audio-EditX，基於30億參數音頻語言模型，將語音編輯轉化爲類似文本標記的可控操作，突破傳統波形處理模式。該技術有望實現"像編輯文本一樣編輯語音"的直觀交互，相關論文已發佈於arXiv平臺（編號2511.03601）。

Nov 10, 2025

88.0k

5000萬美元種子輪融資！斯坦福教授創立Inception，用“擴散式大模型”挑戰GPT-5，代碼生成速度超1000 token/秒

斯坦福教授Stefano Ermon創立的AI初創公司Inception完成5000萬美元種子輪融資，獲Menlo Ventures領投，微軟、英偉達等巨頭跟投，吳恩達等AI大咖天使投資。公司以顛覆性架構突破當前自迴歸模型競爭格局，引發行業關注。

Nov 10, 2025

124.6k

Inception 重返 AI 賽道，50百萬美元融資助推新模型崛起

AI初創公司Inception獲5000萬美元融資，由Menlo Ventures領投，微軟、英偉達等參投。創始人Mustafa Suleyman曾將公司售予微軟後專注寫作，現公司重點轉向擴散模型（dLLMs），與傳統自迴歸大語言模型形成技術差異。

Nov 10, 2025

75.8k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

騰訊AI Lab首創並行思維框架，讓大模型解鎖全新推理方式！

相關推薦

​百度推出小度 AI 眼鏡 Pro，2299 元、支持多種智能功能

印度財富管理新秀計劃招募新畢業生，人工智能助力行業轉型

Step-Audio-EditX 發佈:30億參數音頻 LLM 打開語音“可編輯時代”

5000萬美元種子輪融資！斯坦福教授創立Inception，用“擴散式大模型”挑戰GPT-5，代碼生成速度超1000 token/秒

Inception 重返 AI 賽道，50百萬美元融資助推新模型崛起

百度推出小度 AI 眼鏡 Pro，2299 元、支持多種智能功能