騰訊發佈大語言模型訓練新專利，提升模型泛化與準確性

近日，騰訊科技（深圳）有限公司在天眼查 App 上公佈了一項關於大語言模型的訓練方法及相關設備的專利。這項專利的名稱爲 “大語言模型的訓練方法、裝置、計算機設備及存儲介質”，旨在通過創新的訓練方式，提升大語言模型的學習能力和準確性。

在大語言模型的訓練過程中，傳統方法往往依賴於單一的文本摘要，可能導致模型過擬合，生成內容的準確性和多樣性受到影響。然而，騰訊的新方法引入了兩種不同的信息來源 —— 第一摘要文本和第二摘要文本。這兩個摘要文本的信息量不同，且第一摘要文本中包含了正確與錯誤的語句，形成了對比學習的基礎。

這種對比學習方式使得模型可以在同一文本的不同摘要中進行學習，通過區分第一摘要文本中的正確與錯誤語句，有效地避免了因爲摘要單一而帶來的學習誤差。這種創新方法不僅提升了模型的泛化能力，使其在面對未知數據時能夠表現得更加出色，同時也增強了模型的準確性，減少了生成錯誤內容的概率。

隨着人工智能技術的不斷進步，大語言模型的應用範圍愈加廣泛，從自然語言處理到智能客服，再到內容創作等領域，均顯現出巨大的潛力。騰訊這一專利的公佈，標誌着在大語言模型訓練領域的又一次技術突破，有望爲未來的相關研究與應用提供新的方向。

可以預見，這項技術的進一步發展將推動智能化應用的持續進步，助力各行各業在數字化轉型中更好地利用人工智能帶來的便利。

騰訊混元"合二爲一"：多模態與大語言模型部門合併，姚順雨統管衝全模態上限

據7月24日報道，騰訊於7月23日宣佈將混元多模態模型部門與大語言模型部門合併，組建基礎模型部，由首席AI科學家姚順雨統率。此舉旨在提升研發與協同效率，全力衝刺全模態模型的智能上限。整合早有伏筆，去年12月姚順雨已接管大語言模型團隊，如今雙邊歸一，意味着騰訊集中資源推動多模態與語言深度融合，加速構建新一代統一基礎模型，向全模態智能更高峯邁進。

Epoch AI測試三大AI文本檢測器:模仿人類文風后最高近三成內容漏檢

Epoch AI研究顯示，主流AI文本檢測器能近乎完美識別普通AI生成內容，但當大語言模型刻意模仿特定作者寫作風格時，準確率明顯下降，科學寫作最難辨別。實驗測試了Pangram、GPTZero和Originality.ai三款工具，採用495篇涵蓋博客、小說、科學的人類原創文本（均創作於ChatGPT問世前），發現風格模仿可有效逃逸檢測。

騰訊發佈大語言模型訓練新專利，提升模型泛化與準確性

相關推薦

騰訊混元"合二爲一"：多模態與大語言模型部門合併，姚順雨統管衝全模態上限

Epoch AI測試三大AI文本檢測器:模仿人類文風后最高近三成內容漏檢

OpenAI人才流動：前研究員田永龍入職騰訊，深耕視覺語言模型研發

以 AI 治理 AI：Reddit 升級自動化系統，日均攔截 2300 萬條垃圾信息

Anthropic發佈重磅大模型Claude Sonnet 5：性能直逼旗艦，價格卻大跳水