近日,騰訊科技(深圳)有限公司在天眼查 App 上公佈了一項關於大語言模型的訓練方法及相關設備的專利。這項專利的名稱爲 “大語言模型的訓練方法、裝置、計算機設備及存儲介質”,旨在通過創新的訓練方式,提升大語言模型的學習能力和準確性。
在大語言模型的訓練過程中,傳統方法往往依賴於單一的文本摘要,可能導致模型過擬合,生成內容的準確性和多樣性受到影響。然而,騰訊的新方法引入了兩種不同的信息來源 —— 第一摘要文本和第二摘要文本。這兩個摘要文本的信息量不同,且第一摘要文本中包含了正確與錯誤的語句,形成了對比學習的基礎。

這種對比學習方式使得模型可以在同一文本的不同摘要中進行學習,通過區分第一摘要文本中的正確與錯誤語句,有效地避免了因爲摘要單一而帶來的學習誤差。這種創新方法不僅提升了模型的泛化能力,使其在面對未知數據時能夠表現得更加出色,同時也增強了模型的準確性,減少了生成錯誤內容的概率。
隨着人工智能技術的不斷進步,大語言模型的應用範圍愈加廣泛,從自然語言處理到智能客服,再到內容創作等領域,均顯現出巨大的潛力。騰訊這一專利的公佈,標誌着在大語言模型訓練領域的又一次技術突破,有望爲未來的相關研究與應用提供新的方向。
可以預見,這項技術的進一步發展將推動智能化應用的持續進步,助力各行各業在數字化轉型中更好地利用人工智能帶來的便利。
