最近,通義實驗室和北京大學的研究團隊推出了一項名爲 ZeroSearch 的創新框架,這一新技術可以在不需要真實搜索的情況下,激活大語言模型的檢索能力,並且訓練成本降低了驚人的88%。這一突破爲大語言模型的訓練和應用提供了全新的思路。
傳統的訓練方法通常依賴於真實的搜索引擎來獲取信息,這不僅造成了高昂的 API 調用成本,還可能因搜索結果的質量不穩定而影響模型的表現。ZeroSearch 巧妙地通過引入大語言模型作爲 “模擬搜索引擎”,利用其在預訓練過程中積累的豐富知識來生成檢索文檔,從而避免了真實搜索帶來的成本和噪聲干擾。

論文地址:https://arxiv.org/pdf/2505.04588
代碼地址:https://github.com/Alibaba-NLP/ZeroSearch
項目主頁:https://alibaba-nlp.github.io/ZeroSearch
Huggingface 主頁:https://huggingface.co/collections/sunhaonlp/zerosearch-v2-6827f4ee6b6265069d443d4e
該框架採用了一種結構化的訓練模板,使得模型在每次交互中都能有條理地思考並進行操作。這種方法不僅提升了模型的推理路徑清晰度,還使得最終答案的提取變得更加簡便。此外,ZeroSearch 還通過一種名爲 “模擬微調” 的策略來提升生成文檔的質量,確保輸出內容的實用性和可靠性。

在實驗中,ZeroSearch 的表現顯著優於依賴真實搜索引擎的傳統方法,展現出強大的泛化能力和穩定性。隨着模型參數量的增加,其性能還在不斷提升。這一研究不僅推動了大語言模型的技術進步,也爲未來的智能搜索和信息檢索應用打開了新的可能性。
綜上所述,ZeroSearch 爲大語言模型的訓練帶來了革命性的變化,憑藉其低成本和高效能,預示着智能信息檢索的未來。
