超越 RAG，DRAG 技術顯著提升大模型的準確性

在人工智能領域，尤其是大語言模型（LLM）的應用中，準確性一直是一個備受關注的話題。爲了提升 LLM 在回答複雜問題時的表現，檢索增強生成(RAG)技術應運而生。這項技術允許模型在回答問題之前，先從知識庫中檢索相關信息，從而生成更加準確和有根據的答案。然而，RAG 技術也存在一些不足，尤其是在處理人類語言的多樣性方面。爲了解決這些問題，Lexical Diversity-aware RAG(DRAG)應運而生。

DRAG 技術針對 RAG 的短板，尤其是在檢索和生成階段，通過細緻的分析和靈活的校準來提升準確性。在檢索階段，DRAG 通過 “多樣性感知相關性分析器”（DRA），將問題拆分爲三類組件:不變組件、變體組件和補充組件。DRA 會根據不同組件的特性設定相關性評估標準，從而篩選出與問題核心內容更相關的文檔。

在生成階段，DRAG 引入了 “風險引導稀疏校準策略”（RSC），以降低無關信息對模型生成答案的影響。RSC 通過評估每個詞的風險，特別關注那些可能受到噪聲影響的高風險詞，並進行有針對性的校準，從而提高最終生成結果的質量。

通過這兩大創新，DRAG 技術在處理複雜問題時的準確性大幅提升，實際測試表明，使用 DRAG 的模型準確率比傳統 RAG 提升了45.5%。這一進展標誌着人工智能在理解和生成自然語言方面又邁出了重要一步，尤其在面對多樣化的語言表達時，DRAG 展現出了更強的能力。

隨着 DRAG 技術的不斷髮展，未來的人工智能模型有望在更多應用場景中提供更加精準和可靠的答案。

劃重點:
📝 DRAG 技術通過細分問題組件，提升檢索準確性。
🔍 DRA 分析器和 RSC 校準策略共同降低無關信息干擾。
🚀 使用 DRAG 後，模型準確率提高了45.5%。

惡意開發者利用Claude編寫惡意包:超670個受污染npm包威脅開源生態安全

近期，一名惡意開發者利用Anthropic的AI模型Claude協助編寫惡意代碼，向npm倉庫推送超670個含惡意腳本的軟件包，大規模污染包管理器生態。該事件暴露了大語言模型被用於自動化開發惡意軟件的風險，引發網絡安全行業高度警惕。

連自己名字都拼不對?谷歌AI搜索屢屢“翻車”引發用戶集體卸載

谷歌近期升級其“AI概覽”搜索功能，試圖將傳統搜索引擎轉變爲對話式引擎，但遭遇重大挫敗。用戶測試發現，該AI系統頻繁出現低級拼寫錯誤，如誤判“poop”中字母“r”的數量，將“journalism”拼錯爲“journadism”，甚至無法正確拼寫母公司名稱“Google”。這些錯誤暴露了AI在基礎文字處理上的短板，引發廣泛質疑。

圖靈測試塵埃落定：GPT-4. 5 勝率超真人，AI學會了完美撒謊

英國數學家圖靈1950年提出的圖靈測試設想，在76年後由加州大學聖地亞哥分校研究團隊在《美國國家科學院院刊》發表論文證實。認知科學家卡梅倫·瓊斯和本·伯根教授通過嚴格的經典三方圖靈測試，首次提供確鑿實證數據，標誌着計算機科學史上的里程碑時刻。

阿里雲百鍊重磅升級：全棧開放接入，打造模型“超級市場”

阿里雲在5月20日峯會上宣佈，其大模型服務平臺“百鍊”強化開放生態，接入多家第三方頂尖模型，覆蓋文本、圖像、視頻及多模態生成等領域。此舉標誌着百鍊從阿里自研“千問”模型的展示臺，轉型爲涵蓋全行業主流模型的“AI模型超級市場”，首批接入的模型矩陣豐富多元。

超越 RAG，DRAG 技術顯著提升大模型的準確性

相關推薦

惡意開發者利用Claude編寫惡意包:超670個受污染npm包威脅開源生態安全

連自己名字都拼不對?谷歌AI搜索屢屢“翻車”引發用戶集體卸載

網絡快餐還是精神斷糧？AI生成文章已全面碾壓人類創作

圖靈測試塵埃落定：GPT-4. 5 勝率超真人，AI學會了完美撒謊

阿里雲百鍊重磅升級：全棧開放接入，打造模型“超級市場”

​超越 RAG，DRAG 技術顯著提升大模型的準確性

相關推薦

惡意開發者利用Claude編寫惡意包:超670個受污染npm包威脅開源生態安全

連自己名字都拼不對?谷歌AI搜索屢屢“翻車”引發用戶集體卸載

網絡快餐還是精神斷糧？AI生成文章已全面碾壓人類創作

圖靈測試塵埃落定：GPT-4. 5 勝率超真人，AI學會了完美撒謊

阿里雲百鍊重磅升級：全棧開放接入，打造模型“超級市場”

超越 RAG，DRAG 技術顯著提升大模型的準確性