新神器LocAgent發佈，代碼定位準確率高達92.7%，程序員的福音！

程序員們又有新工具可以歡呼了!由 OpenHands、耶魯大學、南加州大學和斯坦福大學的研究團隊聯手推出的 LocAgent，正是一個專門爲代碼定位而設計的圖索引大語言模型（LLM）代理框架。令人振奮的是，LocAgent 的代碼定位準確率達到了92.7%，這一新高度將在2025年 ACL 會議上正式亮相。

程序員在工作中常常會遇到難以定位代碼問題的困擾。例如，在處理一個 bug 報告時，可能會陷入「這到底要改哪裏?」的迷茫。而傳統的代碼定位方法，通常要麼是粗糙的關鍵詞匹配，要麼是低效地將整個代碼庫交給 LLM 處理，甚至還有讓 Agent 盲目遍歷目錄的情況。實際上，自然語言中的問題描述與真實的代碼位置之間往往隔着多層複雜的調用關係。這種情況下，準確定位問題代碼顯得至關重要。

LocAgent 的創新之處在於其將整個代碼庫解析成一個包含文件、類和函數之間關係的圖。這一圖結構不僅能顯著提高代碼的檢索效率，還讓 LLM 能夠更好地在複雜的代碼庫中進行推理與搜索。該系統採用了分層稀疏索引，使得 LLM 在定位代碼時如同使用地圖般便捷，能夠快速接近目標。

LocAgent 還提供了一套簡單易用的工具接口，供 LLM Agent 查詢代碼圖結構，包括關鍵字搜索、信息提取和圖遍歷等功能。這些工具讓 Agent 能夠逐步推理，深入理解問題並鎖定需要修改的代碼位置。根據最新的實驗證明，LocAgent 在 SWE-Bench Lite 等數據集上表現出色，準確率遠超傳統方法。

LocAgent 以其卓越的性能和簡便的操作，爲程序員們解決了長久以來的代碼定位難題，極大地提升了開發效率。

惡意開發者利用Claude編寫惡意包:超670個受污染npm包威脅開源生態安全

近期，一名惡意開發者利用Anthropic的AI模型Claude協助編寫惡意代碼，向npm倉庫推送超670個含惡意腳本的軟件包，大規模污染包管理器生態。該事件暴露了大語言模型被用於自動化開發惡意軟件的風險，引發網絡安全行業高度警惕。

連自己名字都拼不對?谷歌AI搜索屢屢“翻車”引發用戶集體卸載

谷歌近期升級其“AI概覽”搜索功能，試圖將傳統搜索引擎轉變爲對話式引擎，但遭遇重大挫敗。用戶測試發現，該AI系統頻繁出現低級拼寫錯誤，如誤判“poop”中字母“r”的數量，將“journalism”拼錯爲“journadism”，甚至無法正確拼寫母公司名稱“Google”。這些錯誤暴露了AI在基礎文字處理上的短板，引發廣泛質疑。

圖靈測試塵埃落定：GPT-4. 5 勝率超真人，AI學會了完美撒謊

英國數學家圖靈1950年提出的圖靈測試設想，在76年後由加州大學聖地亞哥分校研究團隊在《美國國家科學院院刊》發表論文證實。認知科學家卡梅倫·瓊斯和本·伯根教授通過嚴格的經典三方圖靈測試，首次提供確鑿實證數據，標誌着計算機科學史上的里程碑時刻。

阿里雲百鍊重磅升級：全棧開放接入，打造模型“超級市場”

阿里雲在5月20日峯會上宣佈，其大模型服務平臺“百鍊”強化開放生態，接入多家第三方頂尖模型，覆蓋文本、圖像、視頻及多模態生成等領域。此舉標誌着百鍊從阿里自研“千問”模型的展示臺，轉型爲涵蓋全行業主流模型的“AI模型超級市場”，首批接入的模型矩陣豐富多元。

新神器LocAgent發佈，代碼定位準確率高達92.7%，程序員的福音！

相關推薦

惡意開發者利用Claude編寫惡意包:超670個受污染npm包威脅開源生態安全

連自己名字都拼不對?谷歌AI搜索屢屢“翻車”引發用戶集體卸載

網絡快餐還是精神斷糧？AI生成文章已全面碾壓人類創作

圖靈測試塵埃落定：GPT-4. 5 勝率超真人，AI學會了完美撒謊

阿里雲百鍊重磅升級：全棧開放接入，打造模型“超級市場”