西湖大學的 AI 科學家 DeepScientist，科研效率大幅提升

近日，西湖大學推出了一款名爲 DeepScientist 的 AI 科學家，這一系統在短短兩週內完成了人類科學家三年的科研成果。DeepScientist 不僅自主產生了超過5000個科學想法，並對其中的1100個進行了驗證，還在三個前沿 AI 任務中成功打破了人類的最新紀錄，展示了其強大的科研能力。

在 AI 科研的歷史上，雖然許多工具和系統已經相繼問世，但它們大多隻是輔助性工具，無法獨立完成科研工作。早期的 AI 系統如 PaperBench 和 Agent Laboratory，主要幫助科學家復現論文或解決特定的機器學習問題，而 AlphaTensor 則通過大量試錯來優化代碼性能。然而，這些工具往往無法質疑現有的科研範式。

隨着技術的進步，一些全自動的 AI 科學家系統如 AI Scientist 相繼出現，它們證明了 AI 能夠完成完整的研究循環，並發現新的科學成果，但仍缺乏明確的科學目標和方向。相比之下，DeepScientist 則以其閉環、迭代的流程，展現了探索的目標性和洞察力。該系統首先分析現有的研究方法，識別其短板，然後提出新穎且具有科學意義的想法。

DeepScientist 的工作流程被設計成一個三階段的循環:首先是生成新想法的階段，在這一階段，系統會從龐大的記憶庫中提取信息，併爲新想法打分;接下來，系統會使用 “上置信界” 算法來決定驗證哪一個想法，選擇得分最高的想法進行實驗;最後，在成功驗證的基礎上，系統會撰寫詳細的研究報告，形成閉環。

在具體任務上，DeepScientist 選取了三個前沿 AI 研究方向，包括代理失敗歸因、LLM 推理加速和 AI 文本檢測。在這三個任務中，DeepScientist 分別提出了 A2P、ACRA 和 PA-Detect 等新方法，不僅超越了現有的 SOTA（State Of The Art）記錄，還展示了其出色的自主學習和創新能力。

這一突破性的研究成果，標誌着 AI 科學家在科研領域的潛力得到了進一步驗證，未來可能會在更廣泛的科學探索中發揮重要作用。

項目:https://github.com/ResearAI/DeepScientist

劃重點:
- 🚀 DeepScientist 在兩週內完成了人類科學家三年的科研量，展示出強大的科研能力。
- 💡 該系統通過閉環、迭代的流程，能夠自主生成並驗證科學想法，形成完整的研究閉環。
- 🧠 DeepScientist 在多個前沿任務中成功打破了人類最新科研紀錄，展現出 AI 在科研領域的巨大潛力。

西湖大學的 AI 科學家 DeepScientist，科研效率大幅提升

相關推薦

拉響教育警報！美國教師聯合會呼籲：禁止 AI 系統和 iPad 硬件進入小學課堂

AI員工上崗電站！螞蟻數科推出電力交易與新能源運營智能體

OpenAI 舉行“AI上崗”發佈會，推出六大行業工作流插件

谷歌發佈Gemma 4，E2B架構讓手機本地跑AI現質變

累計擬投OpenAI超600億:軟孫正義憑1000億美元身家重回亞洲首富