近日,西湖大學推出了一款名爲 DeepScientist 的 AI 科學家,這一系統在短短兩週內完成了人類科學家三年的科研成果。DeepScientist 不僅自主產生了超過5000個科學想法,並對其中的1100個進行了驗證,還在三個前沿 AI 任務中成功打破了人類的最新紀錄,展示了其強大的科研能力。

在 AI 科研的歷史上,雖然許多工具和系統已經相繼問世,但它們大多隻是輔助性工具,無法獨立完成科研工作。早期的 AI 系統如 PaperBench 和 Agent Laboratory,主要幫助科學家復現論文或解決特定的機器學習問題,而 AlphaTensor 則通過大量試錯來優化代碼性能。然而,這些工具往往無法質疑現有的科研範式。
隨着技術的進步,一些全自動的 AI 科學家系統如 AI Scientist 相繼出現,它們證明了 AI 能夠完成完整的研究循環,並發現新的科學成果,但仍缺乏明確的科學目標和方向。相比之下,DeepScientist 則以其閉環、迭代的流程,展現了探索的目標性和洞察力。該系統首先分析現有的研究方法,識別其短板,然後提出新穎且具有科學意義的想法。

DeepScientist 的工作流程被設計成一個三階段的循環:首先是生成新想法的階段,在這一階段,系統會從龐大的記憶庫中提取信息,併爲新想法打分;接下來,系統會使用 “上置信界” 算法來決定驗證哪一個想法,選擇得分最高的想法進行實驗;最後,在成功驗證的基礎上,系統會撰寫詳細的研究報告,形成閉環。
在具體任務上,DeepScientist 選取了三個前沿 AI 研究方向,包括代理失敗歸因、LLM 推理加速和 AI 文本檢測。在這三個任務中,DeepScientist 分別提出了 A2P、ACRA 和 PA-Detect 等新方法,不僅超越了現有的 SOTA(State Of The Art)記錄,還展示了其出色的自主學習和創新能力。
這一突破性的研究成果,標誌着 AI 科學家在科研領域的潛力得到了進一步驗證,未來可能會在更廣泛的科學探索中發揮重要作用。
項目:https://github.com/ResearAI/DeepScientist
劃重點:
- 🚀 DeepScientist 在兩週內完成了人類科學家三年的科研量,展示出強大的科研能力。
- 💡 該系統通過閉環、迭代的流程,能夠自主生成並驗證科學想法,形成完整的研究閉環。
- 🧠 DeepScientist 在多個前沿任務中成功打破了人類最新科研紀錄,展現出 AI 在科研領域的巨大潛力。
