近日,階躍星辰正式開源了一款全新的深度研究模型 ——Step-DeepResearch。這款模型擁有320億參數,致力於在開放式研究環境中進行自主的信息探索和專業報告生成。根據官方介紹,Step-DeepResearch 在深度研究能力上已接近 OpenAI 的 o3-mini 和 Gemini2.0Flash 等頂級商業模型,但其部署成本卻僅爲傳統模型的十分之一,單次調用成本低於0.5元人民幣。

image.png

Step-DeepResearch 的設計理念十分獨特。它通過將複雜的研究任務分解爲多個可訓練的 “原子能力”,如規劃、信息檢索、反思和交叉驗證,從而實現閉環反思和動態校正。這種方法不僅提升了模型在複雜環境中的自適應能力,也增強了其泛化性能。模型的訓練流程經過精心設計,從智能體中期訓練到監督式微調(SFT 以及強化學習(RL),確保其在複雜的實際應用中表現出色。

在測試中,Step-DeepResearch 在 Scale AI Research Rubrics 中獲得了61.4% 的高分,這一成績與一些更大規模的模型如 OpenAI Deep Research 和 Gemini Deep Research 不相上下。此外,在 ADR-Bench 的專家評估中,Step-DeepResearch 的 Elo 評分更是顯著高於許多競爭對手,展示了其在深度研究領域的強大能力。

爲了支持科研工作流程,Step-DeepResearch 採用了基於 ReAct 範式的單智能體架構,具備推理、行動和反思的動態循環。通過內部的專有工具集,該系統能夠高效進行批量網頁搜索、文件管理和交互式命令執行等任務,爲研究人員提供了極大的便利。

github:https://github.com/stepfun-ai/StepDeepResearch

劃重點:  

✨ Step-DeepResearch 是階躍星辰最新開源的深度研究模型,參數規模320億。  

💡 該模型在深度研究能力上接近頂級商業模型,但其成本僅爲傳統模型的十分之一。  

🚀 通過獨特的訓練流程和動態循環架構,Step-DeepResearch 在科研工作中提供了高效的支持。