谷歌 AI 研究團隊近日推出了 DS STAR(數據科學代理通過迭代規劃和驗證),這是一種多智能體框架,旨在將模糊的商業問題轉化爲可執行的 Python 代碼,無需人工分析師的介入。與傳統數據科學代理依賴於結構化的 SQL 數據庫不同,DS STAR 能夠直接處理 CSV、JSON、Markdown 以及非結構化文本等混合格式的數據文件。

image.png

DS STAR 的工作流程分爲幾個階段。首先,系統通過一個名爲 Aanalyzer 的智能體對數據湖中的每個文件進行分析,生成 Python 腳本來提取關鍵信息,如列名、數據類型和元數據。這一步驟確保了系統能夠獲取每個文件的結構化視圖,爲後續的分析提供上下文信息。

在完成數據分析後,DS STAR 進入一個迭代規劃和驗證的循環。這個過程包含了多個智能體,包括 Aplanner、Acoder、Averifier 和 Arouter 等。Aplanner 負責創建初始的可執行步驟,Acoder 則將這些步驟轉換爲 Python 代碼,執行後得到觀察結果。Averifier 根據執行結果評估當前計劃的充分性,必要時由 Arouter 決定如何修正計劃。這個循環會持續進行,直到得到一個符合要求的結果或達到最大迭代次數。

此外,DS STAR 還配備了 Adebugger 和 Retriever 模塊,以提高系統的魯棒性。Adebugger 在腳本失敗時進行修復,確保即使在遇到模式漂移和缺失列的情況下,系統仍能正常運行。而 Retriever 則負責在龐大的數據集中檢索最相關的文件,以便在分析過程中提供上下文支持。

通過一系列基準測試,DS STAR 在 DABStep、KramaBench 和 DA Code 等多個任務中展現了卓越的表現,顯著提高了分析的準確性。這表明 DS STAR 能夠有效地將複雜的數據科學問題轉化爲可靠的 Python 解決方案,推動數據分析的自動化進程。

論文:https://arxiv.org/pdf/2509.21825

劃重點:  

🌟 DS STAR 是一款多智能體框架,能夠將模糊商業問題轉化爲可執行的 Python 代碼。  

📊 該系統通過多個智能體的協作,完成數據分析、代碼生成及結果驗證的迭代過程。  

🚀 在基準測試中,DS STAR 顯著提高了數據科學任務的分析準確性,展現了強大的自動化能力。