谷歌DeepMind團隊近日正式推出了全新的AI框架“AlphaProof Nexus”。該系統憑藉強大的人工智能推理與形式化驗證能力,在數學研究領域取得了里程碑式的突破,成功解開了兩道已懸而未決長達 56 年的Erdős(埃爾德什)數學難題。

獨創四級智能體架構協同破局
AlphaProof Nexus在架構設計上極具創新,由 4 個複雜度遞增的AI智能體組合而成。系統從最基礎的Gemini模型與Lean編譯器循環交互開始,逐步引入代碼補全片段機制和類似AlphaEvolve的進化機制,最終通過功能最完整的智能體實現多個證明草稿的共享、評分與排序。
在針對 353 個開放的Erdős問題進行的自主測試中,該系統不僅成功解決了 9 個問題,還順帶證明了整數序列在線百科全書中的 44 個開放猜想。令人驚歎的是,AlphaProof Nexus完成單個複雜問題的推理成本僅僅需要數百美元。
編譯器反饋錨定推動AI進化
除了在組合數學、數論等領域斬獲頗豐,該系統還成功解決了一個存在 15 年的Hilbert函數問題,並顯著改進了凸優化中的已知界限。研究團隊在分析實驗數據時發現,即使是最簡單的基礎智能體,在強大的Lean編譯器反饋“錨定”作用下,也能成功攻克部分難題。
這一發現表明,底層模型能力的持續提升與嚴格的代碼形式化驗證相結合,正在爲AI注入邏輯嚴密的數學直覺。谷歌此次的技術飛躍,不僅標誌着AI驅動的科學發現邁向新高度,也預示着人類正迎來與AI深度協作攻克科學禁區的新時代。
