グーグルDeepMindチームは近日、新しいAIフレームワーク「AlphaProof Nexus」を正式に公開しました。このシステムは、強力な人工知能の推論と形式的検証能力を備え、数学研究分野で画期的な進展を遂げ、56年にわたって未解決だった2つのエルデシュ(Erdős)の数学問題を成功裏に解き明かしました。

image.png

独自の4段階エージェントアーキテクチャで難題を突破

AlphaProof Nexusはアーキテクチャ設計において革新的で、複雑度が増す4つのAIエージェントで構成されています。システムは、最初にGeminiモデルとLeanコンパイラとの反復的なやり取りから始まり、徐々にコード補完スニペットメカニズムやAlphaEvolveに似た進化メカニズムを導入し、最終的には最も機能が充実したエージェントによって複数の証明ドラフトを共有・評価・順位付けします。

353のオープンなエルデシュ問題に対して行われた自律的なテストでは、このシステムは9つの問題を成功裏に解決し、さらに整数列オンライン百科全書内の44のオープンな仮説も証明しました。驚くべきことに、AlphaProof Nexusが単一の複雑な問題を推論するコストはわずか数百ドルです。

コンパイラフィードバックによるAIの進化促進

組み合わせ数学や数論などの分野で大きな成果を収めた一方、このシステムは15年間未解決だったヒルベルト関数問題も解決し、凸最適化における既知の境界を顕著に改善しました。研究チームは実験データを分析した結果、最も単純な基本エージェントでも、強力なLeanコンパイラのフィードバック「アンカー」の影響下では一部の難問を解決できることを発見しました。

この発見は、下位モデルの能力の継続的な向上と厳密なコード形式的検証の組み合わせが、AIに論理的で严密な数学的直感を注入していることを示しています。グーグルの今回の技術的飛躍は、AI駆動型の科学発見が新たな高みに達したことを示しており、人類がAIと深く協力して科学の禁域を突破する新たな時代が始まったことを示唆しています。