現在の大規模言語モデル(LLM)分野において、深層的な検索能力はトップクラスのスマートエージェントにとって「必殺技」となっています。しかし、この分野のルールは長年、資金力のある産業の大手企業によって主導されてきました。従来の開発方法は、予訓練、継続的予訓練(CPT)、監督微調整(SFT)、強化学習(RL)といった非常にリソースを消費するプロセスに依存していました。
最近、学術界の研究チームが最新の成果である

このチームはデータ合成に関して3つの主要な最適化戦略を提案しました。第一に、知識グラフの規模を拡大してより豊かな探索空間を提供すること。第二に、ツールキットの数を大幅に増やし、機能の境界を広げること。第三に、厳格な低ステップフィルタリングを実施し、トレーニングデータの精練と効率性を確保することです。
実験データによると、1.06万個のデータポイントのみでトレーニングされた

注目すべきは、これは同等のモデル規模とアーキテクチャで、純粋な学術チームがSFT技術だけで実現した初のSOTA(state-of-the-art)検索エージェントであるということです。現在、このチームは
論文のURL:https://arxiv.org/pdf/2605.04036
