最近、ステップスター(StepFun)は新しい深層研究用スマートエージェントモデルであるStep-DeepResearchを正式にリリースしました。この32Bパラメータを持つモデルは、従来のウェブ検索をより専門的な深層研究のワークフローに変換することを目的としており、長距離推論やツール呼び出し、構造化されたレポート作成などの複雑なタスクを処理できます。

image.png

市販の一般的なWebエージェントとは異なり、Step-DeepResearchは主に短い質問に対する検索最適化ではなく、実際の研究と分析のシナリオに焦点を当てています。これは潜在的な検索意図を識別し、不確実性がある場合に複数のソースで検証を行い、最終的に引用を含む専門的なレポートを作成することができます。ステップスターのチームは、このモデルがQwen2.532B-Baseに基づいて構築され、研究プロセスを単一のスマートエージェントの意思決定プロセスに内包することで、効率的な推論コストを削減したと述べています。

AIが人間の専門家と同じような研究レベルを持つために、Step-DeepResearchは4つの「原子的機能」を重点的に磨き上げました。すなわち、計画とタスク分解、深い情報取得、反省と検証、そして専門的なレポート生成です。トレーニング中に、チームは高品質な技術報告書、財務文書および知識グラフデータを用いて広範な合成データパイプラインを構築し、長いプロジェクトを処理する際に非常に高い安定性を備えています。

現在、このモデルはScale AIの研究評価指標において61.42%の遵守率を達成し、OpenAIやGoogleの同様の深層研究システムと同等の性能を示しています。また、ステップスター独自のADR-Bench中国語ベンチマークテストでは、この32Bモデルは一部のより大規模なオープンソースモデルを上回り、非常に高い実用価値とコスト上の優位性を示しています。

論文:https://arxiv.org/pdf/2512.20491

ポイント:

  • 🧠 単一エージェントアーキテクチャ:Step-DeepResearchは、計画、検索、検証、執筆を単一モデルの原子的能力として内包しており、複数の外部エージェントを呼び出す必要がなく、効率を著しく向上させ、コストを削減します。

  • 📚 深層研究指向:単純な質問・回答検索とは異なり、このモデルは128kのコンテキストをサポートし、2,000万を超える論文と権威あるインデックスから情報を取得し、厳密な構造化されたレポートを生成できます。

  • 🏆 パフォーマンスが強力:さまざまな深層研究評価で優れた性能を示しており、32Bの規模でも、大規模なパラメータを持つ非公開モデルと同等の専門的な研究レベルを実現しています。