記事本文

大注目！学術チームがSFTを活用して大手企業の支配を打ち破り、OpenSeeker-v2が検索スマートエージェントランキングで1位に

公開AI二ュ-ス

時間 :May 6, 2026

読む :1分

現在の大規模言語モデル（LLM）分野において、深層的な検索能力はトップクラスのスマートエージェントにとって「必殺技」となっています。しかし、この分野のルールは長年、資金力のある産業の大手企業によって主導されてきました。従来の開発方法は、予訓練、継続的予訓練（CPT）、監督微調整（SFT）、強化学習（RL）といった非常にリソースを消費するプロセスに依存していました。

最近、学術界の研究チームが最新の成果であるOpenSeeker-v2を公開し、この常識を完全に打ち破りました。研究報告によると、高品質で難易度の高いタスクのトレースを使用してトレーニングを行うことで、単純な監督微調整（SFT）の方法でも高性能な検索エージェントを構築することが可能であることが示されています。

このチームはデータ合成に関して3つの主要な最適化戦略を提案しました。第一に、知識グラフの規模を拡大してより豊かな探索空間を提供すること。第二に、ツールキットの数を大幅に増やし、機能の境界を広げること。第三に、厳格な低ステップフィルタリングを実施し、トレーニングデータの精練と効率性を確保することです。

実験データによると、1.06万個のデータポイントのみでトレーニングされたOpenSeeker-v2（30B規模、ReActアーキテクチャ）は、4つの主要なベンチマークテストで極めて強力なパフォーマンスを示しました。その正確率はBrowseCompで46.0%、BrowseComp-ZHでは58.1%、『人類最後の試験』（Humanity's Last Exam）では34.6%、xbenchでは78.0%に達しました。これらの成績は記録を更新しただけでなく、産業界モデルである通義DeepResearchが採用する重いCPT+SFT+RLの複雑なパイプラインでトレーニングされたモデルを全面的に上回りました。

注目すべきは、これは同等のモデル規模とアーキテクチャで、純粋な学術チームがSFT技術だけで実現した初のSOTA（state-of-the-art）検索エージェントであるということです。現在、このチームはOpenSeeker-v2のモデルウェイトを正式にオープンソース化しています。この発見により、最先端の検索エージェントの開発の障壁が大きく低下し、学術界とオープンソースコミュニティに参考価値の高い軽量な開発経路を提供しています。

論文のURL：https://arxiv.org/pdf/2605.04036

アリ云開発者公式WeChat公眾号が「Qwen AIプラットフォーム」に正式に名称変更

アリババクラウドは、元の「アリ云開発者」WeChat公眾号を「Qwen AIプラットフォーム」に正式に名称変更し、エージェントに生まれたプラットフォームとして、AI生産性を推進する。この動きは、AIがエージェントへと進化するトレンドに応じ、大規模モデルとエージェントの先端技術に焦点を当て、通義千問モデルとアリババクラウド技術を基盤にして、AIコンテンツと開発者サービスの全面的なアップグレードを開始するものである。

Jul 23, 2026

144.3k

中国電信が5Gネットワーク構築を大規模モデルに委任：計画効率が倍に、プランの正確度は75％に到達

中国电信が5G無線ネットワーク計画に大規模モデルを初適用、実ネットワーク試験で計画効率50%向上、方案精度75%超、設計案を自動生成し効果を正確に予測、従来の人手調査や専門家比較選定の低効率を変革。....

Jul 21, 2026

173.3k

テンセントWorkBuddyの6月アクセス数が2000万を突破、AIオフィススマートエージェント市場をリード

『2026年第2四半期中国オフィススマートエージェント市場洞察報告』によると、テンセントWorkBuddyはPC用AIネイティブオフィススマートエージェント市場で首位を維持しており、6月のアクセス数は2097万回に達し、2位と3位の合計を上回っています。その月の市場全体のアクセス数は6000万回を超え、業界規模は継続的に拡大しています。テンセント傘下のAIプログラミングスマートエージェントCodeBuddyもトップクラスです。WorkBuddyは自然言語の指示によってオフィス作業を完了させることができます。

Jul 20, 2026

404.8k

Kimi、計算リソースの不足によりC端新ユーザーの購読を一時停止、クラスタ拡張を全速で進めています

7月19日深夜、Kimiはユーザーリクエスト急増で計算リソースが限界に達したと発表。新規Cユーザーの登録を停止し、拡張計画を開始。過去48時間のリクエストが予想を大幅に超え、既存ユーザーを優先しつつ、急ピッチで拡張を進める。....

Jul 20, 2026

192.9k

アリババ新世代の大規模モデルQwen3.8が登場：プレビュー版がアリ云とQoderに先行公開、公式版は近日オープンソース化予定

国内大規模モデルのオープンソース化が加速。アリババが次世代「通義千問3.8」を近日公開、プレビュー版は体験可能。正式版も近くリリース。通義千問のオープンソース展開が加速。....

Jul 20, 2026

233.2k

インテリジェントな未来、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

大注目！学術チームがSFTを活用して大手企業の支配を打ち破り、OpenSeeker-v2が検索スマートエージェントランキングで1位に

関連推奨

アリ云開発者公式WeChat公眾号が「Qwen AIプラットフォーム」に正式に名称変更

中国電信が5Gネットワーク構築を大規模モデルに委任：計画効率が倍に、プランの正確度は75％に到達

テンセントWorkBuddyの6月アクセス数が2000万を突破、AIオフィススマートエージェント市場をリード

Kimi、計算リソースの不足によりC端新ユーザーの購読を一時停止、クラスタ拡張を全速で進めています

アリババ新世代の大規模モデルQwen3.8が登場：プレビュー版がアリ云とQoderに先行公開、公式版は近日オープンソース化予定