清华大学と東北大学が共同でUltraRAG 2.0を発表：50行のコードでパフォーマンスの高い検索強化生成システムを実現

最近、清华大学 THUNLP ラボ、東北大学 NEUIR ラボ、OpenBMB および AI9Stars は、UltraRAG2.0を共同でリリースしました。これは、Model Context Protocol（MCP）アーキテクチャに基づいた最初の検索強化生成（RAG）フレームワークです。

このフレームワークは、RAGシステムの構築プロセスを簡素化し、研究者が短時間で複雑なマルチステージ推論システムを実現できるようにすることを目的としています。UltraRAG2.0の特徴は、ユーザーがYAMLファイルを記述するだけで、シーケンシャル、ループ、条件分岐などの複雑なロジックを簡単に宣言できることです。これにより、コード量が大幅に減少し、実装のハードルが低下します。

現在のRAGの発展傾向において、多くのシステムは徐々に自己適応的な知識構成、複数ラウンドの推論、動的検索などの複雑な機能を取り入れています。代表的なプロジェクトにはDeepResearchやSearch-o1があります。しかし、これらの複雑な機能は開発者にとって高いエンジニアリングコストをもたらし、新しいアイデアの迅速なイテレーションと再現を制限しています。UltraRAG2.0はこのような課題に対応するために登場し、RAGのコアコンポーネントを独立したMCPサーバーとしてラップすることで、機能の柔軟な呼び出しと拡張を実現しています。

具体的には、従来の実装方法と比較して、UltraRAG2.0ではコード量が大幅に減少しています。例えば、古典的な手法IRCoTの公式実装には約900行のコードが必要ですが、UltraRAG2.0を使用すれば約50行のコードで同等の機能が可能です。その半分はプロセス編成用のYAML擬似コードであり、開発のハードルを大きく下げています。このフレームワークは、簡潔な宣言型の方法でマルチステージ推論プロセスを構築できるため、複雑な推論ロジックは冗長な手動コーディングを必要としません。

UltraRAG2.0は動的検索、条件判断、複数ラウンドのインタラクションなどの高度な機能もサポートしており、研究者は短期間で高性能な実験プラットフォームを構築できます。複雑な多ジャンプ問題への対応が可能です。このシステムの性能は従来のVanilla RAGよりも約12%向上しています。この設計は、研究者がエンジニアリングの実装に時間をかけずに、アルゴリズムの革新や実験設計に注力できるようにすることを目的としています。

また、UltraRAG2.0のMCPアーキテクチャにより、異なるモジュール間でのシームレスな再利用が可能となり、モジュールの柔軟な拡張と接続もサポートされています。これにより、研究者は新しいモデルやアルゴリズムを迅速に調整することが容易になります。この設計により、システム開発の効率性と再現性が大幅に向上しています。

GitHub:https://github.com/OpenBMB/UltraRAG

プロジェクトホーム:https://openbmb.github.io/UltraRAG

ポイント：
🌟 UltraRAG2.0は、清華大学と東北大学が共同で開発したものです。複雑なRAGシステムの構築プロセスを簡素化することを目的としています。
🛠️ YAMLファイルを記述することで、複雑な推論ロジックを実現でき、コード量と開発のハードルを大幅に低下させます。
📈 伝統的な方法と比較して、UltraRAG2.0は約12%のパフォーマンス向上を達成し、複数ラウンドの推論や動的検索などの高度な機能に適しています。

清华大学と東北大学が共同でUltraRAG 2.0を発表：50行のコードでパフォーマンスの高い検索強化生成システムを実現

関連推奨

GoogleがGemini APIのファイル検索ツールをリリース:プライベートRAGの統合を簡略化、開発者は独自のベクトルデータベースを構築する必要がない

メタのスーパーインテリジェンスラボが新技術を発表。大規模モデルのRAG推論速度が30倍向上

RAG DRAG技術を越えて、大規模モデルの正確性を顕著に向上

グーグルAIがChrome DevTools MCPのベータ版をリリース: コードエージェントを制御し実際のブラウザを操作する

Cohere、Microsoft Azure AI Foundryで2つの新しいモデルを発表、RAGとAIエージェントワークフローの最適化を支援