検索強化生成(RAG)技術に大きな進展が見られました。清华大学THUNLPラボ、東北大学NEUIRラボ、OpenBMBおよびAI9Starsが共同で開発したUltraRAG2.1が正式リリースされ、世界初のModel Context Protocol(MCP)アーキテクチャを基盤とするオープンソースのRAGフレームワークとなりました。このバージョンは、マルチモーダルインテリジェント検索システムの構築プロセスを大幅に簡略化しています。研究者はわずかなYAML設定ファイルを記述するだけで、複数段階の推論・生成・評価を実現でき、コードを書く必要がありません。これにより、技術的なハードルが大きく低下しました。
3つの主要なアップグレードが次の世代のRAG標準を定義
ネイティブなマルチモーダルサポートにより、画像と文章の検索フローを完結
UltraRAG2.1には、Retriever-Generation-Evaluationの統合されたパイプラインが内蔵されており、テキストだけでなく、画像やPDFなどのマルチモーダルデータも処理できます。その独創的なVisRAGパイプラインは、ローカルPDFドキュメントを直接解析し、自動的にテキストとグラフを抽出し、クロスモーダルインデックスを構築します。これにより、「図から文を答える」「文から図を検索する」ような混合検索が可能となり、科研論文分析や技術マニュアルの質問応答など、高価値なシナリオに適しています。

知識ベース構築は完全自動化、MinerUが深く統合
このフレームワークは、Word、PDF、Markdownなどのさまざまな形式のスマート解析と意味的ブロック分割をサポートし、オープンソースのドキュメント処理ツールMinerUとシームレスに統合されています。企業向けプライベート知識ベースをワンクリックで構築できます。ユーザーは手動でのデータクリーニングやラベリングを行う必要がなく、システムが自動的に構造化処理を行い、知識管理の効率を何倍にも向上させます。
統一された作業フロー+標準化された評価、結果は説明可能で最適化可能
UltraRAG2.1は全工程の視覚化されたRAG作業フローを提供し、Elasticsearch、FAISSなどのさまざまな検索エンジンやLlama、Qwen、Kimiなどの生成モデルと互換性があります。さらに、関連性、忠実度、滑らかさなどの次元から結果の品質を定量的に評価する標準化された評価体系を導入しています。開発者は直感的にボトルネックを見つけることができ、迅速に改善できます。

MCPアーキテクチャ:RAGを本当に「組み合わせ可能・拡張可能」にする
従来のRAGではハードコーディングされていたものとは異なり、UltraRAG2.1はモデルコンテキストプロトコル(MCP)に基づき、検索、推論、生成などのモジュールを標準化された「エージェント」として分離し、YAMLによる宣言型設定で柔軟に複雑なタスクフローを構成可能です。例えば、わずかな設定で、「まず技術ドキュメントを検索→その後コード生成モデルを呼び出す→最後に評価モジュールで出力を検証する」などの3段階の作業フローを実現できます。
AIbaseによると、UltraRAG2.1のリリースにより、RAG技術は「ツールのつなぎ合わせ」から「エンジニアリングの枠組み」へと移行したことを示しています。マルチモーダル理解、知識構築、効果評価が、軽量でオープンソースで低コードのフレームワークに統合されることにより、企業や研究者にとって大規模モデルの能力を実際のビジネスシナリオに適用することがより効率的になります。この中国語コミュニティが主導する技術革新は、世界のRAGエコシステムに新たな力となっています。
