学術分野で一般的に存在する「偽造された論文」の問題に対して、ワシントン大学とアレン人工知能研究所(AI2)の研究チームは画期的な解決策を提示しました。オープンソース人工知能モデル「OpenScholar」を正式に公開しました。このモデルは最新の研究成果を統合する際に優れた性能を発揮し、引用の正確性が大幅に向上しただけでなく、生成された内容の質は半数以上の専門家に好まれています。

長期間にわたり、GPT-4oのような最先端モデルでも、学術的な引用処理においては78%から90%の「幻覚」率に直面していました。この課題を克服するために、OpenScholarは独自の方法を取り入れ、4,500万編の学術論文を含む大規模な検索データベースを構築しました。先進的な検索拡張生成(RAG)技術により、このモデルは最新の論文をリアルタイムで参照し、標準的な規格に基づいた引用形式で回答を出力することができます。これにより、「まじめに間違ったことを言う」という状況は完全に解消されました。

厳格なScholarQABench基準テストおよび専門家の二重盲検審査において、OpenScholarの性能は驚くほどでした。テスト結果によると、51%のテストケースで科学者はOpenScholarによって生成された回答よりも人間の専門家が書いた内容を好む傾向がありました。もしこの引用メカニズムをGPT-4oと組み合わせれば、専門家の好みの割合は急上昇して70%に達します。

現在、OpenScholarのコード、データセットおよびデモバージョンはすべて社会に公開されており、研究者に強力なツールを提供するとともに、透明性があり信頼できる学術AIエコシステムの構築に新たな基準を示しています。このチームは今後も継続的に改善を進め、複数ステップの検索と情報集約をサポートする新しいモデルをリリースする予定です。これにより、科学研究への支援をさらに強化していくことになります。