『ニューヨーク・タイムズ』は最近、グーグルのAIオーバービュー(AI Overviews)の正確性は約90%であると報道した。このデータには年間5兆回を超える検索が含まれており、1時間あたりに5,700万件以上の誤った答えが生成される可能性があり、1分あたりで約100万件の誤情報が生じる計算になる。
スタートアップ企業のOumiは、グーグルの検索を評価し、SimpleQAのベンチマークを使って4,326回の検索結果を分析した。その結果、昨年10月のグーグルのGemini 2の正確性は85%だったが、今年2月にはGemini 3ではその数字が91%に上昇した。しかし、Oumiの評価方法は主にAIツールに依存しており、これによりデータにバイアスが生じる可能性がある。また、グーグルは同じ検索クエリに対して異なるオーバービューを生成することがあり、結果の不確実性を増している。
具体的には、AIオーバービューと元の情報源との不一致率は、Gemini 2の37%からGemini 3の56%に上昇している。これはユーザーが特定のオーバービューを見た際に、それとは矛盾するリンクや、正確なオーバービューでも誤った情報を引用しているケースがあることを意味している。あるジャーナリストが偽のブログを公開した後、グーグルは翌日のオーバービューでその内容を引用したことがあり、AIオーバービューが操作されやすいことを示している。
さらに、ユーザーのスティーブン・パンワシがレスラーのハルク・ホーガン(Hulk Hogan)の死のニュースを検索した際、AIオーバービューは「信頼できる情報でホーガンが亡くなったという報告はない」と明確に述べたが、ページの下部には「ホーガンの死の謎が深まる」という記事タイトルが表示されていた。このような矛盾した現象は、AIによって生成されたコンテンツの信頼性に対するユーザーの疑問を引き起こした。
これらの問題に対し、グーグルの担当者はOumiのテスト方法を疑問視し、それが検索行動を正確に反映していないと指摘した。
ポイント:
🔍 AIオーバービューの正確性は約90%で、1時間に5,700万件以上の誤った答えが生成される可能性がある。
📈 Gemini 3の正確性は91%に上昇したが、元の情報源と不一致の割合は56%に上昇している。
🤖 AIオーバービューは偽情報に影響されやすく、ユーザーがその信頼性を疑うようになっている。
