アメリカの大規模モデル業界の指標となるアンソロピックは、本日午前中に正式に Claude Opus 4.8 大規模モデルを発表しました。しかし、このモデルが多くのランキングで目覚ましい成績を収めた一方で、多くのユーザーと開発者から「認識の混乱」の問題が指摘されています。
あるユーザーは API を使ってテストし、このモデルに自身の身分を尋ねると、誤ってアリババの「Qwen(千問)」や「DeepSeek」などの中国の主要なオープンソースの大規模モデルであると自称することが判明しました。
API テストによって認識異常が引き起こされる
この現象に対して、ウェブサイト上でテストを行った一部のユーザーは再現できず、このモデルが中国の大規模モデルを蒸留していないと考えています。しかし、関係する開発者は、ウェブサイト上の会話にはシステムプロンプト(System Prompt)の厳格な制限があるため、この異常が隠されていると説明しています。
逆に、何ら制限がない下層の API テストでは、この問題が頻繁に再現されます。これは、米国のトップクラスの大規模モデルが、トレーニングまたはファインチューニングの過程で、中国のオープンソース大規模モデルの生成データを大量に使用して「蒸留」した可能性が高いことを直接示しています。
言動不一致が二重基準の疑いを引き起こす
この出来事は、テクノロジー界で大きな波紋を巻き起こしました。その理由は、アンソロピック社が以前から強い「反中」傾向を示していたからです。同社は米国国防総省などの部門と共同で法案を作成し、「大規模モデルの蒸留」を敵対的な攻撃行為として定義しようとしたことがあります。
