Anthropic は近日、最新の人工知能モデル
この現象は、モデルの能力不足によるものではなく、Anthropicが非常に高いセキュリティ基準に基づいて意図的に制限した結果です。

実際のテストでは、このような慎重な方針の副作用が明らかになります。細胞のミトコンドリア機能に関する解説、花粉症の原因についての議論、アステマ薬の原理など、無害な医学的な常識についてもClaude Fable5は拒否します。エボラウイルスのような公衆衛生に関連する話題さえも、そのブロックメカニズムを引き起こします。「広範囲なブロッキング」により、本来学術的価値や啓発的な意味を持つコミュニケーションが中断されてしまいます。
Anthropicはこれに対して、この行動の核心的な目的は、悪意のあるユーザーが先進的なAIを使って高リスクな生物研究を行うことを防ぐためであると述べています。会社のスポークスパーソンであるパール・マハーシャワリー氏は、「モデルをできるだけ早くリリースするために、極めて保守的な保護ルートを選択した」と語り、現在の誤検出が多すぎるという点を認めました。
比較すると、Claude Fable5は化学およびサイバーセキュリティ分野での制限がより柔軟です。爆薬の製造方法や炭疽菌の培養方法などの危険情報は拒否しますが、塩素ガスの用途、パスワードセキュリティ、物理の原理などの中立的な技術的な質問については、モデルは正常に回答できます。劇毒物質など極端な状況にのみ、上世代のモデルを呼び出して補助処理を行います。
