Anthropicは5月29日に最新のエリートモデル「Claude Opus4.8」を正式に発表しました。このアップグレードは、ユーザーの根本的なニーズに焦点を当てたもので、従来の価格体系を維持したまま、エージェントプログラミング、複雑な論理的推論、そして多分野の知識作業能力を全面的に強化しています。

AIプログラミングとエージェント性能という核心的な分野において、新バージョンは大きな進歩を遂げました。いくつかの早期テスト機関からのフィードバックによると、Opus4.8は日常的なパフォーマンスがより安定しており、判断もより鋭くなっています。複雑なマルチステップタスクを処理する際には、高い信頼性を示すだけでなく、計画が不適切な場合にユーザーに異議を唱え、不確実性を指摘する機能も備えています。評価データによると、このモデルが自身が書いたコードに欠陥があるにもかかわらず説明しない確率は前バージョンの四分の一まで下がり、根拠のない結論の発生を大幅に減らしています。

業界注目の基準テストにおいて、新モデルは非常に強力な実力を披露しました。公式データによると、Opus4.8は有名なプログラミングテストSWE-Bench Proで69.2%の優れた成績を収め、多くの主要な基準テストにおいてGPT-5.5やGemini3.1Proを上回り、さらに業界内での第一線の地位を強固にしました。

