OpenAIは新しくて基礎モデルGPT-5.4を正式に発表しました。これは、現在最も機能が強力で効率的なプロフェッショナルな作業用のモデルを目指して開発されました。AIbaseの報道によると、今回のシリーズは差別化された発表戦略を採用しており、標準版に加え、複雑な論理に特化した推論モデルGPT-5.4Thinkingと、高性能要件に最適化されたGPT-5.4Proも同時にリリースされました。

ChatGPT

技術面では、GPT-5.4のAPIバージョンが飛躍的に向上し、最大で100万トークンのコンテキスト窓を提供し、OpenAI史上最高の数値となりました。同時に、このモデルはトークン効率を大幅に向上させ、同じ問題をより少ないリソースで解決できるようになりました。

安全性と正確性において、新しいモデルはGPT-5.2よりも1つの文の誤り率が33%低下し、全体的な回答の誤り率は18%減少しています。また、推論モデルにおける「思考過程の偽装」リスクに対し、OpenAIは新たなセキュリティ評価システムを導入しました。テスト結果によると、GPT-5.4Thinkingは高い透明性を持ち、その推論プロセスを隠すまたは偽造することが難しいことが確認されています。

実際のベンチマークテストでは、GPT-5.4は優れたパフォーマンスを示しました。OSWorld-VerifiedやWebArena Verifiedなどのコンピュータ使用テストでは記録を更新し、知識作業タスクであるGDPvalテストでは83%という記録的な高得点を達成しました。

MercorのCEOブレンドン・フーディー氏は、このモデルが金融や法律など専門分野でのAPEX-Agentsベンチマークテストでもリードしていると指摘し、特に財務モデルや法的分析などの長期的な成果物の生成に長けています。新たな「ツール検索」システムと組み合わせることで、外部ツールを呼び出す際の効率が向上し、大規模なツール統合時のトークン消費量が大幅に削減されました。