OpenAI は2026年3月5日に正式に GPT-5.4 シリーズモデルをリリースしました。前バージョンと比較して、GPT-5.4は推論能力、プログラミング能力、そしてエージェント(Agent)ワークフローの深く統合された仕組みを実現しています。

ChatGPTのウェブ版およびアプリで、画期的なインタラクティブな変化をもたらす新しい Thinking(思考)モード が導入されました:

思考プロセスのプレビュー: AIは本格的な回答を行う前に、「思考計画」を表示します。ユーザーはAIが問題をどのように分解するかをリアルタイムで確認でき、生成過程においていつでも介入し、方向を調整できます。

深層検索強化:非常に細かい複雑な質問に対して、Thinkingモードはより強力な多段階ネットワーク検索機能を持っています。人間の専門家のように、複数の情報源を比較・統合し、高品質な答えを作成できます。

HCqs0sHaEAA0j8l.png

生産性エンジン:CodexのDNAを継承し、専門シーンの最適化

GPT-5.4は正式に GPT-5.3-Codex の優れたプログラミング能力を統合し、OpenAI初の「メインライン推論型」モデルとなりました。

オフィスソフトの協働:エクセル、パワーポイント、ドキュメント処理などのシナリオに特化した最適化により、生成プロセスにおける論理エラーが大幅に減少しました。

低エラー率と高事実性:データによると、GPT-5.4の事実誤り率はGPT-5.2より18%低下し、偽った記述は33%減少しています。専門分野(金融、法務分析など)でのパフォーマンスはすでに人間の専門家と同等です。

エージェントの飛躍: オペレーティングコンピュータとのネイティブな連携と百万トークンの文脈

GPT-5.4は単なるチャットウィンドウではなく、本格的なコンピュータネイティブな操作能力を持つようになりました:

アプリケーション間実行:モデルはスクリーンショットや命令の記述を通じて、仮想環境またはローカルソフトウェア内でクリック、ドラッグ、入力などの操作を直接実行し、アプリケーション間の複雑なワークフローを完了します。

百万トークンの文脈:最大で 100万トークン(1M Tokens) をサポートする超長文脈窓があります。これは、エージェントが一括して膨大なコードベースや何四半期分の財務諸表を「読み込み」、それ以上の時間(数時間乃至数日)にわたる長期的なタスクの計画と検証を行えることを意味します。

バージョンと価格

今回のアップデートでは、GPT-5.4Proバージョンも同時にリリースされ、主に高負荷のプロフェッショナル開発者や企業向けユーザーを対象としています:

Proバージョン専用:高い推論投入(Reasoning Effort: High/X-High)をサポートしており、極めて困難な科学的発見やアーキテクチャ設計などのタスクに特化しています。

利用可能性