次元を圧倒する:GPT-5.4が「ネイティブなコンピュータ操作」時代を開く
2026年3月、OpenAIは予告もなくGPT-5.4を発表した。この行動はAIエージェント(エージェント)の競争構造を完全に再構築した。OpenAIが初めて「ネイティブなコンピュータ使用能力」を持つ汎用モデルとして登場したGPT-5.4は、外部のアダプターレイヤーに依存せず、画面キャプチャによる認識やマウスクリックのシミュレーション、キーボード入力によって、人間のようにデスクトップ環境でソフトウェアを操作する。
OSWorld-Verifiedという本物のデスクトップナビゲーション能力を測るベンチマークテストにおいて、GPT-5.4の成功率は75.0%に急上昇した。対照的に、人の平均基準は72.4%であり、前バージョンであるGPT-5.2は47.3%だった。これは、AIがコンピュータを操作する熟練度が歴史上初めて通常の人間ユーザーを越えたことを意味している。
実際の体験:労働者の「デジタル分身」が現実になる
現在、GPT-5.4はWeb版とCodexプラットフォームにリリースされている。実験によると、このモデルはほぼすべてのコンピュータ操作フローを引き受けることができる:
深層的なアプリケーション制御:カレンダーアプリケーションを直接呼び出して、自己の権限を申請してリマインダーをカスタマイズできる。また、「小宇宙」などのサードパーティアプリを正確に見つけて開き、指定された番組を再生できる。
システムレベルの権限:ユーザーはこれを要求して、コンピュータの壁紙を直接変更したり、ターミナル(Terminal)でさまざまな開発ツールを素早く呼び出せる。
ネイティブな計算論理:単なる計算結果を提示するだけでなく、コンピュータに内蔵された電卓アプリケーション内で直接シミュレーション操作を行う。
このような「ネイティブ感」は、AIが「会話アシスタント」から正式に「実行エンティティ」へ進化したことを示している。
天造地設:GPT-5.4がOpenClawの課題に完璧に一致
2026年初頭に爆発的に人気となったオープンソースプロジェクトOpenClaw(スター数が25万を突破)はその「選ばれたモデル」を迎えた。OpenClawのコアな理念は「実際に仕事をするAI」であり、GPT-5.4は4つの重要な次元において完璧に一致している:
ネイティブな操作の一致:GPT-5.4を接続したOpenClawは複雑なハック手段を必要とせずにデスクトップの自動化を実現でき、性能向上が明確だ。
100万トークンの持続性:超長文脈窓により、エージェントが長期間のタスクで「忘れやすい」という問題を解決し、OpenClawが十分な「作業台」を持ち、複雑なファイルを処理できる。
ツール検索コスト革命:GPT-5.4のオンデマンド取得メカニズムにより、トークン消費が47%低下し、7×24時間運行されるエージェントのAPI費用を大幅に削減できる。
推論能力の飛躍的向上:専門的な業務において、GPT-5.4は83%以上の人の専門家より優れているため、OpenClawは単なる「スクリプト実行器」から財務分析や投資備忘録を扱える高度なエキスパートに進化した。
業界評価:人間の金領職の「特異点」が到来
HyperWriteAIのCEOマット・シューマーはGPT-5.4のプログラミング能力を「ほぼ完璧無欠」と評価した。Mercor AIのCEOブレンドアも、このモデルが最高級のコンサルティング会社、投資銀行、法律事務所の専門能力をすでに超えようとしていると述べた。これは、かつて代替不可能と考えられていた人間のエリート金領職が、AIエージェントからの全方位的な挑戦を受けていることを意味している。
