OpenAIのCEOであるSam Altman氏は、新たなプログラミング大規模モデル「

パフォーマンス面では、GPT-5.3-Codexはいくつかの権威ある評価テストで記録を更新しました。SWE-Bench Proプログラミング評価では57%の成績を収め、システム操作に重点を置いたTerminalBench2.0やOSWorldの評価ではそれぞれ76%と64%の高いスコアを獲得しました。これは、このモデルがコードを書くだけでなく、非常に優れたコンピュータ実作業能力を持っていることを意味し、人間のエンジニアのように複雑なオペレーティングシステムのタスクを理解して実行できる能力を持っています。
注目すべき点は、新モデルが実行効率において驚異的な性能を発揮していることです。OpenAIによると、同等の複雑度のタスクを完了する場合、GPT-5.3-Codexのトークン(Token)消費量は前世代の5.2バージョンよりも半分以上減少しており、単一トークンの処理速度は25%以上向上しています。このような「高速度・低消費電力」の特徴により、企業や開発者がAIプログラミング機能を統合するコストを顕著に低下させることができます。また、モデルはタスク実行中にリアルタイムでの調整と動的アップデートをサポートしており、開発プロセスの柔軟性を大幅に高めています。
セキュリティに関して、GPT-5.3-CodexはOpenAIが初めてネットワークセキュリティの観点から「高等級」と評価されたモデルです。さらに防御体制を強化するために、OpenAIは信頼できるアクセスフレームワークの試験計画を同時に導入し、1,000万ドル相当のAPI枠を投入して、AI技術を通じてグローバルなサイバーセキュリティ防御の構築を加速することを目的としています。
重要なポイント:
💻 プログラミングと実作業の両方の進化: SWE-Bench Proなどの多くの評価テストで新記録を樹立し、成熟したコンピュータシステムの自律的な操作と複雑なプログラミング能力を備えています。
⚡ 実行効率の大幅な向上: 5.2バージョンと比較して、同じタスクのトークン消費量が50%以上減少し、処理速度は25%以上向上し、タスク実行の経済性が顕著に向上しています。
🛡️ セキュリティ防御の最高レベル: ネットワークセキュリティの観点で初めて「高等級」評価を受けており、OpenAIは1,000万ドル相当の枠を専用でサイバーセキュリティインフラの構築に充てています。
