OpenAI 首席執行官 Sam Altman 正式宣佈推出全新編程大模型

在性能表現上,GPT-5.3-Codex 刷新了多項權威評測紀錄。其在 SWE-Bench Pro 編程評測中達到了57%,而在更側重系統操作的 TerminalBench2.0和 OSWorld 評測中,分別取得了76% 和64% 的高分。這意味着該模型不僅能寫代碼,還具備了極爲出色的計算機實操能力,能夠像人類工程師一樣理解並執行復雜的操作系統任務。
值得關注的是,新模型在運行效率上表現驚人。OpenAI 表示,在完成同等複雜度的任務時,GPT-5.3-Codex 的令牌(Token)消耗量較上一代5.2版本減少了超過一半,同時單令牌的處理速度提升了25% 以上。這種“高速度、低能耗”的特性,將顯著降低企業和開發者集成 AI 編程能力的成本。此外,模型還支持在任務執行過程中進行實時調控與動態更新,極大增強了開發流程的靈活性。
安全性方面,GPT-5.3-Codex 是 OpenAI 首款在安全防護框架的網絡安全維度獲評“高等級”的模型。爲了進一步構建防禦體系,OpenAI 同步推出了可信訪問框架試點計劃,並投入1000萬美元的 API 額度,旨在通過 AI 技術加速全球網絡安全防禦建設。
劃重點:
💻 編程與實操雙進化:模型在 SWE-Bench Pro 等多項評測中創下新高,具備成熟的計算機系統自主操作與複雜編程能力。
⚡ 運行效率大幅躍升:相比5.2版本,同任務令牌消耗降低超50%,處理速度提升超25%,顯著提升了任務執行的經濟性。
🛡️ 安全防禦等級登頂:首獲網絡安全維度“高等級”評價,OpenAI 撥付千萬美元額度專項助力網絡安全體系建設。
