
技術層面,
在安全性與準確性上,新模型較 GPT-5.2的單個陳述錯誤率降低了33%,整體回覆錯誤率下降18%。此外,針對推理模型可能存在的“思維鏈欺騙”風險,
在實測基準測試中,
Mercor 首席執行官 Brendan Foody 指出,該模型在金融、法律等專業領域的


技術層面,
在安全性與準確性上,新模型較 GPT-5.2的單個陳述錯誤率降低了33%,整體回覆錯誤率下降18%。此外,針對推理模型可能存在的“思維鏈欺騙”風險,
在實測基準測試中,
Mercor 首席執行官 Brendan Foody 指出,該模型在金融、法律等專業領域的
GitHub Copilot 迅速接入GPT-5.4,爲開發者提供基於新模型的智能編程支持。官方測試顯示,該模型在代理型軟件開發中任務成功率顯著提升,繼承了Codex系列的代碼生成優勢。
GitHub Copilot已接入GPT-5.4模型,成爲首批集成該旗艦模型的開發者工具。此次升級標誌着AI編程助手進入“代理型”工作流新階段。GPT-5.4在多步驟任務處理上成功率顯著提升,能更精準執行復雜邏輯推理與跨工具調用,並強化了Codex系列的專業能力。
2026年3月,OpenAI發佈GPT-5.4,開啓AI原生電腦操控時代。該模型無需外部適配,可直接通過截圖識別、模擬鼠標鍵盤操作桌面軟件,在OSWorld-Verified基準測試中展現強大桌面導航能力,重塑智能體競爭格局。
這個春節假期,“手搓經濟”走紅。用戶通過靈光App用自然語言對話,無需代碼即可快速生成可交互的閃應用,製作門檻低、成本爲零。年輕人藉此將創意變現,在社交平臺出售手搓應用,單個成交量可達數百至上千單,不受賽道限制,發展成一門新生意。
OpenAI指出,企業不應僅將AI作爲零散工具,而應通過五大價值模型推動系統性變革,從試點轉向組合投資,以實現類似電子商務的商業重塑。