OpenAI 發佈公告爲 ChatGPT 新增兩項高級安全防護措施,用以應對 AI 系統在對接網頁、外部應用場景中日益凸顯的提示注入攻擊風險,該類攻擊會被第三方利用誘導 AI 執行惡意指令或泄露敏感信息,新措施均建立在平臺現有沙箱機制、URL 數據外泄防護等多層安全體系之上。

image.png

此次推出的首個防護措施是Lockdown Mode(鎖定模式),這是面向高安全需求用戶的可選高級設置,並非面向普通用戶,核心通過嚴格限制 ChatGPT 與外部系統的交互方式降低數據外泄風險。該模式會確定性禁用或限制易被利用的工具能力,比如網頁瀏覽僅可訪問緩存內容,無強安全保證的功能將直接禁用。

目前該模式適用於 ChatGPT Enterprise、Edu、醫療和教師版,管理員可在工作臺設置中創建角色啓用,且能細粒度管控鎖定模式下可使用的外部應用及具體操作;OpenAI 還計劃未來數月將該模式開放給消費者用戶,同時 Compliance API Logs Platform 可輔助管理員實現應用使用、數據共享的監管審計

第二項措施是在ChatGPT、ChatGPT Atlas 與 Codex中,爲存在額外安全風險的功能統一標註 **“Elevated Risk(風險提升)”** 標籤,標準化風險提示方式。

OpenAI 表示,部分網絡相關能力雖能提升 AI 實用性,但存在尚未被行業防護措施完全解決的風險,標註標籤能讓用戶清晰知曉風險,自主決定是否使用,尤其適用於處理私密數據的場景。以 Codex 爲例,開發者開啓其網絡訪問權限時,界面會顯示該標籤,並明確告知啓用後的變化、潛在風險及適用場景,同時給出風險緩解建議。