OpenAI 正採取一種“以毒攻毒”的新策略,來提升其代理式網頁瀏覽器 ChatGPT Atlas 的安全性。爲了應對日益複雜的網絡威脅,OpenAI 開發了一套“自動化攻擊者”系統,通過模擬真實黑客的攻擊手段,對 ChatGPT Atlas 進行全天候的壓力測試。

這套系統的核心在於對抗提示注入(Prompt Injection)攻擊。在這種攻擊中,惡意第三方會悄悄向 AI 代理髮送指令,誘導其執行違背用戶意願的操作,例如在用戶不知情的情況下轉發敏感郵件或刪除雲端文件。AIbase 獲悉,OpenAI 的“自動化攻擊者”利用了先進的強化學習技術,能夠自主發現人類紅隊測試中未曾察覺的新型攻擊路徑。

在一次實際演示中,這個 AI 攻擊者成功模擬了誘導 Atlas 向公司 CEO 發送辭職信的場景。雖然 Atlas 的防禦機制最終攔截了這一請求並提醒了用戶,但 OpenAI 坦言,安全博弈是一場持久戰。由於代理式瀏覽器需要深度介入用戶的數字化生活(如訪問郵件、日曆等),其便利性本身也帶來了更大的風險暴露面。

儘管技術手段在不斷進化,OpenAI 在最新報告中警示稱,由於 AI 代理的本質特性,這類安全威脅可能永遠無法被徹底“根治”。AIbase 提醒用戶,在享受 AI 瀏覽器帶來便利的同時,仍需保持警惕,關注官方發佈的實時安全響應與防護建議。