OpenAI 新模型系統指令泄露，GPT-5.5 竟被禁止談論“哥布林”？

近日，隨着 OpenAI 旗下 Codex CLI 代碼的最新開源，關於下一代 AI 模型 GPT-5.5 的部分底層運行邏輯浮出水面。據科技媒體 Ars Technica 披露，在泄露的系統提示詞（System Prompt）中，出現了一項極爲罕見的指令：嚴禁模型在沒有明確關聯的情況下提及“哥布林”等特定生物。

在這份長達 3500 多個單詞的基礎指令集中，OpenAI 明確要求 GPT-5.5 在與用戶交流時，除非查詢內容存在絕對且必要的聯繫，否則必須迴避討論哥布林（goblins）、小精靈（gremlins）、浣熊（raccoons）、巨魔（trolls）、食人魔（ogres）以及鴿子（pigeons）。值得注意的是，這一禁令在文檔中重複出現了兩次，其優先級甚至與“禁止執行破壞性命令”和“禁用表情符號”等核心規範並列。

通過對比歷史版本的技術文件可以發現，這種針對特定生物的討論禁令在早期模型中從未出現。業界分析認爲，這並非某種營銷噱頭，而是針對新模型“幻覺”問題的定向修補。近期，社交平臺上已有不少用戶反饋，稱其在使用 AI 進行不相關對話時，模型會莫名其妙地輸出大量關於“哥布林”的內容，這種邏輯偏移嚴重影響了交互體驗。

針對這一現象，相關工程人員表示，這屬於針對性技術干預，旨在解決模型在生成控制上的不穩定性。儘管禁令涉及的生物名單看起來有些隨機，但它揭示了大模型在進化過程中，依然面臨着難以預測的輸出偏差挑戰。通過在系統底層設置“防撞牆”，開發團隊正試圖讓 AI 的邏輯表達更加聚焦與可控。

螞蟻集團牽頭推動ASL協議，填補智能體可信協作空白

隨着AI智能體向自主協作發展，企業安全挑戰從技術問題升級爲信任危機。螞蟻集團大安全CTO陳亮在第九屆數字中國建設峯會論壇上，首次揭示跨Agent協作中的三大“信任黑洞”，併發布面向企業級智能體的原生安全架構。這些黑洞源於協作中的信任缺失，成爲致命軟肋，需通過新架構應對。

OpenAI系統提示詞遭泄露，新模型GPT-5. 5 嚴禁討論“哥布林”

OpenAI最新開源的Codex CLI代碼意外曝光了GPT-5.5的系統提示詞，其中包含一條神祕指令：嚴禁在對話中談論“哥布林”及“小精靈”等幻想生物。這份長達3500多詞的基礎指令集顯示，除非用戶查詢存在絕對明確的關聯性，否則模型不得討論這些內容，旨在防範AI陷入特定幻覺。

OpenAI 新模型系統指令泄露，GPT-5.5 竟被禁止談論“哥布林”？

相關推薦

小紅書成立 AI 一級部門 “Dots”

小紅書重磅組織調整，柯南出任總裁併成立 AI 部門

螞蟻集團牽頭推動ASL協議，填補智能體可信協作空白

微軟第三財季營收突破 820 億美元，AI年收入激增123%成核心增長極

OpenAI系統提示詞遭泄露，新模型GPT-5. 5 嚴禁討論“哥布林”

OpenAI 新模型系統指令泄露，GPT-5.5 竟被禁止談論“哥布林”？

相關推薦

​小紅書成立 AI 一級部門 “Dots”

​小紅書重磅組織調整，柯南出任總裁併成立 AI 部門

螞蟻集團牽頭推動ASL協議，填補智能體可信協作空白

微軟第三財季營收突破 820 億美元，AI年收入激增123%成核心增長極

OpenAI系統提示詞遭泄露，新模型GPT-5. 5 嚴禁討論“哥布林”

小紅書成立 AI 一級部門 “Dots”

小紅書重磅組織調整，柯南出任總裁併成立 AI 部門