近日,Anthropic 工程團隊分享了他們在開發三款 AI 產品 ——claude.ai、Claude Code 和 Claude Cowork 時構建安全隔離系統的經驗與教訓。這三款產品分別面向普通用戶、開發者和企業用戶,其隔離策略和風險模型各具特色,但都遵循 “環境層隔離優先” 的核心原則。

image.png

在面向普通用戶的 claude.ai 中,Anthropic 採用了基於 gVisor 的臨時容器方案。每當用戶發起會話時,系統便會生成一個臨時容器,待會話結束立即銷燬這樣的設計旨確保用戶 AI 之間的互短暫且安全,限制了資源訪問和能力,這樣即使發生風險事件,影響範圍也僅限於單次會話。

針對開發者,Claude Code 則利用操作系統級沙箱機制,優化了工作流程。開發者在使用時默認無法訪問網絡,這樣可以減少頻繁出現的權限提示,顯著提升使用體驗。據統計,這一設計使得權限提示的出現頻率降低了 84%。當開發者需要網絡訪問時,可以通過明確授權進行臨時開放。

對於需要最高安全性的企業用戶,Claude Cowork 使用虛機級別的隔離方案,確保與主機系統完全分離。這種方案雖提供了最佳的安全性,但同時也降低了與宿主系統的集成能力,給安全監控帶來了新的挑戰。

文章中還提及了幾起安全事件,其中最引人注目的是通過釣魚攻擊進行的提示詞注入。在 24 次測試中,成功率高達 96%。此外,還有通過攻擊者控制的 API 密鑰進行數據竊取等問題。這些事件促使 Anthropic 不斷改進其安全架構。

Anthropic 總結了三條關鍵原則:首先,環境層隔離優先,模型層引導;其次,隔離強度要與用戶監督能力相匹配;第三,警惕定義組件。這些原則不僅對 Anthropic 的產品設計具有指導意義,也爲整個行業了重要的警示。

劃重點:  

🔒 環境層隔離先:不同產品採用不同隔離策略,以提升安全性。  

🛠️ 角色定位明確:claude.ai、Claude Code 和 Claude Cowork 分別針對普通用戶、者和企業用戶設計。  

⚠ 安全事件警示:實測中發現釣魚攻擊的高成功率,促使持續改進安全措施。