企業向けAIエージェント(Autonomous Agents)が実験室から本格的な業務システムへと移行する中、AIが「反逆」したり、プロンプトインジェクションによってデータ漏洩を引き起こすことを防ぐことが、開発者にとって最も頭の痛い問題となっています。

3月17日、NVIDIA(英伟达)Cisco(シスコ) は共同で、画期的なソリューションを発表しました。それは、正式にオープンソース化されたAIエージェントの実行環境 OpenShell です。このシステムは、長期間運用されるAIエージェントに対して「ファイアウォール」を構築することを目的としており、企業が大規模な自動化を実現する際にも、AIのすべての行動を正確に管理できるようにします。

OpenShell のコアとなるロジックは非常に堅牢です。それぞれのAIエージェントに対して物理的に隔離された「サンドボックス」環境を提供し、この環境ではエージェントはデフォルトであらゆる権限を持ちません。外部へのアクセスやツールの呼び出し、クラウド上のモデルのプライバシーデータのマスキングなど、すべての操作は細粒度のポリシーによる承認が必要です。

それに併せて利用されるのが、CiscoのAI Defenseセキュリティプラットフォーム です。OpenShellがエージェントが「何ができるか」を規定するものであるのに対し、AI Defenseはエージェントが「実際に何をしたか」をリアルタイムで監査します。これは、エージェントの推論ステップや意思決定プロセスを24時間体制で記録し、すべてのスキル呼び出しがサプライチェーンセキュリティレビューを通ることを保証します。

このような階層型セキュリティアーキテクチャは、実際のシナリオにおいて非常に強力です。例えば、企業が新しいゼロデー脆弱性攻撃に遭った場合:

内部のAIエージェントは自動的にセキュリティ公告を解析し、ネットワーク知識グラフを使って影響を受けたデバイスを特定します。

この複雑な分析および修復プロセスは、OpenShell サンドボックス内で実行されます。

もしエージェントが修復中に悪意のある命令の注入を受け、機密設定を盗もうとする場合、AI Defenseゲートウェイは即座に異常なリクエストをブロックします。

英伟达は、このアーキテクチャの目標はAIの「ブラックボックス状態」を終わらせることであると述べています。インフラレベルでのセキュリティ検証により、企業はAIエージェントがより複雑な自動化プロセスを担当しても、システムのセキュリティが制御不能になることを心配する必要がありません。OpenShell