【AIbase報道】OpenAIが新世代のスマートブラウザ「ChatGPT Atlas」を積極的に推進している一方で、企業内セキュリティ責任者のDane Stuckey氏は最近、その潜在的なセキュリティリスクについて懸念を表明し、業界に注目を集めています。

Stuckey氏は、Atlasが直面する最大の課題の一つとして、「インスタントインジェクション(Prompt Injection)」攻撃が未解決であると指摘しています。この攻撃は、ウェブページやメール、または他のコンテンツに悪意のある指示を巧妙に埋め込み、AIエージェントが予期しない操作を実行させることを目的としています。その影響は、ユーザーの購入行動を妨げるだけでなく、電子メールの内容やログイン資格情報などの個人データが漏洩する可能性もあるのです。

OpenAI

彼は、OpenAIがすでに大規模なセキュリティテストを実施し、Atlasに多重の保護メカニズムと新しいモデルトレーニング方法を取り入れていることを認めつつも、「インスタントインジェクション」は一時的には根絶できない複雑なオープン問題であると語っています。

リスクを軽減するために、OpenAIはAtlasに2つの重要な防御措置を導入しました。1つは「サインオフモード」で、必要に応じてAIエージェントがユーザーのデータへのアクセスをブロックし、情報漏洩を根本から防ぐものです。もう1つは「モニターモード」で、これはセキュリティが重要なサイトに対して使用され、重要なインタラクションにおいてユーザーが人間による確認と監督を行うことで、操作の安全性を確保します。