最近、コンピュータビジョンのトップ会議であるCVPR 2026 NTIRE画像検出チャレンジで、アリババグループは「複雑な実際のシナリオにおけるロバスト性サンプルテスト」および「顔認識の異常検出」の2つのレースで優勝し、AI時代における決済、コンテンツセキュリティ審査、金融身分認証などの場面でのリスク識別能力をさらに向上させる重要な支援を提供しました。

現在、ディープフェイク(Deepfake)とAIGCの乱用リスクが高まっており、人間の目では真偽が見分けられず、既存の検出モデルも現実的なシナリオやマルチモーダル大規模モデルの急速な進化に直面した際に、正確率が急激に低下しています。今回のCVPRチャレンジはこの問題点に直接取り組み、モデルが「未知の生成構造」と「複雑な劣化の干渉」の二重の極限的な試験に耐え、高い正確性と強いロバスト性を維持することを求めていました。

アリババグループは決済シーンから始まり、過去20年間で蓄積したセキュリティ技術は国際的に先進的であり、その優位性はAIセキュリティ分野にも引き継がれています。アリババグループはDINOv3のビジュアル基礎モデルに基づく検出フレームワークを提案し、AIGC検出が研究室から現実的なシナリオへの能力の飛躍を実現しました。

「複雑な実際のシナリオにおけるロバスト性サンプルテスト」のレースにおいて、アリババAIセキュリティラボの参加チームは数百万の高品質なサンプルを含む複雑なトレーニングコーパスを構築し、WildFake、Z-Image、Seedream、Nano-banana-proなどのオープンソースデータセットおよび最先端モデルをカバーしています。ベース層では双流並行統合アーキテクチャを使用しており、検出モデルに2つの補完的な目を備え、画像の局所的な詳細と全体的な特徴をそれぞれ捉えています。チームは画像が単一のノイズから多重な劣化までを含む全チェーンの劣化効果を模擬し、ソーシャルプラットフォーム上の伝播や二次的な撮影などの現実的なシナリオの画像劣化特性を深く再現し、モデルの現実的なシナリオにおける検出能力を大幅に向上させました。

また、チームは「まず疑いのある領域を特定し、その後詳細を検査する(Locate-Then-Examine)」という2段階の検出パラダイムを提案し、局所的な領域のテキスト説明を提供するデータセットFakeXplainedを構築しました。疑いのある画像に対して、この方法はAIによって生成されたものかどうかを正確に判断できるだけでなく、画像上に偽造の欠陥や物理的常識に反する領域を特定し、同時に詳細な説明を同期して生成できます。この方法は従来の「ブラックボックス」検出の制約を突破し、モデルの決定が「根拠がある」ようにします。技術専門家がディープフェイクの課題に共同で対応できるようにするため、チームはGitHubを通じて業界内で最も包括的なAIGC画像動画検出リソースウェアハウスを開発しました。

「顔認識の異常検出」のレースにおいて、アリババインターナショナルの参加チームは顔画像の異常領域を正確に特定する技術力により優勝しました。この技術は顔画像中の異常領域を正確に識別・特定でき、主に金融取引の身分確認、口座開設資料の審査などに使用され、ディープフェイクによる偽造やAIGC攻撃の防止に重要な技術的保障を提供します。国際的な決済や金融サービス分野において、アリババインターナショナルはAIGC識別の技術をEKYC、証憑、資料の偽造防止に深く応用し、あらゆる生成コンテンツの検出能力を確保しています。

CVPRはIEEEが主催する国際的なコンピュータビジョンとパターン認識の会議であり、ICCV、ECCVとともにコンピュータビジョン分野の世界三大主要会議として知られています。このチャレンジには500以上の国内外のチームが参加しました。