8月28日に公開された中国語マルチモーダル視覚言語モデルの評価基準「SuperCLUE-VLM」のランキングで、Gemini-2.5-Proは総合得点74.99点で1位を獲得し、OpenAIのGPT-5(high)は68.59点で2位となりました。

この基準は中国語のシナリオに特化しており、基礎認知、視覚的推論および視覚的応用という3つの主要な次元を中心に評価体系を構築し、マルチモーダル視覚言語モデルの発展に対して客観的で公正な評価基準を提供することを目指しています。
今回の評価にはClaude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latestなど、計15のマルチモーダルモデルが含まれており、国内外の主流モデルが網羅されています。

最終的に、Gemini-2.5-Proは総合得点74.99点で1位となり、OpenAIのGPT-5(high)は68.59点で2位となり、また百度のERNIE-4.5-Turbo-VLは他の国内モデルと並んで、強い市場競争力を示しました。
