在剛剛公佈的 SuperCLUE-VLM12月多模態視覺語言基準測評中,全球 AI 大模型展現出了極強的競爭態勢。本次測評從基礎認知、視覺推理以及視覺應用三個核心維度展開,全方位考察了各大模型的“眼力”與“腦力”。

image.png

在此次角逐中,谷歌推出的Gemini-3-pro以83.64分的絕對優勢摘得桂冠。詳細數據顯示,其在三項細分指標上均實現了全面領先,展現了國際頂尖模型的深厚底蘊。而在國產模型方面,整體表現同樣亮眼。商湯科技的 SenseNova V6.5Pro 以75.35分緊隨其後位居次席,字節跳動旗下的豆包視覺版則以73.15分成功闖入前三。值得一提的是,豆包在基礎認知方面的表現甚至超越了部分國際強敵。

此外,百度 ERNIE-5.0-Preview 與阿里巴巴的 Qwen3-vl 也成功進入榜單前五。其中,Qwen3-vl 更是成爲榜單中首個總分突破70分大關的開源模型,爲開源社區貢獻了極強的視覺解析能力。

相比之下,部分國際老牌勁旅的表現略顯乏力。Anthropic 的 Claude-opus-4-5獲得71.44分,而 OpenAI 的 GPT-5.2(high) 則意外跌出第一梯隊,僅以69.16分排名靠後。這一排名的變動,也標誌着多模態 AI 領域的競爭正進入白熱化的階段。

劃重點:

  • 🏆 全球領跑:谷歌 Gemini-3-pro 以83.64分奪冠,在基礎認知、視覺推理和應用三項指標上均位列第一

  • 🇨🇳 國產爆發:商湯 SenseNova 與字節跳動豆包分列二、三名,展現了中國大模型在視覺理解領域的強勁競爭力。

  • 📊 行業洗牌:Qwen3-vl 成爲首個破70分的開源模型,而 GPT-5.2(high) 在本次視覺測評中表現不及預期,位居後列。