全球中文大模型竞赛！海外强者包揽前三，国产崭露头角！

近日，SuperCLUE 发布了2025年度中文大模型基准测评报告，吸引了众多科技爱好者的目光。在此次评测中，共有23个国内外大模型参与角逐，涵盖数学推理、科学推理和代码生成等六大核心维度。评测结果显示，海外闭源模型依旧占据领先地位，尤其是 Anthropic 的 Claude-Opus-4.5-Reasoning，以68.25分高居榜首，成为了此次评测的佼佼者。

紧随其后的是谷歌的 Gemini-3-Pro-Preview 和 OpenAI 的 GPT-5.2（high），分别以65.59分和64.32分位列第二和第三，海外巨头们的实力依然令人瞩目。不过，值得一提的是，国产大模型在此次评测中也展现出惊人的实力，特别是开源模型 Kimi-K2.5-Thinking 和闭源模型 Qwen3-Max-Thinking，分别以61.50分和60.61分荣获第四和第六名的好成绩。

全球中文大模型战力榜发布：前三被海外包揽国产有惊喜

在细分领域中，国产模型表现尤为突出。Kimi-K2.5-Thinking 在代码生成任务中以53.33分的优异成绩夺得了冠军，而 Qwen3-Max-Thinking 在数学推理任务中与 Gemini-3-Pro-Preview 并列，以80.87分的成绩荣登榜首。这些成绩表明，国产模型正逐步从 “跟跑” 向 “并跑” 迈进，展现出强大的追赶能力。

从整体来看，海外闭源模型仍然领先于国产模型，但国产开源模型却表现出色，在 Top5中占据了绝对优势，显示出国产开源模型的强劲实力与发展潜力。随着科技的不断进步和国内研发的加速，未来的中文大模型领域或将迎来更多惊喜与挑战。

全球中文大模型竞赛！海外强者包揽前三，国产崭露头角！

相关推荐

大模型赛道春风吹拂！港股概念股集体爆发，智谱暴涨超17%

大模型也能装进口袋！谷歌夏季将推珊瑚AI开发板，离线解锁实时语音翻译

程序员比 AI 还便宜？美国科技巨头烧不起 Token 纷纷开始反思

港股 AI 大模型板块持续发力：MiniMax、智谱涨势强劲

擎朗智能发布小尺寸人形机器人 XMAN-L1：轻量化“互动专家”正式上岗