在最新發佈的 DeepSeek V4中文大模型測評中,SuperCLUE 團隊的結果顯示,DeepSeek-V4-Pro 以其卓越的綜合表現重新奪回國內第一的位置,而 Flash 版本則緊隨其後位居第二。這一成就標誌着國產開源模型在技術上的又一次突破。

本次測評涵蓋了數學推理、科學推理、代碼生成、智能體任務規劃、指令遵循和幻覺控制等六個維度。DeepSeek-V4-Pro 以70.98分的高分領先,Flash 版本也取得了68.82分的優異成績,兩者的得分均顯著高於國內其他同類模型。
DeepSeek V4系列採用了全新的注意力機制,支持百萬級長上下文,同時有效降低了算力與顯存的佔用。這使得該系列在搭配國產芯片時,整體效率得到了顯著提升。與上一代 V3.2相比,Pro 版本在智能體能力上提升超過20分,數學推理提高近10分,指令遵循的得分增加近12分,幻覺控制同樣有了明顯的優化。

在 Flash 版本方面,它在保持高效推理的同時,也在智能體與數學推理上實現了大幅提升,性價比表現突出。Pro 版本專注於高性能,適合複雜任務與專業場景,價格爲15元每百萬 Tokens。而 Flash 版本則以速度快、成本低著稱,API 價格僅爲1.25元每百萬 Tokens,非常適合日常使用。
儘管 DeepSeek V4在多個方面表現優秀,但測評中也指出,該模型在代碼生成和複雜指令執行等領域與海外頂尖模型相比仍存在一定差距。總體來看,DeepSeek V4憑藉其均衡的能力與合理的成本,在國內市場中穩穩立足,成爲日常辦公、開發創作及長文本處理的優質選擇。
劃重點:
🌟 DeepSeek-V4-Pro 在最新評測中榮登國內第一,Flash 版本緊隨其後。
🧠 測評覆蓋數學推理、科學推理等六個維度,Pro 版本得分達到70.98分。
💰 Pro 與 Flash 版本各有特色,前者適合複雜任務,後者則提供高性價比,便於日常使用。
