正文

DeepSeek V4 中文大模型評測：再創國內第一輝煌！

發布於AI新閒資訊

時間 :Apr 28, 2026

閱讀 :1分鐘

在最新發佈的 DeepSeek V4中文大模型測評中，SuperCLUE 團隊的結果顯示，DeepSeek-V4-Pro 以其卓越的綜合表現重新奪回國內第一的位置，而 Flash 版本則緊隨其後位居第二。這一成就標誌着國產開源模型在技術上的又一次突破。

本次測評涵蓋了數學推理、科學推理、代碼生成、智能體任務規劃、指令遵循和幻覺控制等六個維度。DeepSeek-V4-Pro 以70.98分的高分領先，Flash 版本也取得了68.82分的優異成績，兩者的得分均顯著高於國內其他同類模型。

DeepSeek V4系列採用了全新的注意力機制，支持百萬級長上下文，同時有效降低了算力與顯存的佔用。這使得該系列在搭配國產芯片時，整體效率得到了顯著提升。與上一代 V3.2相比，Pro 版本在智能體能力上提升超過20分，數學推理提高近10分，指令遵循的得分增加近12分，幻覺控制同樣有了明顯的優化。

在 Flash 版本方面，它在保持高效推理的同時，也在智能體與數學推理上實現了大幅提升，性價比表現突出。Pro 版本專注於高性能，適合複雜任務與專業場景，價格爲15元每百萬 Tokens。而 Flash 版本則以速度快、成本低著稱，API 價格僅爲1.25元每百萬 Tokens，非常適合日常使用。

儘管 DeepSeek V4在多個方面表現優秀，但測評中也指出，該模型在代碼生成和複雜指令執行等領域與海外頂尖模型相比仍存在一定差距。總體來看，DeepSeek V4憑藉其均衡的能力與合理的成本，在國內市場中穩穩立足，成爲日常辦公、開發創作及長文本處理的優質選擇。

劃重點:

🌟 DeepSeek-V4-Pro 在最新評測中榮登國內第一，Flash 版本緊隨其後。

🧠 測評覆蓋數學推理、科學推理等六個維度，Pro 版本得分達到70.98分。

💰 Pro 與 Flash 版本各有特色，前者適合複雜任務，後者則提供高性價比，便於日常使用。

英偉達砸15億美元聯手Amkor擴產先進封裝提前卡位AI算力供應鏈

英偉達與安靠達成約15億美元多年協議，由英偉達預付支持安靠在亞利桑那州擴建先進封裝產能，共同研發面向AI及數據中心加速計算的高密度互連與異構集成等封測技術，以實現不同工藝芯片與組件的高效整合。

Jul 24, 2026

59.0k

OpenAI全面開放ChatGPT Health功能：整合Apple Health與電子病歷，每週 3 億用戶諮詢健康問題

OpenAI全面開放ChatGPT Health功能，取消候補名單，面向全美18歲以上用戶，所有版本均可在網頁及iOS端使用。該功能接入Apple Health與電子病歷，實現健康數據整合。用戶每週健康諮詢量已從2.3億增至超3億，AI健康管理需求旺盛。

Jul 24, 2026

90.8k

馬斯克官宣 Grok 4.5 全平臺上線：比不過 Fable，但快、便宜、能幹活

馬斯克在社交平臺官宣Grok 4.5全平臺上線，直言性能不及Fable，但突出其高速、高性價比和任務執行力。在算力成本被反覆權衡的當下，這款模型定位實用主義，主打“最快、最划算、最成事”的賣點。

Jul 24, 2026

166.7k

Stripe洽購AI模型聚合平臺OpenRouter，估值或從 13 億飆升至 100 億美元

支付巨頭Stripe正洽談收購AI模型聚合平臺OpenRouter，交易或很快宣佈，但仍有破局或競購可能。OpenRouter原估值約13億美元，若能成交，估值可飆至約100億美元，溢價近8倍。該平臺提供統一API接口，讓用戶便捷調用OpenAI、Anthropic等多家大語言模型，被稱作“AI模型路由器”。

Jul 24, 2026

93.5k

Runway推出生成式媒體AI模型路由平臺系統，全面開啓開發者架構服務

2026年7月23日，Runway推出智能模型路由系統Media Router，內置於開發者平臺Runway Dev，統一調度圖像、視頻、音頻生成模型。系統依據質量、延遲和成本偏好，自動調用最優模型（涵蓋第三方與自研）。目前已與Adobe、Cloudflare、ElevenLabs等合作。

Jul 24, 2026

83.3k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

DeepSeek V4 中文大模型評測：再創國內第一輝煌！

相關推薦

英偉達砸15億美元聯手Amkor擴產先進封裝 提前卡位AI算力供應鏈

OpenAI全面開放ChatGPT Health功能：整合Apple Health與電子病歷，每週 3 億用戶諮詢健康問題

馬斯克官宣 Grok 4.5 全平臺上線：比不過 Fable，但快、便宜、能幹活

Stripe洽購AI模型聚合平臺OpenRouter，估值或從 13 億飆升至 100 億美元

Runway推出生成式媒體AI模型路由平臺系統，全面開啓開發者架構服務

英偉達砸15億美元聯手Amkor擴產先進封裝提前卡位AI算力供應鏈