據《The Information》報道,深度求索計劃於2月中旬(農曆新年前後)推出其下一代旗艦大模型 DeepSeek-V4。此款新模型旨在顯著增強代碼生成和長代碼上下文處理能力,爲開發者提供更強大的支持。

DeepSeek-V4的發佈標誌着在去年12月推出的 V3.2之後的一次重要升級。在內部基準測試中,DeepSeek-V4的表現已經超越了 Anthropic 的 Claude 系列和 OpenAI 的 GPT 系列。特別是在長代碼提示處理方面,DeepSeek-V4展現出了其卓越的能力,這一突破將極大地提高其在複雜軟件工程場景中的穩定性和推理準確性。

image.png

知情人士透露,用戶將明顯感受到 DeepSeek-V4的回答更加條理清晰,反映出其更強的推理能力。這使得新版本在處理複雜任務時變得更加可靠。該模型在訓練過程中採用了全新的架構設計,使其在處理長序列時,能夠更好地理解數據模式,並在有限的計算能力下實現更高效的訓練。

值得一提的是,DeepSeek-V4的發佈時間安排與去年發佈的 R1模型類似。R1作爲一款開源推理模型,曾在全球範圍內引發了熱議,並推動了中國大模型廠商在2025年掀起開源競賽潮。

在過去的兩年中,深度求索已密集推出多款模型,包括 DeepSeek-Coder、DeepSeek-V2、DeepSeek-V3、DeepSeek-R1等,覆蓋代碼生成、數學運算、多模態處理與推理等多個領域。這些創新不僅爲開發者提供了強有力的工具,也爲人工智能的發展注入了新活力。

雖然 DeepSeek 尚未對此消息做出正式迴應,但市場對 DeepSeek-V4的期待可見一斑。隨着技術的不斷進步,深度求索勢必將繼續在人工智能領域扮演重要角色。