隨着發佈預期的臨近,國產 AI 領軍者 DeepSeek V4 的更多技術細節浮出水面。據知名爆料方 Legit 披露,DeepSeek 已開始對其代號爲「sealion-lite(海獅輕量版)」的 V4 預覽版本進行閉門內測,相關參與方均簽署了嚴苛的保密協議。
相較於現有的 V3 模型,DeepSeek V4 將實現跨代際的跨越。新模型不僅原生具備多模態處理能力,更將上下文窗口直接拉昇至 100 萬 token。這意味着它能一次性“吞下”數本書籍或超長代碼庫,並進行深度邏輯推理。早期的測試反饋顯示,V4 在生成複雜 SVG 矢量圖形等高難度任務上效果驚豔,性能顯著優於目前網頁端及 App 端的在線模型。
AIbase 瞭解到,DeepSeek V4 預計將是一款萬億參數級別的巨型基礎模型。正是由於模型規模的指數級增長導致訓練週期拉長,其發佈時間較原計劃有所延後。值得關注的是,DeepSeek 在發佈前打破了行業慣例,並未向英偉達、AMD 等美系芯片商提供預覽,而是選擇提前數週向包括華爲在內的中國芯片供應商開放訪問權限,以確保模型在國產算力平臺上完成深度適配與優化。
與此同時,DeepSeek 的 GitHub 倉庫近期也出現了密集更新。雖然多爲工程師節後的例行代碼整理,但也包含了大量與 API 集成相關的企業級解決方案。隨着“下週發佈”的傳聞愈演愈烈,全球開發者都在屏息以待,看這家以“高性價比、高性能”著稱的中國公司,將如何通過 DeepSeek V4 再次衝擊全球 AI 競爭格局。
概要:
🚀 參數規模飛躍:DeepSeek V4 定位萬億參數級模型,支持百萬級長文本輸入,原生多模態能力將帶來更強的邏輯與創作表現。
🇨🇳 國產算力優先:公司轉而優先適配華爲等中國芯片供應商,旨在降低對外部供應鏈依賴,並針對國產硬件進行深度性能調優。
🗓️ 發佈進入倒計時:輕量版內測已低調開啓,外媒預測最快將於下週官宣,這一動作已引發全球 AI 社區及資本市場的高度警覺。
