國產算力新突破！摩爾線程×硅基流動在MTT S5000上實現DeepSeek V3 671B滿血版高效推理，單卡性能逼近國際頂尖水平

國產AI芯片與大模型的協同優化迎來關鍵里程碑。近日，**摩爾線程與硅基流動聯合宣佈，基於國產GPU MTT S5000，成功完成對千億參數大模型 DeepSeek V3 671B “滿血版”的深度適配與性能驗證**。通過創新應用FP8（ 8 位浮點）低精度推理技術，實測性能表現亮眼：**單卡 Prefill（預填充）吞吐量突破4000 tokens/秒，Decode（解碼）吞吐超1000 tokens/秒**，整體推理速度已逼近國際主流高端AI加速卡水平。

這一成果意義重大。DeepSeek V3 671B作爲國內領先的開源大模型，參數規模龐大、推理負載極高，此前多依賴英偉達A100/H100 等高端GPU部署。此次在**完全國產化硬件平臺**上實現高效運行，不僅驗證了摩爾線程MTT S5000 在大模型推理場景下的真實能力，更標誌着國產AI算力生態正從“能跑”邁向“高效跑”的新階段。

關鍵技術突破在於FP8 低精度推理的深度優化。FP8 在保持模型精度損失極小的前提下，可顯著提升計算吞吐、降低顯存佔用與功耗。摩爾線程與硅基流動聯合完成了從底層驅動、算子庫到推理引擎的全棧調優，使MTT S5000 充分發揮FP8 硬件加速潛力，有效支撐了大模型高併發、低延遲的推理需求。

對於行業而言，這意味着國產替代路徑進一步清晰：**高性能大模型不再必須綁定海外高端芯片**。在當前全球算力供應鏈不確定性的背景下，MTT S5000 + DeepSeek V3 的組合爲金融、政務、能源等關鍵領域提供了高性價比、高安全性的本土化AI部署選項。

儘管在絕對峯值性能或軟件生態成熟度上，國產GPU與國際頂尖產品仍有差距，但此次實測數據表明，**在特定高價值場景下，國產方案已具備實用化競爭力**。隨着軟硬件協同優化持續深入，中國AI基礎設施的自主可控能力正加速成型——從“可用”到“好用”，只差一次又一次這樣的實測突破。

Runway推出Media Router：自動切換AI模型幫你省Token，創意驗證到成片一條龍搞定

Runway推出Media Router，可依據質量、速度與成本優先級，爲圖像、視頻、音頻生成自動切換AI模型。系統將調用場景分爲三類，如高速生成模式用於快速創意驗證，實現智能匹配，省去開發者逐一比較和手動切換的負擔，兼顧效率與成本。

小鵬人形機器人廣州工廠開啓小批量試生產預計2026年實現量產

近日，小鵬人形機器人在廣州工廠正式開啓小批量試生產，量產產線已進入最後聯調，標誌着量產衝刺進入倒計時。集團董事長何小鵬已親自兼任機器人業務CEO，全面統籌並推進商業化落地進程。按照內部機器人量產動員大會規劃，公司將於2026年正式實現人形機器人量產，並計劃

國產算力新突破！摩爾線程×硅基流動在MTT S5000上實現DeepSeek V3 671B滿血版高效推理，單卡性能逼近國際頂尖水平

相關推薦

Kimi K3 攻防考卷翻車：漏洞利用只到美國前沿模型四成，蒸餾疑雲被安全機構擺上臺

Runway推出Media Router：自動切換AI模型幫你省Token，創意驗證到成片一條龍搞定

小鵬人形機器人廣州工廠開啓小批量試生產預計2026年實現量產

快手入局AI互動內容賽道，開放首批創作者招募

Google Q2 資本開支翻番破紀錄：449 億美元砸向 AI 基建，雲業務利潤率幾乎翻倍

國產算力新突破！摩爾線程×硅基流動在MTT S5000上實現DeepSeek V3 671B滿血版高效推理，單卡性能逼近國際頂尖水平

相關推薦

Kimi K3 攻防考卷翻車：漏洞利用只到美國前沿模型四成，蒸餾疑雲被安全機構擺上臺

Runway推出Media Router：自動切換AI模型幫你省Token，創意驗證到成片一條龍搞定

小鵬人形機器人廣州工廠開啓小批量試生產 預計2026年實現量產

快手入局AI互動內容賽道，開放首批創作者招募

Google Q2 資本開支翻番破紀錄：449 億美元砸向 AI 基建，雲業務利潤率幾乎翻倍

小鵬人形機器人廣州工廠開啓小批量試生產預計2026年實現量產