英偉達(NVIDIA)在AI大模型領域再次投下震撼彈。3月12日,英偉達正式發佈了專爲AI智能體(Agent)設計的新一代開源大模型——Nemotron3Super。該模型憑藉極高的推理效率和卓越的任務成功率,迅速成爲開源社區的焦點。

架構革新:推理速度暴增300%

Nemotron3Super採用了創新的 Mamba-MoE 混合架構,參數總量爲1200億,激活參數僅爲120億。這種設計讓其在保持強大性能的同時,推理速度提升了3倍,吞吐量更是暴漲5倍。此外,該模型支持高達1M 的超長上下文,有效解決了多智能體協同中常見的“目標跑偏”和“上下文爆炸”問題。

image.png

實力刷榜:開源界的“性能天花板

在多項權威測評中,Nemotron3Super表現搶眼。它不僅登頂了 Artificial Analysis 的效率與開放性榜單,更驅動英偉達自研的 AI-Q 智能體在 DeepResearch Bench 雙榜位列第一。值得注意的是,該模型在熱門智能體任務 OpenClaw 中的成功率高達85.6%,表現已逼近閉源大模型 Claude Opus4.6和 GPT-5.4。

適配“黑格爾”平臺:支持NVFP4訓練

爲了充分發揮自研硬件的優勢,Nemotron3Super除了支持 BF16和 FP8格式外,還專門針對英偉達最新的 Blackwell 平臺及後續架構支持了 NVFP4訓練。這一特性將進一步降低大模型的訓練成本並提升算力利用率。

生態聯動:大廠集體集成

目前,Nemotron3Super已被 Perplexity、Palantir、西門子及戴爾等多家科技巨頭集成,並同步上線 AWS、Azure 和 Google Cloud 等主流雲平臺。作爲一款開源免費的模型,它爲開發者提供了一個低成本、高性能的替代方案,極大地衝擊了當前閉源大模型的市場格局。