在即將開幕的第九屆數字中國建設峯會上,中國移動自主研發的“九天”35B通用大模型將正式與公衆見面。作爲國產算力生態的重要進展,摩爾線程於近日宣佈,旗下旗艦級全功能GPU MTT S5000已率先完成對該模型的全流程適配與推理驗證。
此次適配工作的核心在於深度融合。摩爾線程依託自研的MUSA軟件棧以及SGLang-MUSA高性能推理引擎,成功打通了“九天”35B模型推理的全鏈路。通過對MUSA C開發框架、muDNN計算庫及MATE開源算子庫的協同優化,MTT S5000針對大模型特有的注意力機制和長序列推理進行了深度定製,從而確保模型在處理長文本和高併發請求時能夠保持高效且穩定的性能表現。

作爲本次適配的技術底座,MTT S5000算力卡表現搶眼。該顯卡基於第四代MUSA“平湖”架構打造,單卡AI稠密算力最高可達1000TFLOPS。硬件配置上,它配備了80GB的大容量顯存,顯存帶寬達到1.6TB/s,並支持從FP8到FP64的全精度計算。此外,高達784GB/s的卡間互聯帶寬,也爲其在複雜智算場景下的擴展性提供了保障。
此次合作不僅驗證了國產GPU在支撐央企核心大模型方面的可靠性,也展示了摩爾線程在高性能算子優化與軟件生態構建上的成熟度。隨着“九天”35B模型的正式發佈,這種“國產大模型+國產算力”的組合,將爲算力自主可控提供更具參考價值的落地案例。
