来月開幕する第9回デジタル中国建設峰会上、中国移動が自主開発した「九天」35B汎用大モデルが一般公開される。国内の算力エコシステムにおける重要な進展として、モールス・スレッドはこのほど、エッジ級のフル機能GPUであるMTT S5000がこのモデルの全フロー対応と推論検証を先に完了したことを発表した。
今回の対応作業の核心は深く統合することにある。モールス・スレッドは自社開発のMUSAソフトウェアスタックおよびSGLang-MUSA高性能推論エンジンに依拠し、「九天」35Bモデルの推論の全チェーンを成功裏に接続した。MUSA C開発フレームワーク、muDNN計算ライブラリ、MATEオープンソースオペレーターライブラリの協調最適化を通じて、MTT S5000は大モデル特有の注目メカニズムや長シーケンス推論に対して深いカスタマイズを行い、長文処理や高並列要求時の効率的で安定した性能を確保した。

今回の対応の技術基盤として、MTT S5000の算力カードは目立った性能を発揮した。このグラフィックカードは第4世代のMUSA「平湖」アーキテクチャに基づいて構築されており、単カードのAI密度高い演算能力は最大1000TFLOPSに達する。ハードウェア構成では、80GBの大容量VRAMを備え、VRAMバンド幅は1.6TB/sであり、FP8からFP64までのすべての精度計算をサポートしている。また、784GB/sのカード間接続バンド幅により、複雑な知的計算シーンでの拡張性を保障している。
今回の協力は、国内GPUが中央企業の主要大モデルを支えることの信頼性を検証しただけでなく、モールス・スレッドが高性能オペレーター最適化とソフトウェアエコシステム構築において成熟度を示した。今後、「九天」35Bモデルが正式リリースされることで、このような「国内大モデル+国内算力」の組み合わせは、算力の自主制御可能をより参考価値のある実践事例として提供するだろう。
