最新のSemiAnalysis InferenceMAXベンチマークテストにおいて、Signal65はDeepseek-R1 0528メタエキスパート(MoE)モデルの推論性能を分析し、その結果、NVIDIAのGB200 NVL72ラックシステムが同規模のAMD Instinct MI355Xクラスターと比較して大幅に優れたパフォーマンスを示したことが判明しました。メタエキスパートモデルの特徴は、タスクの種類に応じて最適な「エキスパート」を起動して処理を行うことで、この設計により効率性が向上しますが、大規模な拡張時にはノード間の通信遅延や帯域幅の圧力が発生し、計算のボトルネックになることがあります。

NVIDIAは「極限的な協調設計」戦略を通じて、GB200 NVL72のアーキテクチャを最適化しました。このシステムは72個のチップを密接に接続し、最大30TBの共有メモリを備え、データ転送効率を顕著に向上させ、遅延問題を解決しました。テストデータによると、GB200 NVL72は同等構成下で各GPUのトランザクション速度が75トークン/秒に達し、AMD MI355Xの28倍の性能を発揮しています。

超大規模なクラウドサービス会社にとって、全体所有コスト(TCO)は非常に重要な考慮事項です。Signal65はOracleクラウドの価格データを基に、GB200 NVL72が強力な性能を持ちながらもコストパフォーマンスにも注目すべきことを指摘しています。1トークンあたりの相対的なコストはAMDソリューションの1/15であり、さらに高いインタラクティブレートを提供しています。

英伟達がメタエキスパートモデル分野で主導権を握っているものの、AMDには独自の競争優位性があります。報告書では、AMDのMI355Xは高容量のHBM3eメモリを備えているため、密なモデル環境において依然として競争力のある選択肢であると指摘されています。現在のところ、AMDはGB200 NVL72の挑戦に対応する新たなラックレベルのソリューションをまだ提供していません。しかし、AMDのHeliosプラットフォームとNVIDIAのVera Rubinプラットフォームの競争がますます激しくなる中、今後ラックレベルの拡張ソリューションにおける競争はさらに熾烈になる見込みです。

ポイント:  

🟢 NVIDIAのGB200 NVL72の性能はAMD MI355Xの28倍で、顕著な優位性を維持しています。  

🟢 GB200 NVL72はアーキテクチャの最適化と高速共有メモリにより、データ転送の遅延問題を解決しています。  

🟢 英伟達が優位に立っていますが、AMDは密なモデル領域において競争力を維持しており、今後の競争がさらに激しくなる見込みです。