国内の大規模モデルのレースではハードウェア技術の突破が進んでいます。6月1日、シユーテクノロジーは新世代の大規模言語モデル「MiniMax M3」を正式に発表しました。このモデルは先端的なプログラミング能力、最大で1M(100万)の超長文脈窓をサポートし、ネイティブなマルチモーダルインタラクション機能を持ち、国内で初めてこの3つの最高レベルの技術指標を同時に備えたモデルとなりました。また、現在までに世界で唯一このような性能を持つオープンソースモデルでもあります。

大規模モデルのコア競争力の評価において、MiniMax M3は非常に優れた成績を収めています。特に挑戦的なプログラミング評価セットであるSWE-Bench Proにおいて、M3は59.0%という優れたスコアを達成し、これはGPT-5.5やGemini3.1Proを上回り、業界の基準となるClaude3.5Opus(原文ではOpus4.7に近い)に近づいています。また、AIエージェントのスケジューリング能力を測るClaw-Eval評価や、マルチモーダルドキュメント解析能力をテストするOmniDocBenchテストにおいても、M3は業界最高スコアを獲得したか、またはGemini3.1Proを上回りました。

image.png

M3は性能向上と同時に効率的な運用を維持できているのは、その下層構造の重要な革新によるものです。このモデルは新しいスパースアテンション構造MSA(MiniMax Sparse Attention)を採用しています。この下層論理によって、モデルは100万の超長文脈を処理する際、各トークンあたりの計算量が前世代モデルの1/10にまで圧縮されました。これにより、速度の飛躍的向上が実現され、Prefilling(プリフィリング)段階ではモデルの実行が9倍以上高速化され、Decoding(デコード生成)段階では15倍以上の高速化を達成しました。これにより、計算リソースのコストが大幅に削減されました。

ネイティブなマルチモーダルモデルとして、M3はテキストの深い理解だけでなく、画像や動画の主動的な入力をサポートし、高難度のコンピュータデスクトップの自動化作業にも対応しています。モデルの発表に合わせて、MiniMaxは自社のAIプログラミングアシスタント製品MiniMax Codeを同時にアップグレードし、開発者向けに新たなToken Planサブスクリプションプランをリリースしました。プランはPlus(49元/月)、Max(119元/月)、Ultra(469元/月)の3つに分かれ、異なる規模の開発ニーズに対応しています。