小米の大規模モデルへの野望は、2026年春にすべて明らかになった。
3月19日、自社開発の3つの大規模モデルを正式に発表した。MiMo-V2-Pro、MiMo-V2-Omni、そしてMiMo-V2-TTS。これは技術的な通常のアップグレードではなく、小米が「エージェント(Agent)時代」に全面的に投資するための重要な節目である。
AIへの強い意欲を示すため、小米の創業者はその日のソーシャルメディアで明確に述べた。「今年、AI分野での研究開発と資金投入は160億元を超える予定だ」と語った。
彼はまた、1兆パラメータの大規模モデルであるMiMo-V2-Proが、世界の主要な大規模モデル総合知能ランキング「Artificial Analysis」で世界第8位となり、ブランド別に見ると世界第5位にランクインしていることを明らかにした。
3つのモデルはそれぞれ異なる役割を担い、エージェントのエコシステム全体を構築している:
エースベースのMiMo-V2-Pro: 高強度のエージェントシナリオに特化して設計されている。総パラメータ数は1兆に達し、ハイブリッドアテンションメカニズム(Hybrid Attention)を採用しており、42Bのアクティブパラメータで効率と容量のバランスを取っている。100万トークンの超長文脈をサポートし、複雑な論理的推論やツール呼び出しを主に扱う。
マルチモーダルベースのMiMo-V2-Omni: テキスト、ビジュアル、音声のネイティブな統合を実現している。感覚理解から動作実行に至るまでの一連のフローをつなぎ、エージェントが物理世界を感知するための鍵となる。
音声の大規模モデルMiMo-V2-TTS: エージェントに「温かさ」のある表現能力をもたらし、細粒度の感情制御をサポートすることで、機械とのインタラクションをより人間らしくしている。
商業化の面では、小米は非常に積極的な価格戦略を採用している。256Kの文脈以内の入力に対しては1ドル/百万トークンという価格であり、同クラスの競品よりも大幅に低い。現在、Pro版とOmni版の両方ともAPIサービスが公開されている。
注目すべきは、このAIの精鋭部隊の背後にいる人物である。「AI才女」と称される人物で、以前開発者コミュニティで話題となった謎のモデル「Hunter Alpha」は、MiMo-V2-Proの内側テストバージョンである。
