記事本文

話せ、歌える、おどける！小米がMiMo-V2-TTS大モデルを発表。中国語の方言や感情を自在に扱う

公開AI二ュ-ス

時間 :Mar 19, 2026

読む :1分

音声合成技術は「機械的な読み上げ」から「感情の共鳴」へと質的な飛躍を遂げています。3月19日、小米は自社開発の音声合成大規模モデル Xiaomi MiMo-V2-TTS を正式にリリースしました。これは単なる「機械が話すためのツール」ではなく、演じる、話す、歌うという多機能な「総合的声優」としての役割も果たします。

MiMo-V2-TTS は、小米が独自開発した Audio Tokenizer（音声トークナイザ）およびマルチコードブック音声-テキスト連合モデリング構造に基づいています。数十億時間分の音声データで大規模な事前トレーニングを行った結果、驚くほどの多スケールの音声スタイル制御能力を示しています:

感情の専門家: モデルは全体的なトーンから局所的な感情に至るまで、正確な調整が可能です。同じ文の中で、話し方の自然な転換や感情の繊細な変化を実現し、人間が話す際の自然なリズムを完璧に再現できます。
異分野の歌手: 話すだけでなく、高品質な歌唱合成能力も備えており、音程とリズムを正確に表現し、自然で表現力豊かな歌い方が可能です。
方言のプロ: 異なる地域のユーザーの使用習慣に近づけるために、モデルは東北語、四川語、河南語、広東語、台湾風などの多様な方言をサポートしており、キャラクターやスタイルに応じた表現も可能です。

注目すべき点は、MiMo-V2-TTS がインターフェースのコストを大幅に簡略化していることです。テキスト内の句読記号、イントネーションや強調記号を自動的に認識し、適切な音声表現に変換することができます。ユーザーが追加のラベリングや手動の操作を行う必要はありません。

小米にとって、この大規模モデルのリリースは、音声技術のロードマップにおいて重要な節目です。今後の計画では、中国語と英語以外の多くの言語をカバーし、MiMo-V2-Omniのマルチモーダル理解能力と深く統合する予定です。

AIエージェントが世界を理解するだけでなく、感情を引き出すような人間らしい声で世界を語れるようになるとき、人間と機械のインタラクションの未来が明らかになります。MiMo-V2-TTS

トマトオムライスの調理をロボットに学ばせる裏方：Genesis AI オープンソース全スタックトレーニング場

Genesis AI社はWorld 1.0プラットフォームをオープンソース化しました。このプラットフォームは、ロボットや物理AI開発者向けに高性能な全スタックシミュレーションインフラストラクチャを提供し、コンピューターシミュレーションで効率的に訓練を可能にし、ロボットが調理などといったスキルを学ぶ際の障壁を低減し、具身知能の実用化を加速します。

Jul 3, 2026

2,400.6k

科学の新しい時代：AIエージェント Elements Claw が超伝導材料の開発を成功させた

アリババダモアカデミー、中国人民大学、中国科学院大学が共同で世界初の超伝導材料発見AIエージェント「Elements Claw」を発表。支援から独立研究への飛躍を実現し、試行錯誤に依存した長期間の従来型開発を変革する高効率自動化パラダイムを提供。....

Jul 3, 2026

216.3k

AI動画分野の構造が再編：グーグルのGemini Omni Flashが盲測ランキングで首位に

グーグルDeepMindのテキストからビデオを生成するモデルであるGemini Omni Flashが、信頼性の高い盲測ランキング「Video Arena」で1404Eloポイントを獲得し、第一位に躍り出た。これはグーグルのマルチモーダル技術の実力を示しており、ビデオ生成分野が急速に進化し続けていることを裏付ける。

Jul 3, 2026

210.7k

マイクロソフト AI PC専用システム Project Aionが暴露、従来のスタートメニューを完全に取り除く

マイクロソフトの社内AI OS「Project Aion」が明らかに。AI PC向けで、EdgeとWeb軽量化技術を基盤に、従来のスタートメニューやデスクトップアイコンを廃止。タスクバーからCopilotを直接呼び出す唯一の操作口で、情報フィード・創作・リアルタイム情報に特化。独自の「スペース」機能でウェブページを自動分類し、対話ロジックを根本的に再設計。....

Jul 3, 2026

221.1k

アリババ内部の逆方向無効化：ClaudeシリーズAIツールを全品下架

阿里巴巴が社内通達を発行し、7月10日までにAnthropic Claudeシリーズの全製品（SonnetやOpusなどのモデル、Claude Codeなどのツール）の使用停止を命じた。年初のAI利用開放・社内モデル無料枠提供の方針と対照的で、自社開発回帰への戦略転換を示す。....

Jul 3, 2026

267.0k

インテリジェントな未来、あなたの人工知能ソリューションシンクタンク

English 简体中文繁體中文にほんご

話せ、歌える、おどける！小米がMiMo-V2-TTS大モデルを発表。中国語の方言や感情を自在に扱う

関連推奨

トマトオムライスの調理をロボットに学ばせる裏方：Genesis AI オープンソース全スタックトレーニング場

科学の新しい時代：AIエージェント Elements Claw が超伝導材料の開発を成功させた

AI動画分野の構造が再編：グーグルのGemini Omni Flashが盲測ランキングで首位に

マイクロソフト AI PC専用システム Project Aionが暴露、従来のスタートメニューを完全に取り除く

アリババ内部の逆方向無効化：ClaudeシリーズAIツールを全品下架