アリババが新しいQwenモデルを発表、3秒の音声で声をクローン

最近、アリババクラウドのQwenチームは、テキスト指令を通じて音声を生成またはクローンするための2つの新しいAIモデルをリリースしました。そのうちの1つであるQwen3-TTS-VD-Flashモデルでは、ユーザーが詳細な説明に基づいて音声を生成でき、例えば感情や話しのペースなどの音声の特徴を正確に定義できます。

例えば、「中年男性、太い男声――元気で力強い広告ナレーション、早口、過剰なトーンの変化、売買を促すような声」を要求して音声を生成することが可能です。メーカーの説明によると、このモデルはOpenAIが最近リリースしたGPT-4o mini-tts APIよりもパフォーマンスが優れています。

もう一つのモデルであるQwen3-TTS-VC-Flashは、わずか3秒の音声だけで音声をコピーし、10言語での再現が可能です。Qwenは、このモデルが競合他社（例：ElevenlabsやMiniMax）よりも誤り率が低いと主張しています。

さらに、このAIは複雑なテキストを処理し、動物の鳴き声を模倣し、録音から音声を抽出することもできます。2つのモデルはともにアリババクラウドのAPI経由でアクセス可能であり、ユーザーはHugging Faceプラットフォームでモデルのデモを試すこともできます。

ポイント:
🌟 新しいQwenモデルは、テキスト記述を通じて音声を生成およびクローンすることが可能です。
🎤 Qwen3-TTS-VC-Flashは3秒以内で音声をコピーし、10言語に対応しています。
🚀 モデルの性能は競合より優れており、複雑なテキスト処理や音声模倣に適しています。

AIの波がサポート！アリババクラウドの中国市場シェアが36％に上昇し、3四半期連続増加で首位を維持

世界中でのAI需要の急増により、中国クラウドコンピューティング市場の構造が変化しました。アリババクラウドは2025年第三四半期に市場シェアを34％から36％に引き上げ、3四半期連続で増加しており、AIがその主要な成長要因となっています。

画像編集を統合したQwen-Image-2.0のリリース：2Kの高精細な質感が視覚の限界に挑戦

アリババクラウドは、2026年2月10日に新世代の画像生成基盤モデル「Qwen-Image-2.0」をリリースしました。このモデルでは画像生成と編集機能が統合されています。7Bの軽量アーキテクチャを採用しており、高速な推論を維持しつつ、4つの主な強みを持っています。専門的なテキストレンダリング能力、最大で1,000トークンの超長かつ複雑な指示処理への対応、そして多数の盲測基準において優れたパフォーマンスを発揮しています。

アリババクラウドがPolarDB AIデータハブデータベースを発表、AIネイティブデータベースの新時代を開く

アリババクラウドは2026年の開発者カンファレンスでPolarDBの重要なアップグレードを発表し、AIデータハブデータベースなどのネイティブAI機能を導入して、データベースが「クラウドネイティブ」から「AIネイティブ」へと進化を推進しました。初めて「AI対応データベース」の4つの技術的支柱を提唱し、基盤の構造を再構築することで開発のハードルを低下させ、大規模なモデルの能力をデータベースのコアに深く統合しました。

アリババクラウドがマルチモーダルインタラクション開発キットを公開！通義千問、ワンシャン、バイリンを統合し、AIメガネやロボットなどのスマートハードウェアを支援

アリババクラウドはマルチモーダルインタラクション開発キットをリリースしました。この開発キットは通義千問の3つの基本モデルと深く統合されており、さまざまなシナリオ向けのAIエージェントとMCPが事前に設定されており、スマートハードウェアに「開封してすぐに使用できる」AI機能を提供し、スマート化の門檻を下げるものです。AIメガネや学習機器などのエンドデバイスを支援します。

アイシテクノロジーとアリババクラウドが全面協力契約を締結 AIビデオのグローバル化を推進

アイシテクノロジーとアリババクラウドは全面的な協力契約を締結しました。両社はAIビデオ生成分野で深く協力し、モデル、計算リソース、製品、エコシステムおよびビジネスなど多方面にわたって取り組む予定です。技術の発展を共同で推進するものです。アリババクラウドはアイシテクノロジーにインフラストラクチャの支援を提供し、そのグローバルな展開を支援します。