2026年2月10日、アリババクラウドは新世代の画像生成基盤モデル「Qwen-Image-2.0」を正式にリリースしました。このモデルは通義千問における画像能力において重要な突破を示しており、「画像生成」と「画像編集」の両方の開発ラインを統合し、複数の盲測ベンチマークで優れた性能を示しています。

主要な技術革新
Qwen-Image-2.0は7Bの軽量アーキテクチャを採用しており、高速な推論を維持しながら以下の4つの核心的な利点を実現しています:
専門的なテキストレンダリング(「正確さ」と「多様性」): 最大1,000トークンの超長で複雑な指示に対応します。PPTページやプロフェッショナルな情報グラフ(A/BテストレポートやOKRワークメソッドの図解など)、中英語のポスターなどの場合でも、ピクセル単位での正確な配置と多メディアレンダリングが可能です。
極限のリアルな質感(「本物」): 2K解像度(2048×2048)をネイティブサポートし、肌の毛穴や繊細な織物の質感や建築の詳細をきめ細かく描写できます。映画ポスターなどの写実的なシナリオにおいて特に優れています。
統一された画像生成・編集機能: オムニ(全能)モデルとして、理解と生成の深層的な融合を実現しています。ユーザーは現在の画像上に書道の題字を追加したり、次元を超えたコンテンツを追加したり、複数の画像を自然に合成したりすることができます。モデルパイプラインの切り替えは必要ありません。
美しさと整列(「美しさ」と「整列」): モデルは非常に高いレイアウト美学を持ち、画面の空白部分にテキストを自動的に配置(宋詞の水墨画など)し、複数のコマ漫画や複雑な表のテキストを整列させることができます。

豊富な使用シーン
趙孟頫の行書、宋徽宗の瘦金体、王羲之の小楷など、『蘭亭集序』などの長篇書道作品も正確に再現できます。また、Qwen-Image-2.0は複雑な論理を持つ4x6のマンガ生成にも対応し、キャラクターの一貫性と会話枠の自然な整列を保証します。
現在、Qwen-Image-2.0はアリババクラウドの百煉プラットフォームでAPI招待を開始しており、開発者やユーザーは
