OpenAI は新しく開発された GPT Image2 モデルを基盤とした AI イメージ生成ツール「ChatGPT Images2.0」を正式にリリースしました。今回のアップデートの主なポイントは、AI により顕著な「思考能力」を付与し、複雑な視覚タスクを処理する際、論理的なクリエイターのように動作させることにあります。

推論計画の導入により、画像生成は「ブラインドボックス」ではなくなった
従来の直接画像を生成する方法とは異なり、Images2.0 は深い論理計画機能を導入しています。「思考能力」を有効にすると、AI は実際に描き始め之前にインターネット情報を検索し、ユーザーがアップロードしたファイルを視覚解析します。画像構造の事前推論とレイアウト計画を通じて、生成される作品は単なる素材の積み重ねではなく、論理的直感に合ったものになります。現在、この先進的な機能は ChatGPT Plus、Pro、Business および Enterprise のサブスクリプションユーザーにまず公開されています。

連続性の向上:一度で最大8枚の連続画像を生成、マンガやデザインに最適
複数画像生成の分野において、新バージョンは画期的な進歩を遂げました。Images2.0 は今や一度のプロンプトで最大8枚の連続画像を生成することが可能です。クリエイターにとって驚きなのは、システムが異なるシナリオ間での切り替えにおいて、キャラクターのイメージ、オブジェクトの詳細、全体的なビジュアルスタイルを厳密に統一して保持することです。この特徴の実現により、長編マンガやソーシャルメディア用のシリーズ画像、または一連のインテリアデザインの作成のハードルが大幅に低下します。
画質の向上と多言語の微調整
技術仕様において、新バージョンは最高解像度を2Kレベルに引き上げ、3:1から1:3の極端な横幅比の選択肢を提供しています。これは映画のカットやピクセルアートなど、細分化されたスタイルに完璧に対応できます。また、グローバルなニーズに応えるために、研究チームは中国語、日本語、韓国語、ヒンディー語、ベンガル語環境でのテキスト生成の正確性を重点的に改善し、以前のAI画像生成における文字化けや理解の誤りなどの問題を効果的に解決しました。
今回のアップデートは、AI 描画が単なる「ピクセル生成」から「理解と創作」へと進化していることを示しており、専門デザイナーだけでなく一般ユーザーにも生産性の高いビジュアルツールを提供しています。
