爆改マンガ師？OpenAIがChatGPT Images 2.0を発表、1回で8枚の連続画像を生成

OpenAI は新しく開発された GPT Image2 モデルを基盤とした AI イメージ生成ツール「ChatGPT Images2.0」を正式にリリースしました。今回のアップデートの主なポイントは、AI により顕著な「思考能力」を付与し、複雑な視覚タスクを処理する際、論理的なクリエイターのように動作させることにあります。

推論計画の導入により、画像生成は「ブラインドボックス」ではなくなった

従来の直接画像を生成する方法とは異なり、Images2.0 は深い論理計画機能を導入しています。「思考能力」を有効にすると、AI は実際に描き始め之前にインターネット情報を検索し、ユーザーがアップロードしたファイルを視覚解析します。画像構造の事前推論とレイアウト計画を通じて、生成される作品は単なる素材の積み重ねではなく、論理的直感に合ったものになります。現在、この先進的な機能は ChatGPT Plus、Pro、Business および Enterprise のサブスクリプションユーザーにまず公開されています。

連続性の向上：一度で最大8枚の連続画像を生成、マンガやデザインに最適

複数画像生成の分野において、新バージョンは画期的な進歩を遂げました。Images2.0 は今や一度のプロンプトで最大8枚の連続画像を生成することが可能です。クリエイターにとって驚きなのは、システムが異なるシナリオ間での切り替えにおいて、キャラクターのイメージ、オブジェクトの詳細、全体的なビジュアルスタイルを厳密に統一して保持することです。この特徴の実現により、長編マンガやソーシャルメディア用のシリーズ画像、または一連のインテリアデザインの作成のハードルが大幅に低下します。

画質の向上と多言語の微調整

技術仕様において、新バージョンは最高解像度を2Kレベルに引き上げ、3:1から1:3の極端な横幅比の選択肢を提供しています。これは映画のカットやピクセルアートなど、細分化されたスタイルに完璧に対応できます。また、グローバルなニーズに応えるために、研究チームは中国語、日本語、韓国語、ヒンディー語、ベンガル語環境でのテキスト生成の正確性を重点的に改善し、以前のAI画像生成における文字化けや理解の誤りなどの問題を効果的に解決しました。

今回のアップデートは、AI 描画が単なる「ピクセル生成」から「理解と創作」へと進化していることを示しており、専門デザイナーだけでなく一般ユーザーにも生産性の高いビジュアルツールを提供しています。

混元の再構築後初の公開でHy3 previewをリリース：全般的な実用性を強化し、エージェント機能が大幅に向上

騰訊混元は4月23日にHy3preview言語モデルを発表し、オープンソース化しました。これは、速い思考と遅い思考を統合した混合専門家モデルであり、全体パラメータ数は295Bで、アクティブパラメータ数は21B、コンテキスト長は256Kをサポートしています。再構築後の最初のモデルとして、複雑な推論、指示の遵守、コンテキスト学習、コードおよびエージェントなどの能力が顕著に向上しており、混元において最も知能が高いモデルです。2026年2月に、騰訊混元は予訓練と強化学習のインフラストラクチャーを再構築し、モデルの実用性を重視しました。

マスク氏が「拼好饭」に加わったと造謡され、ネットユーザーはAI時代での真実の喪失を驚く

最近、小米汽車がアップルのクックCEO就任を偽装した画像や、世界長者マスクが「拼多多」に参加したという虚偽情報が相次いで拡散。本物そっくりに作られ、ネットユーザーを誤誘導。関係各社はデマに注意を呼びかけている。....

爆改マンガ師？OpenAIがChatGPT Images 2.0を発表、1回で8枚の連続画像を生成

推論計画の導入により、画像生成は「ブラインドボックス」ではなくなった

連続性の向上：一度で最大8枚の連続画像を生成、マンガやデザインに最適

画質の向上と多言語の微調整

関連推奨

混元の再構築後初の公開でHy3 previewをリリース：全般的な実用性を強化し、エージェント機能が大幅に向上

テンセントが最新のオープンソース言語モデル「Hy3 Preview」をリリースし、スマートな時代の新潮流を牽引

マスク氏が「拼好饭」に加わったと造謡され、ネットユーザーはAI時代での真実の喪失を驚く

マイクロソフトがEdgeブラウザのインターフェースを正式にリデザインし、一貫したAIスタイルを示す

バイチューティアが新規の3D生成モデル「Seed3D2.0」を発表、技術はSOTAレベルに到達