AI画像生成が「プロフェッショナル級」のレースに参入し、Adobeは全方位的なアップグレードを通じて、クリエイティブなワークフローを再定義しています。10月29日に、Adobeは最新の画像生成モデルであるFirefly Image5を正式発表し、いくつかの画期的な機能も同時にリリースしました。それは、ネイティブで400万ピクセル出力、階層別プロンプト編集、カスタムアートスタイルモデル、AI音声とBGM生成などであり、画像・動画・音声のAI創作サイクルを完全に統合しています。

image.png

Image5:「十分」から「プロフェッショナル級」への質的変化

前バージョンでは100万ピクセルのネイティブ生成(後から400万ピクセルまで拡大)しかできなかったのが、Firefly Image5では直接400万ピクセル(約2240×1792)の高品質な画像を生成できるようになりました。細部のシャープさやカラーレンジが顕著に向上しています。特に人物レンダリングにおいては、Adobeは顔の構造や体の比率、光と影の論理を最適化し、「AIの不自然な手」といった一般的な問題を大幅に減少させ、プロのイラストや商業写真の基準に近づけました。

さらに画期的なのはその階層別編集能力です。モデルは画像内の異なるオブジェクトを自動的に独立したレイヤーとして認識し、ユーザーは自然言語の指示(例:「帽子を赤くする」「背景の建物を大きくする」)や従来のツール(回転や拡大)を用いて、個別の要素を正確に調整できます。システムは全体の照明の一貫性と詳細の完全性を知的保持し、本当に「思った通りに作れる」非破壊的な編集を実現します。

image.png

クリエイター専用AI:ワンクリックで自分のスタイルモデルを訓練

プロのアーティストがスタイルの一貫性を求めていることを考慮して、Adobeはカスタムモデル機能(Closed Beta)を導入しました。ユーザーは自分のイラスト、写真、スケッチをドラッグ&ドロップするだけで、システムはこれらの資産をもとに独自の画像生成モデルをトレーニングし、出力内容が完全に個人のアート言語に適合することを保証します。この機能により、ブランドのビジュアル、キャラクターデザイン、IPの派生など、さまざまなシナリオでの作業効率が飛躍的に向上し、AIが本格的に「デジタルの弟子」になるでしょう。

マルチモーダルクリエーションプラットフォーム:画像+動画+音声の一体化

新バージョンのFireflyウェブサイトはマルチモーダルクリエーションの中枢として再構築されています:

統一されたプロンプトボックスは画像と動画生成の間でシームレスに切り替え可能です。

モデルセレクターはAdobe独自のモデルだけでなく、OpenAI、Google、Runway、Topaz、Fluxなどのサードパーティエンジンも統合しています。

ホーム画面には個人ファイル、過去の生成記録、Creative Cloudアプリのショートカットが集約されています。

動画ツールにはタイムラインと階層編集(Private Beta)が追加され、プロフェッショナルレベルのAI動画ワークフローへと進化しています。

音声面では、FireflyはAIプロンプトを用いて完全なBGMやナレーションを生成することが可能になりました。ベースにはElevenLabsの音声モデルが採用されており、「ワードクラウド式プロンプト」機能も導入されました。キーワードをクリックするだけで複雑な指示を素早く構築できるため、創作のハードルが低下します。

image.png

「次の世代のクリエイター」を目指す:伝統的なワークフローの制約を打破

Adobeの生成AI副社長Alexandru Costin氏は、Fireflyのターゲットユーザーは「GenAIネイティブなクリエイター」であると語っています。彼らは伝統的なソフトウェアの論理に縛られず、AIをフルに活用して全工程に深く組み込みたいと考えています。そのため、FireflyはPhotoshopなどの古典的なツールのインタラクションに拘束されず、界面と機能を大胆に再構築し、AI時代にふさわしい直感的なクリエイティブ体験を構築しました。

Canvaなどの競合がAI化を加速する中、Adobeはプロフェッショナルな品質とオープンなエコシステム、そしてフルスタックの能力によって護城河を築いています。Firefly Image5は単なるモデルのアップグレードではなく、Adobeが「AIネイティブなクリエイティブオペレーティングシステム」に向かう重要な一歩です。ここでは、創造力は技術によって制限されることなく、想像力によって直接駆動されるのです。