1月26日、騰訊混元は最新の**混元画像3.0図生図(HunyuanImage3.0-Instruct)**モデルを正式リリースしました。このモデルは、混元が画像編集と複数画像の融合分野において重要なポジションを補完し、現在では騰訊元宝の全端末および公式ウェブサイトで同時にリリースされています。

80Bパラメータの巨大モデル:思考し、指示に応じる画像編集
混元画像3.0図生図モデルの総パラメータ量は80B(アクティブパラメータは約13B)で、先進的なミックスエキスパート(MoE)アーキテクチャを採用しています。従来の画像編集ツールとは異なり、このモデルは優れた意味理解と推論能力を持っています。画像とプロンプトを受け取ると、まず画像の内容を分析し、編集ステップを分解し、修正および保持すべき領域を正確に認識します。
何千万枚もの図生図データと自社開発のMixGRPOアルゴリズムに裏打ちされたこのモデルは、非編集領域の一貫性、指示への反応速度、そして現実感表現において顕著な向上を遂げています。


すべてのシナリオに対応:古い写真の修復から複数写真の合成まで
このモデルは80以上の細分化されたタスクをサポートし、ユーザーに多様な創作能力を提供します:
画像の詳細な修正: 光線、肌、背景の追加・削除・変更が可能で、レイアウトを損なうことなく画像内のテキストを変更することも可能です。
スタイルの変更: 実際に人物を漫画風に変換したり、ピクセルスタイルに変換したり、古い写真を修復したりできます。
深い統合: 複数の写真から人物や要素を抽出し、新しいアルバム写真やクリエイティブな画像を迅速に合成することが可能です。
現在、ユーザーは騰訊元宝を通じてAIで絵文字を作成したり、仮想での共演やEC向けポスターのデザイン機能を利用できます。これは、大規模モデルによるP画像が「意図駆動型」の効率的な時代に入ったことを示しています。