最近、騰訊は新しく開発したネイティブなマルチモーダル画像生成モデル「混元画像3.0(HunyuanImage3.0)」を正式にリリースし、オープンソース化しました。この新しいモデルのパラメータ規模は驚くべき80Bに達し、画像生成分野における重要な技術的突破を示しています。注目すべきは、混元画像3.0が初めてオープンソース化された産業レベルのマルチモーダル画像生成モデルであり、その性能は業界内でトップクラスのクローズドソースモデルと同等であるということです。

このモデルの能力は非常に強力で、豊富な知識を利用して推論を行い、複雑な千文字級の意味を解釈し、長文テキストを生成することができます。これは、高品質なコンテンツを作成する必要があるデザイナーや開発者にとって大きな福音です。騰訊は、混元画像3.0のリリースにより、AIによるコンテンツ生成(AIGC)技術の発展がさらに促進されるだろうと述べています。

image.png

混元シリーズの発展の歴史を振り返ると、混元画像3.0は今年5月にリリースされた2.0バージョンに続く重要なアップグレードです。注目すべきは、2.0バージョンがミリ秒単位の応答速度と超現実的な画像品質を実現しており、ユーザーがテキストを入力する際にリアルタイムで生成された画像を見ることができるということです。そして、3.0バージョンはこの基礎の上に、モデルの複雑さと表現力をさらに強化しています。

画像生成だけでなく、騰訊の混元シリーズは3D生成モデル(2.0および2.5バージョン)、カスタム画像生成プラグインのInstantCharacter、そしてマルチモーダル動画生成ツールのHunyuanCustomを順次リリースしており、AIGC技術の完全なマトリクスを構築しています。これらのツールの登場は、クリエイターの作業効率を向上させ、業界全体に多くの革新の可能性をもたらしました。