「元宝新春10億円のボーナス」キャンペーンが熱く始まった後、テンセント・ハントゥンチームは1月28日に、最新の「混元画像3.0図生図モデル(HunyuanImage3.0-Instruct)」をオープンソース化することを正式に発表しました。このモデルは、800億パラメータを持つ混合エキスパートアーキテクチャ(MoE)を採用しており、活性化パラメータは約13Bです。LMArenaの世界の画像編集ランキングで7位を記録し、第1グループにランクインし、現在世界最大のオープンソース図生図モデルとなっています。

QQ20260128-155750.png

核心技术の突破:「まず考える、その後編集する」。混元画像3.0はネイティブなマルチモーダルアーキテクチャを採用し、テキストと視覚理解を深く統合しています。このモデルは、数千万レベルのデータと思考チェーン(CoT)を組み込み、タスク実行前に画像の内容とユーザーの意図を分析し、正確な編集命令を生成できるように学習しました。自社開発のMixGRPOアルゴリズムと併せて使用することで、指示に従う能力や非編集領域の一貫性を維持する性能が優れています。

万能な編集体験と多様なシナリオへの対応。このモデルは、追加・削除・変更、スタイル変換、人物および文字の修正、古写真の修復、複数画像の合成など、さまざまな機能をサポートしています。一般ユーザーにとって、これは絵文字の作成やSNSでの共有に最適なツールであり、プロのデザイナーにとっては、ECのポスター制作やキャラクターのカスタマイズにおける創作効率を大幅に向上させます。

オープンソースコミュニティへの全面的な参加。現在、テンセント・ハントゥンはこのモデルの重みと完全なコードをGitHubとHugging Faceにホスティングしています。標準版だけでなく、蒸留版モデルも同時にリリースされ、開発者の利用ハードルを下げています。開発者や研究者は今やこれらのリソースを直接取得し、この強力な基盤プラットフォーム上でアプリケーションの開発や二次開発を行うことができます。

公式サイトでの体験:https://hunyuan.tencent.com/chat/HunyuanDefault?from=modelSquare&modelId=Hunyuan-Image-3.0-Instruct