全球最強開源圖生圖!騰訊混元圖像3.0正式開源，800億參數助力 AI 創作

緊隨“元寶春節10億紅包”活動的火熱開啓，騰訊混元團隊於1月28日正式宣佈，開源其最新的混元圖像3.0圖生圖模型（HunyuanImage3.0-Instruct）。該模型憑藉800億總參數規模（激活參數約13B）的混合專家架構(MoE)，在 LMArena 全球影像編輯榜單中位列第七，躋身第一梯隊，成爲目前全球最強的開源圖生圖模型。

核心技術突破:“先思考，後編輯”。混元圖像3.0採用了原生多模態架構，將文本與視覺理解深度融合。模型通過千萬量級數據及思維鏈（CoT）注入，學會了在執行任務前先分析圖像內容與用戶意圖，從而生成精準的編輯指令。配合自研的 MixGRPO 算法，模型在指令遵循及保持非編輯區域一致性方面表現卓越。

全能編輯體驗與多場景賦能。該模型支持增刪改、風格變換、人物與文字修改、老照片修復及多圖融合等多種花式玩法。對於普通用戶，它是表情包製作與社交分享的神器;對於專業設計師，它能顯著提升電商海報和遊戲角色定製的創作效率。

全面擁抱開源社區。目前，騰訊混元已將該模型的權重及完整代碼託管至GitHub和Hugging Face。除標準版外，還同步推出了蒸餾版模型，以降低開發者的使用門檻。開發者與研究者現可直接獲取這些資源，基於此強大的基礎平臺進行應用研發與二次開發。

官網體驗:https://hunyuan.tencent.com/chat/HunyuanDefault?from=modelSquare&modelId=Hunyuan-Image-3.0-Instruct

OpenAI 前研究員田永龍被曝加入騰訊混元多模態團隊

OpenAI前研究員田永龍已加入騰訊，或將擔任混元多模態模型負責人，主導視覺語言模型（VLM）研發。消息尚未官宣但備受業界關注，繼姚順雨之後，他成爲混元團隊引進的又一核心人才，顯示騰訊正加速強化多模態大模型領域的人才與技術佈局。

全球最強開源圖生圖!騰訊混元圖像3.0正式開源，800億參數助力 AI 創作

相關推薦

騰訊混元發佈科研智能體Hyra-1.0，單一框架打通AI研發與科學發現

騰訊混元 Hy3 發佈首周調用量增超 68 倍，登頂 OpenRouter 全球榜單

調用量火爆致算力承壓，WorkBuddy 完成騰訊混元 Hy3 模型緊急擴容

OpenAI又走一員大將：田永龍疑似投奔騰訊混元，將執掌多模態方向

OpenAI 前研究員田永龍被曝加入騰訊混元多模態團隊