緊隨“元寶春節10億紅包”活動的火熱開啓,騰訊混元團隊於1月28日正式宣佈,開源其最新混元圖像3.0圖生圖模型 (HunyuanImage3.0-Instruct)。該模型憑藉800億總參數規模(激活參數約13B)的混合專家架構(MoE),在 LMArena 全球影像編輯榜單中位列第七,躋身第一梯隊,成爲目前全球最強的開源圖生圖模型。

QQ20260128-155750.png

核心技術突破:“先思考,後編輯”。 混元圖像3.0採用了原生多模態架構,將文本與視覺理解深度融合。模型通過千萬量級數據及思維鏈(CoT)注入,學會了在執行任務前先分析圖像內容與用戶意圖,從而生成精準的編輯指令。配合自研的 MixGRPO 算法,模型在指令遵循及保持非編輯區域一致性方面表現卓越。

全能編輯體驗與多場景賦能。 該模型支持增刪改、風格變換、人物與文字修改、老照片修復及多圖融合等多種花式玩法。對於普通用戶,它是表情包製作與社交分享的神器;對於專業設計師,它能顯著提升電商海報和遊戲角色定製的創作效率。

全面擁抱開源社區。 目前,騰訊混元已將該模型的權重及完整代碼託管至GitHubHugging Face。除標準版外,還同步推出了蒸餾版模型,以降低開發者的使用門檻。開發者與研究者現可直接獲取這些資源,基於此強大的基礎平臺進行應用研發與二次開發。

官網體驗:https://hunyuan.tencent.com/chat/HunyuanDefault?from=modelSquare&modelId=Hunyuan-Image-3.0-Instruct