騰訊混元推出並開源其最新的多模態圖像生成模型 ——“混元圖像3.0”(HunyuanImage3.0)。此次發佈標誌着該模型的參數規模已達到80B,成爲首個開源的工業級原生多模態生成模型。官方表示,該模型的生成效果可以與業內領先的閉源模型相媲美。

image.png

混元圖像3.0的主要亮點在於其能夠處理複雜的語義內容,解析千字級別的文本並生成相應的圖像。通過對知識的推理,該模型能夠生成長文本,這在以往的圖像生成模型中是一個不小的突破。這項技術的進步不僅爲用戶帶來了更爲豐富的創作體驗,也爲 AI 圖像生成領域帶來了新的可能性。

此次更新是混元系列自今年5月推出2.0版本以來的重要升級。2.0版本已實現毫秒級的響應速度和超寫實的圖像質量,並支持實時生成圖像,用戶可以在輸入文字的同時看到圖像生成的過程。這種即時反饋的功能大大提升了用戶的交互體驗。

騰訊混元在過去的時間裏已陸續開源了多項 AI 生成技術,包括3D 生成模型、定製化圖像生成插件 InstantCharacter,以及多模態視頻生成工具 HunyuanCustom。這些開源項目構建了一個完善的 AI 生成內容(AIGC)技術生態,使得開發者和用戶能夠在多個領域中進行探索與應用。

** 劃重點:**  

🌟 混元圖像3.0是騰訊開源的首個工業級多模態生成模型,參數規模達到80B。  

🖼️ 模型能夠解析複雜的語義,並生成千字級長文本,效果可與頂尖閉源模型相媲美。  

🚀 這是繼2.0版本後的升級,支持毫秒級響應和實時生成圖像的交互體驗。