近日,騰訊正式推出並開源了其全新的原生多模態圖像生成模型 ——“混元圖像3.0(HunyuanImage3.0)”。這一新模型的參數規模達到驚人的80B,標誌着在圖像生成領域的一次重大技術突破。值得一提的是,混元圖像3.0不僅是首個開源的工業級多模態生圖模型,其表現也與行業內頂尖的閉源模型相媲美。
該模型的能力十分強大,它能夠利用豐富的知識進行推理,解析複雜的千字級語義,並生成長篇文本。這對於需要創作高質量內容的設計師和開發者來說,無疑是個福音。騰訊表示,混元圖像3.0的推出將進一步推動人工智能生成內容(AIGC)技術的發展。

回顧混元系列的發展歷程,混元圖像3.0是繼今年5月發佈的2.0版本後的又一重要升級。值得注意的是,2.0版本已經實現了毫秒級的響應速度和超寫實的圖像質量,用戶在輸入文本時可以實時看到生成的圖像。而3.0版本則在此基礎上,進一步增強了模型的複雜性與表現力。
除了圖像生成,騰訊混元系列還先後推出了3D 生成模型(2.0和2.5版本)、定製化圖像生成插件 InstantCharacter,以及多模態視頻生成工具 HunyuanCustom,形成了一套完整的 AIGC 技術矩陣。這些工具的推出,不僅提升了創作者的工作效率,也爲整個行業帶來了更多的創新可能。
騰訊的這一新模型的開源,意味着更多開發者和研究者能夠利用這一強大的工具,推動多模態生成技術的進一步研究與應用。無疑,這將加速人工智能與各行各業的深度融合,爲未來的創作帶來無限可能。
