2026年2月10日,阿里雲正式推出新一代圖像生成基礎模型 Qwen-Image-2.0。該模型標誌着通義千問在圖像能力上的重大突破,成功將“圖像生成”與“圖像編輯”兩條研發支線合二爲一,在多項盲測基準中展現出卓越性能。

核心技術突破
Qwen-Image-2.0採用7B 輕量化架構,在維持高速推理的同時,實現了以下四大核心優勢:
專業的文字渲染(“準”與“多”): 支持高達1k token 的超長複雜指令。無論是複雜的 PPT 頁面、專業信息圖表(如 A/B 測試報告、OKR 工作法圖解),還是含中英雙語的海報,模型均能實現像素級的精準排布與多介質渲染。
極致的真實質感(“真”): 原生支持2K 分辨率(2048×2048),能夠細膩刻畫皮膚毛孔、織物紋理及建築細節,在電影海報等寫實場景中表現尤爲出色。
統一的生圖編輯能力: 作爲一個 Omni(全能)模型,它實現了理解與生成的深度融合。用戶可直接在現有圖片上進行書法題詞、跨次元內容添加或多圖自然合成,無需切換模型管線。
審美與對齊(“美”與“齊”): 模型具備極高的排版美學,能自動在畫面留白處佈置文字(如宋詞水墨畫),並確保多格漫畫或複雜表格中的文本規整對齊。

豐富的使用場景
從趙孟頫的行楷、宋徽宗的瘦金體到王羲之的小楷,《蘭亭集序》等長篇書法作品均能實現準確渲染。此外,Qwen-Image-2.0還能處理具有複雜邏輯的4x6漫畫生成,並確保角色的一致性與對話框的自然對齊。
目前,Qwen-Image-2.0已在阿里雲百鍊平臺開啓 API 邀測,廣大開發者和用戶也可通過
