正文

生圖編輯合二爲一!Qwen-Image-2.0發佈:2K 極致質感挑戰視覺極限

aibase

發布於AI新閒資訊

時間 :Feb 10, 2026

閱讀 :1分鐘

2026年2月10日，阿里雲正式推出新一代圖像生成基礎模型 Qwen-Image-2.0。該模型標誌着通義千問在圖像能力上的重大突破，成功將“圖像生成”與“圖像編輯”兩條研發支線合二爲一，在多項盲測基準中展現出卓越性能。

核心技術突破

Qwen-Image-2.0採用7B 輕量化架構，在維持高速推理的同時，實現了以下四大核心優勢:

專業的文字渲染（“準”與“多”）: 支持高達1k token 的超長複雜指令。無論是複雜的 PPT 頁面、專業信息圖表（如 A/B 測試報告、OKR 工作法圖解），還是含中英雙語的海報，模型均能實現像素級的精準排布與多介質渲染。
極致的真實質感（“真”）: 原生支持2K 分辨率（2048×2048），能夠細膩刻畫皮膚毛孔、織物紋理及建築細節，在電影海報等寫實場景中表現尤爲出色。
統一的生圖編輯能力: 作爲一個 Omni（全能）模型，它實現了理解與生成的深度融合。用戶可直接在現有圖片上進行書法題詞、跨次元內容添加或多圖自然合成，無需切換模型管線。
審美與對齊（“美”與“齊”）: 模型具備極高的排版美學，能自動在畫面留白處佈置文字（如宋詞水墨畫），並確保多格漫畫或複雜表格中的文本規整對齊。

豐富的使用場景

從趙孟頫的行楷、宋徽宗的瘦金體到王羲之的小楷，《蘭亭集序》等長篇書法作品均能實現準確渲染。此外，Qwen-Image-2.0還能處理具有複雜邏輯的4x6漫畫生成，並確保角色的一致性與對話框的自然對齊。

目前，Qwen-Image-2.0已在阿里雲百鍊平臺開啓 API 邀測，廣大開發者和用戶也可通過Qwen Chat免費體驗這一前沿模型。

相關推薦

微軟自研雙模型MAI-Image-2.5-Pro與MAI-Voice-2-Flash發佈：不蒸餾第三方，已落地Bing和PowerPoint

微軟發佈兩款自研AI模型：高精度圖像模型MAI-Image-2.5-Pro，GPU成本最高降84%；語音模型MAI-Voice-2-Flash，專攻高併發交互。訓練數據清潔可追溯，不依賴第三方模型蒸餾，從設計之初即面向微軟產品用戶。

阿里發佈Qwen-Image-3.0，支持4.5K Token超長輸入與複雜圖文生成

阿里發佈Qwen-Image-3.0圖像生成基礎模型，支持最長4.5K Token文本輸入，可一次性生成公式、幾何圖形、邏輯推導及多層UI等複雜內容，原生兼容12種語言和20餘款字體渲染，文本長度較上代提升4.5倍，大幅強化影視分鏡、知識圖解等商業級圖文創作能力。

圖像生成再提速：谷歌發佈 Nano Banana 2 Lite 模型，極致性價比挑戰行業門檻

谷歌推出新AI模型Nano Banana2Lite，在激烈競爭中凸顯速度與成本優勢。其核心升級在於將單圖生成時間壓縮至4秒內，大幅降低延遲，同時優化使用成本。

阿里雲QoderWork推出“峯谷Token”:錯峯調用Qwen3.7-Max低至2折

阿里雲旗下QoderWork推出“峯谷Token”計費，引導用戶錯峯利用夜間（22:00至次日8:00）閒置算力，任務自動享低至2折優惠，主力模型Qwen3.7-Max等受益。該模式精細化配置AI資源，爲企業和開發者大幅降低大模型應用成本。

打通AI應用“最後一公里”：阿里雲秒悟Meoo CLI正式開源

阿里雲開源了命令行工具Meoo CLI，定位爲本地Agent與雲端能力的連接樞紐。它幫助開發者將AI生成的本地代碼原型轉化爲線上應用，自動處理數據對接、環境配置及發佈流程，解決從代碼到部署的行業痛點。

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2026AIBase