騰訊全新AI繪畫升級！微調技術讓生成圖像美感提升300%

近日，騰訊推出了一種新方法，旨在提升 AI 生成圖像的真實感與美學評分。據悉，這一微調技術在僅用32塊 H20顯卡訓練10分鐘後就能實現顯著的收斂效果，其人工評估得分甚至提升了300% 以上。

當前的擴散模型雖然能夠藉助獎勵機制來優化圖像質量，但卻面臨着一些挑戰。首先，模型優化步驟較少，容易出現所謂的 “獎勵作弊” 現象，即模型爲了獲取高分而生成質量較低的圖像。其次，離線調整獎勵模型的過程不夠靈活，限制了實時優化的能力。

爲了解決這些問題，騰訊團隊提出了兩個創新性的方法。第一個是名爲 “Direct-Align” 的技術，通過預先注入噪聲，模型能夠從任何時間點恢復原圖。這種方法減少了早期反向傳播中的梯度爆炸現象，使得模型在整個擴散過程中都能夠進行優化，而不僅僅侷限於最後的幾個步驟。

第二個創新是 “語義相對偏好優化”（SRPO）。這一方法將獎勵信號轉變爲可受文本控制的信號。通過添加正面和負面提示詞，模型能夠靈活地調整生成圖像的風格，而無需額外數據。這意味着，用戶只需在提示詞前加上簡單的控制短語，即可實現如亮度調整或風格轉換等功能。

實驗結果顯示，經過 SRPO 訓練的 FLUX.1-dev 模型在真實感和美學質量上的表現均大幅提升。在一項包含3200個提示詞的測試中，經過 SRPO 訓練的模型在真實感維度上的優秀率由8.2% 提升至38.9%，而美學質量的優秀率從9.8% 提升至40.5%。相較於其它方法，SRPO 不僅在保持高美學質量的同時，生成的圖像紋理更加自然。

這一技術的成功應用，不僅表明騰訊在 AI 繪畫領域的進一步探索，也爲未來的 AI 圖像生成技術指明瞭方向。

論文地址：https://arxiv.org/pdf/2509.06942

騰訊擬接盤Manus成最大股東，估值20億美元發力智能體生態

7月10日消息，騰訊正洽談成爲新加坡AI初創Manus最大股東。此前Meta於2025年底達成的超20億美元（約136億元）收購交易已被要求撤銷。現有股東騰訊、真格基金、紅杉中國及管理層擬以同樣估值支持撤銷該交易，騰訊將在此輪認購最多股份，交易完成後或保留少數股權。

騰訊全新AI繪畫升級！微調技術讓生成圖像美感提升300%

相關推薦

騰訊擬接盤Manus成最大股東，估值20億美元發力智能體生態

OpenAI人才流動：前研究員田永龍入職騰訊，深耕視覺語言模型研發

可靈AI將完成30億美元融資騰訊參投，計劃12個月內啓動赴港IPO

騰訊 Marvis 馬維斯 iOS 版上線:掏出手機，就能遠程接管你的電腦桌面

騰訊“碳尋計劃”二期終選名單公佈，支持16個團隊用全球方案解決全球問題