谷歌公司日前正式發佈了全新的文本轉圖像生成模型Imagen4,該模型現已通過Gemini API和Google AI Studio平臺向用戶開放。據官方介紹,新版本在文本渲染性能方面較前代產品實現了顯著提升。
此次發佈包含三個不同版本的模型。標準版Imagen4主要提升了整體的圖像生成質量,特別是在文本渲染準確性方面表現突出。
針對快速生成需求,谷歌同時推出了Imagen4Fast版本。該模型專門針對快速圖像生成和大批量處理任務進行了優化,處理速度顯著提升,使用成本降至每次生成0.02美元,爲需要大量圖像生成的用戶提供了經濟實惠的解決方案。
對於高質量需求用戶,谷歌還提供了Imagen4Ultra版本。該版本能夠生成更精細的圖像細節,並能更準確地遵循用戶輸入的文本提示,確保生成結果的一致性和準確性。
根據谷歌提供的示例,用戶輸入"黎明時分的壯麗山脈,清澈湖泊倒影白雪皚皚的山峯"等描述性文本後,Imagen4能夠生成相應的高質量自然景觀圖像。
業內專家認爲,Imagen4的發佈將爲藝術創作、廣告設計、內容製作等多個行業提供更強大的工具支持。隨着文本轉圖像技術的不斷髮展,這類AI工具在創意產業中的應用前景越來越廣闊。
目前,用戶可以通過谷歌的官方開發平臺訪問和使用這些新模型。谷歌表示,將根據用戶反饋和市場需求繼續優化相關技術,推動AI圖像生成領域的進一步發展。
