阿里正式發佈了全新多模態大模型 Qwen3.7-Plus。該模型在 Qwen3.7強大的文本能力基礎上,全面升級了視覺-語言能力,並將其統一爲一體化的智能體基座。作爲一款多模態交互混合智能體,Qwen3.7-Plus 能夠無縫融合 GUI(圖形用戶界面)與 CLI(命令行界面)交互,實現了從前端原型到複雜軟件工程的端到端自動化。

QQ20260602-091627.jpg

權威視覺模型榜單 Vision Arena 中,憑藉 Qwen3.7-Plus 的強勁表現,阿里已成功躋身全球前五、中國第一

核心技術能力與評測表現

Qwen3.7-Plus 的核心優勢在於將“看、想、寫、做、驗”整合進統一的循環中,在三大方向展現出頂尖性能:

  • 純文本與推理 Agent: 在 Terminal Bench2.0、SWE-bench 和 SciCode 等複雜軟件工程與科學編程任務上表現強勁;在 GPQA Diamond 等高難度 STEM 推理基準中位列 Plus 級別模型前列。

  • 多模態推理與視覺編程: 具備強大的空間建模與路徑搜索能力(如在 BabyVision 上顯著提升)。同時,支持將圖像、視頻、UI 截圖一鍵轉化爲可執行代碼(如 SVG 重現及交互式網頁設計)。

  • 真實世界感知與視頻理解: 涵蓋文檔解析、高級 OCR、長短視頻事件流理解,並在 LingoQA 等駕駛場景評測中展現出對動態空間關係的精準把握。

QQ20260602-091701.jpg

顛覆性的真實應用場景

發佈會同步展示了基於 Qwen3.7-Plus 構建的多個前沿智能體系統:

  1. APP 全鏈路自主開發: 在測試中,Hybrid-Agent 系統持續穩定運行11+ 小時,觸發調用超1000次,自主生成超10,000行代碼,全程無人工干預地完成了從需求文檔到測試、部署的英語單詞學習 APP 研發閉環。

  2. 桌面應用高保真復刻: 智能體通過自主交互 macOS 原生“股市”應用並理解佈局,自動編寫 SwiftUI 源碼並接入真實行情 API,最終10項功能驗證測試全部通過,完美復現了原生的暗色主題與交互體驗。

  3. 雲控制檯無人值守運維: 基於 Qwen3.7-Plus 開發的“Qwen for Chrome”瀏覽器插件,能夠理解非專業用戶的自然語言需求,自主進入阿里雲控制檯完成 ECS 服務器的比價、選型、配置、購買,甚至能自主處理停機擴容等複雜運維升級。

目前,Qwen3.7-Plus 已正式通過阿里雲百鍊Qwen Studio對外提供服務。無論通過 Claude Code、OpenClaw 還是 Qwen Code 等框架部署,該模型均能保持穩定的跨框架泛化表現,爲下一代 embodied(具身)場景與生產力工作流自動化打下了堅實基礎。