編程與GUI雙向通吃!Qwen3.7-Plus 登場，11小時自主閉環開發真實APP

阿里正式發佈了全新多模態大模型 Qwen3.7-Plus。該模型在 Qwen3.7強大的文本能力基礎上，全面升級了視覺-語言能力，並將其統一爲一體化的智能體基座。作爲一款多模態交互混合智能體，Qwen3.7-Plus 能夠無縫融合 GUI（圖形用戶界面）與 CLI(命令行界面)交互，實現了從前端原型到複雜軟件工程的端到端自動化。

在權威視覺模型榜單 Vision Arena 中，憑藉 Qwen3.7-Plus 的強勁表現，阿里已成功躋身全球前五、中國第一。

核心技術能力與評測表現

Qwen3.7-Plus 的核心優勢在於將“看、想、寫、做、驗”整合進統一的循環中，在三大方向展現出頂尖性能:

純文本與推理 Agent: 在 Terminal Bench2.0、SWE-bench 和 SciCode 等複雜軟件工程與科學編程任務上表現強勁;在 GPQA Diamond 等高難度 STEM 推理基準中位列 Plus 級別模型前列。
多模態推理與視覺編程: 具備強大的空間建模與路徑搜索能力（如在 BabyVision 上顯著提升）。同時，支持將圖像、視頻、UI 截圖一鍵轉化爲可執行代碼(如 SVG 重現及交互式網頁設計)。
真實世界感知與視頻理解: 涵蓋文檔解析、高級 OCR、長短視頻事件流理解，並在 LingoQA 等駕駛場景評測中展現出對動態空間關係的精準把握。

顛覆性的真實應用場景

發佈會同步展示了基於 Qwen3.7-Plus 構建的多個前沿智能體系統:

APP 全鏈路自主開發: 在測試中，Hybrid-Agent 系統持續穩定運行11+ 小時，觸發調用超1000次，自主生成超10，000行代碼，全程無人工干預地完成了從需求文檔到測試、部署的英語單詞學習 APP 研發閉環。
桌面應用高保真復刻: 智能體通過自主交互 macOS 原生“股市”應用並理解佈局，自動編寫 SwiftUI 源碼並接入真實行情 API，最終10項功能驗證測試全部通過，完美復現了原生的暗色主題與交互體驗。
雲控制檯無人值守運維: 基於 Qwen3.7-Plus 開發的“Qwen for Chrome”瀏覽器插件，能夠理解非專業用戶的自然語言需求，自主進入阿里雲控制檯完成 ECS 服務器的比價、選型、配置、購買，甚至能自主處理停機擴容等複雜運維升級。

目前，Qwen3.7-Plus 已正式通過阿里雲百鍊及Qwen Studio對外提供服務。無論通過 Claude Code、OpenClaw 還是 Qwen Code 等框架部署，該模型均能保持穩定的跨框架泛化表現，爲下一代 embodied（具身）場景與生產力工作流自動化打下了堅實基礎。

編程與GUI雙向通吃!Qwen3.7-Plus 登場，11小時自主閉環開發真實APP

核心技術能力與評測表現

顛覆性的真實應用場景

相關推薦

阿里發佈Token Plan個人版，Qwen3.8-Max-Preview同步上線

英偉達推出統一音頻智能模型 Nemotron-Labs-Audex-30B-A3B

AI 視頻賽道格局重塑：谷歌 Gemini Omni Flash 登頂盲測榜首

商湯科技祕密研發多模態模型“U1Pro”:由林達華牽頭，預計7月啓動內測對標OpenAI

阿里開源統一科學大模型 LOGOS，僅用五十六分之一參數超越微軟