阿里 Qwen3.7-Max 編程能力全球登頂第二！Code Arena 1541 分，僅次 Claude，35 小時自主任務刷新生產力上限

AIbase 報道5月26日，全球權威編程榜單 Code Arena 最新放榜，阿里巴巴 Qwen3.7-Max 以1541分強勢登上全球第二，僅次於 Claude 系列模型，成爲國產大模型在編程領域的新標杆。這一成績超越了包括 GPT-5.5、Gemini3.5Flash 等多款前沿模型，標誌着中國 AI 在 Agentic Coding 和長時程任務上的重大突破。

編程實力全球 Top2，國產第一穩固

根據最新 Code Arena 榜單，Qwen3.7-Max在真實編程場景中的綜合表現突出，尤其在複雜代碼生成、調試、多文件工程以及工具調用鏈路等方面展現出極強競爭力。AIbase分析認爲，這一排名不僅體現模型單步編碼能力，更反映其在實際軟件開發流程中的整體效能，已達到可直接用於生產級項目的水平。

專爲生產而生:35小時長時程 Agent 能力亮眼

Qwen3.7-Max 的最大亮點在於其Agent 導向設計，特別擅長長週期自主執行任務:

支持運行35小時連續自主任務
完成超過1000次工具調用
可將原本需要2周開發週期的項目壓縮至數小時內完成

模型在複雜內核優化、長時間多步推理等真實場景中表現出色，能夠持續保持上下文連貫性和糾錯能力，極大提升了開發者與企業的生產效率。AIbase指出，這種長時程 Agent 能力正是當前大模型從“助手”向“同事”轉型的關鍵指標。

跨框架通用性強，性價比優勢顯著

Qwen3.7-Max 支持多種 Agent 框架，包括兼容 Anthropic 協議，可無縫接入 Claude Code 等現有工具鏈。同時，其在成本控制上也具備明顯優勢，爲開發者提供了高性能與高性價比的平衡選擇。

AIbase認爲，隨着 Qwen3.7-Max 的發佈，AI 編程工具的門檻進一步降低。無論是前端原型開發、複雜後端工程，還是全棧自動化流程，都將迎來更高效的 AI 輔助時代。這不僅對國內開發者是利好，也爲全球 AI 應用落地注入了新動力。

未來，AIbase將繼續跟蹤 Qwen 系列模型的更新及實際落地案例。Qwen3.7-Max 的突破再次證明，在 Agent 時代，誰能真正解決“長週期、可信賴、生產就緒”問題，誰就將引領下一波開發者生產力革命。

通義實驗室發佈Qwen3.7-Max，以“正交解耦”技術斬獲多項評測國內第一

通義實驗室發佈新一代AI Agent基座大模型Qwen3.7-Max，在多項評測中獲國內第一，旨在解決智能體長鏈路運行中斷、崩潰問題。在未知硬件ZW-M890L PPU的極限壓力測試中，該模型無文檔和先驗數據，憑運行時反饋展現長程策略連貫性與泛化力，連續運行35小時、1158次工具調用零中斷。

阿里 Qwen3.7-Max 編程能力全球登頂第二！Code Arena 1541 分，僅次 Claude，35 小時自主任務刷新生產力上限

編程實力全球 Top2，國產第一穩固

專爲生產而生:35小時長時程 Agent 能力亮眼

跨框架通用性強，性價比優勢顯著

相關推薦

阿里雲QoderWork推出“峯谷Token”:錯峯調用Qwen3.7-Max低至2折

阿里千問發佈新一代大模型Qwen3.7-Max

通義實驗室發佈Qwen3.7-Max，以“正交解耦”技術斬獲多項評測國內第一

就業市場遇冷AI不背鍋？LinkedIn數據顯示利率上升纔是主因

預言 2026：OpenClaw 創始人稱今年將成爲通用 AI 代理元年