阿里雲旗下的 Qwen 團隊宣佈推出其最新 AI 模型 ——Qwen3-Max。這款模型以其超大規模和強大能力,標誌着人工智能技術的新突破。Qwen3-Max 的發佈不僅在 LMArena 文本排行榜上位列第三,超越了競爭對手 GPT-5-Chat,還在多個基準測試中表現出色,尤其是在代碼生成和智能體能力方面。

QQ20250924-103441.png

Qwen3-Max 模型的總參數超過1萬億,預訓練使用了36萬億個 tokens。得益於 Qwen3系列的先進 MoE 模型結構設計,Qwen3-Max 在訓練穩定性和高效性方面取得了顯著進展。通過創新的 PAI-FlashMoE 多級流水並行策略,該模型的訓練效率比之前的版本提升了30%。在長序列訓練場景中,Qwen3-Max 採用的 ChunkFlow 策略使得吞吐量提升了3倍,支持1百萬長上下文的訓練。

Qwen3-Max-Instruct 是這一系列模型中的重要組成部分,其在編程基準測試 SWE-Bench Verified 中取得了69.6分的優異成績,證明了其在實際編程挑戰中的卓越能力。此外,該模型在 Tau2-Bench 基準測試中以74.8分的成績,超越了 Claude Opus4和 DeepSeek-V3.1,顯示了其在智能體工具調用能力方面的突破性表現。

值得一提的是,Qwen3-Max 的推理增強版本 ——Qwen3-Max-Thinking,憑藉集成的代碼解釋器和並行計算技術,在極具挑戰性的數學推理基準測試 AIME25和 HMMT 中取得了滿分的優異成績。團隊對這一版本的前景充滿信心,並期待儘快將其推向市場。

Qwen 團隊表示,用戶現在可以通過阿里雲 API 直接體驗 Qwen3-Max-Instruct 模型的強大能力。相關 API 已開放,使用者只需簡單的步驟即可註冊和獲取 API 密鑰,便可調用 Qwen3-Max 進行開發。

Qwen3-Max 的發佈不僅推動了 AI 技術的發展,還爲開發者提供了更加強大的工具,助力其在各行各業中創造更多的價值。隨着這一技術的普及,Qwen 團隊相信,人工智能的未來將更加光明。