阿里推出全新多模態模型 Qwen2.5-VL-32B：兼顧視覺語言與數學推理

在人工智能領域，阿里巴巴再次帶來了重磅消息。近日，阿里開源了最新的多模態模型 ——Qwen2.5-VL-32B-Instruct。這款新模型是 Qwen2.5系列中的一員，其他版本包括3B、7B 和72B，而32B 版本在保持性能的同時，更加註重便捷的本地運行體驗。

Qwen2.5-VL-32B 經過強化學習的優化，在多個方面表現出色。首先，它的回答更加符合人類的認知習慣，這意味着用戶在與模型互動時，將能獲得更自然和流暢的交流體驗。其次，這款模型在數學推理能力方面的提升也十分顯著。無論是複雜的數學題還是幾何體分析，Qwen2.5-VL-32B 都能準確而清晰地進行分析與推理。此外，該模型在圖像解析、內容識別和視覺邏輯推導等任務中的準確性也得到了明顯改善，使得其在處理多模態數據時，能夠提供更加細緻入微的分析。

在與同類模型的對比中，如 Mistral-Small-3.1-24B 和 Gemma-3-27B-IT，Qwen2.5-VL-32B 在純文本能力上已達到同規模的最佳表現，甚至在多個基準測試中超過了72B 的版本。這一成就充分展示了阿里在多模態 AI 技術領域的領先地位。

例如，當用戶向 Qwen2.5-VL-32B 展示一張交通指示牌的照片，並詢問能否在一個小時內到達110公里外的目的地時，模型將分析時間、距離及卡車的限速，逐步清晰地推導出正確答案。這種複雜的推理能力讓人驚歎不已。

目前，Qwen2.5-VL-32B 已經在 Hugging Face 上開源，用戶可直接在 Qwen Chat 平臺體驗其強大的功能。隨着開源活動的深入，越來越多的開發者和用戶積極參與並在 MLX Community 中進行試驗，討論也在 Hacker News 等社交平臺上熱烈展開。

顯然，阿里的這次發佈再次引發了業內的熱議，許多人認爲開源的力量正不斷突破邊界，爲人工智能的未來發展提供了無限可能。

視頻生成初創公司PixVerse完成4.39億美元C輪融資，估值突破20億美元

新加坡視頻生成初創公司PixVerse宣佈完成4.39億美元C輪融資，估值超20億美元。阿里巴巴、Lollapalooza Capital、華僑銀行旗下Lion X Ventures等參投。此前3月已由鼎暉投資領投首期C輪。資金將用於全球模型服務、團隊擴招及企業業務全球化佈局。

AI創作新高度：字節跳動發佈Seedream 5.0 Pro，開啓交互式精準編輯時代

字節跳動發佈多模態AI模型Seedream5.0Pro，推動圖像創作從生成邁向設計。該模型在圖文匹配、結構合理性、文字渲染和畫面質感上顯著提升，並重點突破複雜信息可視化能力，能精準解析意圖，將數據、概念和密集文字轉化爲專業視覺呈現。

OpenAI 前研究員田永龍被曝加入騰訊混元多模態團隊

OpenAI前研究員田永龍已加入騰訊，或將擔任混元多模態模型負責人，主導視覺語言模型（VLM）研發。消息尚未官宣但備受業界關注，繼姚順雨之後，他成爲混元團隊引進的又一核心人才，顯示騰訊正加速強化多模態大模型領域的人才與技術佈局。

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具

阿里巴巴內部發文，要求員工停止使用 Anthropic Claude 全系產品，包括 Sonnet、Opus、Fable 等模型及 Claude Code 等智能體工具，最後期限爲 7 月 10 日。此舉與公司年初開放 AI 使用、提供內部模型免費額度並報銷外部模型的政策形成對比，預示着其在 AI 工具策略上的收緊和向自研體系的迴歸。

阿里推出全新多模態模型 Qwen2.5-VL-32B：兼顧視覺語言與數學推理

相關推薦

視頻生成初創公司PixVerse完成4.39億美元C輪融資，估值突破20億美元

AI創作新高度：字節跳動發佈Seedream 5.0 Pro，開啓交互式精準編輯時代

OpenAI又走一員大將：田永龍疑似投奔騰訊混元，將執掌多模態方向

OpenAI 前研究員田永龍被曝加入騰訊混元多模態團隊

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具