阿里通義千問開源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

通義千問團隊宣佈，繼Qwen2發佈三個月後，Qwen家族的最新成員——Qwen2.5系列語言模型正式開源。這標誌着可能是歷史上最大規模的開源發佈之一，包括了通用語言模型Qwen2.5，以及專門針對編程和數學領域的Qwen2.5-Coder和Qwen2.5-Math模型。

Qwen2.5系列模型在最新的大規模數據集上進行了預訓練，數據集包含高達18T tokens，相較於Qwen2，新模型在知識獲取、編程能力和數學能力方面均有顯著提升。模型支持長文本處理，能夠生成最多8K tokens的內容，並保持了對29種以上語言的支持。

微信截圖_20240919080229.png

微信截圖_20240919080238.png

Qwen2.5系列模型的開源，不僅採用了Apache2.0許可證，還提供了多種不同規模的版本，以適應不同的應用需求。此外，通義千問團隊還開源了性能媲美GPT-4的Qwen2-VL-72B模型。

新模型在指令執行、長文本生成、結構化數據理解以及生成結構化輸出方面取得了顯著改進。特別是在編程和數學領域，Qwen2.5-Coder和Qwen2.5-Math模型在專業數據集上進行了訓練，展現了更強的專業領域能力。

Qwen2.5系列模型體驗:

Qwen2.5合集:https://modelscope.cn/studios/qwen/Qwen2.5

百度發佈Ernie5.1:預訓練成本驟降94%，性能挺進全球Search排行榜前四

百度於2026年5月11日發佈新一代語言模型Ernie5.1，基於2.4萬億參數的Ernie5.0預訓練底座提取。通過“一次性彈性訓練框架”，實現單一訓練優化多尺寸模型，預訓練成本僅爲同類模型的6%。截至5月9日，該模型在Arena Search排行榜以1223分位列全球第四、中國第一，展現高資源利用率與性能平衡。

阿里通義千問Qwen3-Max 在官網上線深度思考功能

阿里通義千問推出Qwen3-Max模型，新增“深度思考”模式，通過強化推理鏈分析和多步驟問題拆解，顯著提升複雜任務處理效率。該模型參數量超1萬億，預訓練數據達36T tokens，是目前規模最大、能力最強的版本，在代碼和智能體能力方面均有明顯進步。

谷歌DeepMind 發佈 VaultGemma 具備差分隱私能力

谷歌 DeepMind 最近推出了一款名爲 VaultGemma 的新型語言模型，這一創新的技術專注於用戶隱私的保護。VaultGemma 不僅是開源的，而且是目前規模最大的具備差分隱私能力的語言模型，參數數量達到了驚人的10億。這項技術的發佈，標誌着人工智能領域在保護用戶數據隱私方面的重大進步。傳統的大語言模型在訓練過程中可能會不小心記住一些敏感信息，比如姓名、地址和機密文檔等。爲了應對這一挑戰，VaultGemma 引入了差分隱私技術，通過在訓練過程中添加可控的隨機噪聲，確保模型的輸出無

阿里通義千問開源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

相關推薦

百度發佈Ernie5.1:預訓練成本驟降94%，性能挺進全球Search排行榜前四

阿里通義千問Qwen3-Max 在官網上線深度思考功能

蘋果推出全新 FS-DFM 模型，AI 長文本寫作效率提升128倍!

螞蟻發佈萬億參數語言模型 Ling-1T，推理速度與能力引領行業新標杆

谷歌DeepMind 發佈 VaultGemma 具備差分隱私能力

阿里通義千問開源Qwen2.5系列模型：Qwen2-VL-72B媲美GPT-4

相關推薦

百度發佈Ernie5.1:預訓練成本驟降94%，性能挺進全球Search排行榜前四

阿里通義千問Qwen3-Max 在官網上線深度思考功能

​蘋果推出全新 FS-DFM 模型，AI 長文本寫作效率提升128倍!

螞蟻發佈萬億參數語言模型 Ling-1T，推理速度與能力引領行業新標杆

谷歌DeepMind 發佈 VaultGemma 具備差分隱私能力

蘋果推出全新 FS-DFM 模型，AI 長文本寫作效率提升128倍!