通義千問團隊宣佈,繼Qwen2發佈三個月後,Qwen家族的最新成員——Qwen2.5系列語言模型正式開源。這標誌着可能是歷史上最大規模的開源發佈之一,包括了通用語言模型Qwen2.5,以及專門針對編程和數學領域的Qwen2.5-Coder和Qwen2.5-Math模型。
Qwen2.5系列模型在最新的大規模數據集上進行了預訓練,數據集包含高達18T tokens,相較於Qwen2,新模型在知識獲取、編程能力和數學能力方面均有顯著提升。模型支持長文本處理,能夠生成最多8K tokens的內容,並保持了對29種以上語言的支持。


Qwen2.5系列模型的開源,不僅採用了Apache2.0許可證,還提供了多種不同規模的版本,以適應不同的應用需求。此外,通義千問團隊還開源了性能媲美GPT-4的Qwen2-VL-72B模型。
新模型在指令執行、長文本生成、結構化數據理解以及生成結構化輸出方面取得了顯著改進。特別是在編程和數學領域,Qwen2.5-Coder和Qwen2.5-Math模型在專業數據集上進行了訓練,展現了更強的專業領域能力。
Qwen2.5系列模型體驗:
Qwen2.5合集:https://modelscope.cn/studios/qwen/Qwen2.5
