中國大模型在國際頂尖競技場上再次刷新了紀錄。3月20日,
憑藉這一強勢表現,

作爲由國際開源研究機構 LMSYS 組織的第三方評測平臺,
數學能力: 排名全球第五,展現了極強的邏輯推理底蘊。
綜合性能: 在無風格控制的絕對勝率比拼中位列全球第六。
專家級處理: 在複雜文本處理能力方面同樣躋身全球前十。

據
目前,該模型已作爲預覽版開放,

中國大模型在國際頂尖競技場上再次刷新了紀錄。3月20日,
憑藉這一強勢表現,

作爲由國際開源研究機構 LMSYS 組織的第三方評測平臺,
數學能力: 排名全球第五,展現了極強的邏輯推理底蘊。
綜合性能: 在無風格控制的絕對勝率比拼中位列全球第六。
專家級處理: 在複雜文本處理能力方面同樣躋身全球前十。

據
目前,該模型已作爲預覽版開放,
歐洲Mistral AI發佈全能型大模型Mistral Small4,首次在單一模型中融合旗艦級推理、多模態理解和強大編程能力,讓開發者無需在不同垂直模型間選擇,實現“全都要”。
阿里巴巴千問Qwen3.5-Max-Preview模型在LMArena盲測榜單中表現突出,以1464分刷新國產模型紀錄,並在多項評測中超越GPT5.4、Claude4.5及Grok4.1等海外頂尖模型,標誌着中國自研大模型正式躋身全球第一梯隊。
字節跳動AI助手豆包於2026年3月啓動AI電商功能灰度測試,將大模型深度融入電商交易。該功能主打“一句話購物”,利用自然語言理解能力,用戶僅需模糊表達需求,系統即可精準匹配商品、提供建議並直達下單,大幅簡化購物流程。截至2025年底,豆包月活用戶已達2.26億。
阿里千問大模型家族發佈旗艦預覽版Qwen3.5-Max-Preview,在全球權威評測平臺LM Arena中刷新紀錄,綜合得分1464分。該模型在LMSYS匿名盲測中表現強勁,全球總排名第五,爲中國大模型最高;其數學能力位列全球第五,展現出專家級文本處理水平。
日本樂天集團發佈號稱國內最強自研大模型,但開源社區發現其底層架構文件指向中國團隊開發模型,引發套殼爭議。