

Mistral 的基准测试显示,Saba 在阿拉伯语方面表现优异,同时英语能力相当 | 资料来源:Mistral AI



Mistral 的基准测试显示,Saba 在阿拉伯语方面表现优异,同时英语能力相当 | 资料来源:Mistral AI
阿里通义千问推出Qwen3-Max模型,新增“深度思考”模式,通过强化推理链分析和多步骤问题拆解,显著提升复杂任务处理效率。该模型参数量超1万亿,预训练数据达36T tokens,是目前规模最大、能力最强的版本,在代码和智能体能力方面均有明显进步。
欧洲AI企业Mistral AI推出全栈式生产平台Mistral AI Studio,为企业提供安全、透明、可规模化部署的AI解决方案。平台集成模型部署、监控与优化功能,基于欧盟本土基础设施,解决跨国企业数据主权与合规性痛点,实现AI决策全栈可观测。
苹果与俄亥俄州立大学联合推出FS-DFM模型,仅需8轮迭代即可生成媲美传统模型上千轮迭代的长文本,写入速度提升高达128倍,突破长文本生成效率瓶颈。该模型采用离散流匹配技术,区别于ChatGPT等逐字生成的自回归模型。
蚂蚁集团发布首款万亿参数开源模型Ling-1T,在推理、代码生成、数学计算等领域表现卓越,树立国产AI新标杆。该模型以超强推理速度与能力实现技术突破,测试中超越多款知名开源模型。
法国公司 Mistral AI最近正式推出了其最新的开源推理模型 ——Magistral Small1.2。这款模型拥有令人瞩目的24B 参数,并且以 Apache2.0的开源许可方式发布,充分展示了 Mistral 在 AI 技术创新上的雄心与实力。新版本 Magistral Small1.2不仅支持高达128k 的上下文处理,能够处理多种语言和视觉输入,还引入了一个全新的创新特性 ——[THINK] 特殊 token。这一特殊 token 的设计目的在于包裹推理过程,从而提升模型的表现力和灵活性。相较于前一版本1.1,Magistral Small1.2增加了视觉编码器,使得它在处理图像和