相关推荐
月之暗面再推多模态新模型,Kimi K2 升级版拟于第一季度亮相
月之暗面计划于2026年第一季度推出多模态模型K2.1/K2.5,该模型基于其万亿参数开源模型Kimi K2升级,旨在提升多模态处理与智能体能力。Kimi K2自2025年7月发布后,凭借混合专家架构在代码生成等领域表现出色。
2026年1月4号 15:30
186.3k
智谱多模态开源周圆满落幕:四项视频生成核心技术全面开放
智谱团队开源四项视频生成核心技术,包括GLM-4.6V视觉理解、AutoGLM设备控制、GLM-ASR语音识别和GLM-TTS语音合成模型,展示其在多模态领域的最新进展,为视频生成技术发展奠定基础。
2025年12月12号 10:44
178.0k
DeepMind 首席执行官预测 2026 年三大 AI 发展趋势
谷歌DeepMind CEO哈萨比斯在Axios AI+峰会上预测,2026年将是多模态AI、互动视频世界和可靠AI代理快速发展的关键一年。他特别提到,其最新模型Gemini在多模态能力上已取得显著进展,不仅能描述情节,还能深入理解场景深层含义。
2025年12月8号 10:30
240.7k
法国 AI 公司 Mistral 发布新模型,力求与 OpenAI 和谷歌保持竞争
法国AI公司Mistral发布新模型,旨在追赶谷歌、OpenAI等全球领先实验室。此次推出包括号称“最佳开放权重多模态多语言模型”的大型模型,以及适用于机器人设备的小型模型,凸显全球AI领域竞争加剧。
2025年12月3号 9:47
157.2k
商汤NEO开源:用1/10数据量媲美顶级多模态模型,终结"拼凑式"AI时代
商汤科技与南洋理工大学S-Lab联合发布开源多模态模型NEO,通过架构创新实现视觉语言深层统一。该模型仅需3.9亿图像文本数据(为同类模型1/10),即可达到顶尖视觉感知性能,无需海量数据或额外视觉编码器,在效率与通用性上取得突破。
2025年12月3号 9:07
141.4k
