相关推荐
苹果发布多模态新模型 Manzano:打破“看图”与“绘图”的界限
苹果推出多模态模型Manzano,通过创新的“双修”架构,解决了AI领域长期存在的视觉理解与图像生成难以兼顾的难题。
2026年1月15号 8:56
149.9k
月之暗面再推多模态新模型,Kimi K2 升级版拟于第一季度亮相
月之暗面计划于2026年第一季度推出多模态模型K2.1/K2.5,该模型基于其万亿参数开源模型Kimi K2升级,旨在提升多模态处理与智能体能力。Kimi K2自2025年7月发布后,凭借混合专家架构在代码生成等领域表现出色。
2026年1月4号 15:30
218.2k
智谱多模态开源周圆满落幕:四项视频生成核心技术全面开放
智谱团队开源四项视频生成核心技术,包括GLM-4.6V视觉理解、AutoGLM设备控制、GLM-ASR语音识别和GLM-TTS语音合成模型,展示其在多模态领域的最新进展,为视频生成技术发展奠定基础。
2025年12月12号 10:44
184.5k
DeepMind 首席执行官预测 2026 年三大 AI 发展趋势
谷歌DeepMind CEO哈萨比斯在Axios AI+峰会上预测,2026年将是多模态AI、互动视频世界和可靠AI代理快速发展的关键一年。他特别提到,其最新模型Gemini在多模态能力上已取得显著进展,不仅能描述情节,还能深入理解场景深层含义。
2025年12月8号 10:30
266.0k
法国 AI 公司 Mistral 发布新模型,力求与 OpenAI 和谷歌保持竞争
法国AI公司Mistral发布新模型,旨在追赶谷歌、OpenAI等全球领先实验室。此次推出包括号称“最佳开放权重多模态多语言模型”的大型模型,以及适用于机器人设备的小型模型,凸显全球AI领域竞争加剧。
2025年12月3号 9:47
160.1k
