相关推荐
27B数理 SOTA 与3秒情感克隆,有道全面开源“子曰4”多模态与 TTS 引擎
网易有道发布“子曰”大模型4.0版本,全面升级至全模态时代,支持文本、图片、音频融合交互。核心的多模态模型和语音合成(TTS)模型正式开源,翻译模型经技术重构,翻译质量与效率显著提升。多模态模型在视觉和数理领域达到SOTA水平,纯文本数理难题性能行业领先。
2026年5月21号 10:24
163.9k
国产大模型新动向:MiniMax 启动「10x Team」计划,悬赏全球顶尖专家
MiniMax(稀宇科技)启动“10x Team”全球人才合作计划,旨在汇聚各行业顶尖专家,结合行业深度认知与前沿AI技术,推动大模型在垂直领域的应用,将生产力从通用扩展至专业场景,实现行业效率“十倍增长”,并开放多模态核心资源以验证行业认知价值。
2026年5月12号 9:40
181.6k
MiniMax发布“10x Team”计划:招募全球专家推动多领域大模型进化
MiniMax(稀宇科技)启动“10x Team”合作计划,旨在与各行业顶尖人才协作,将大模型从编程、内容创作拓展至工业软件、游戏引擎、芯片设计、金融等垂直领域,实现效率“十倍增长”。已与专家开展实质性合作,验证行业认知对模型进化的驱动作用。
2026年5月11号 9:59
193.9k
TikTok 撤回视频摘要 AI 功能:因频繁出现“蓝莓”等严重幻觉
TikTok 停止测试自动生成视频文字摘要的AI功能“AI概览”,该功能曾在美国等市场小范围测试数月,旨在提供视频背景信息和产品推荐。但因出现严重“幻觉”,如错误将头部创作者Charli D'Amelio的信息混淆,引发广泛关注。TikTok决定将研发转向特定领域。
2026年5月7号 9:03
197.5k
1%的性能提升已成过去式?CVPR2026 揭示视觉智能正经历“范式重写”
计算机视觉正从“看清世界”转向“理解与交互”。随着感知能力接近人类极限,单纯追求准确率的边际收益递减。CVPR2026标志着研究重点转向:视觉成为推理、决策与交互的中介,告别“盲目推理”,迈向自适应与隐式路径,如多模态模型通过“思维链”展开逻辑。
2026年4月30号 11:33
289.5k
