相关推荐
清华联合腾讯混元斩获MLSys2026MoE推理挑战赛冠军,NPU推理提速4.1倍
清华大学存储实验室与腾讯混元AI Infra团队在MLSys2026 MoE模型推理优化挑战赛中获全球冠军。针对万亿参数混合专家(MoE)架构在异构NPU上的推理瓶颈,联合团队设计了全链路优化方案,包括E-Shard策略、PSUM三维张量批量读出及GEMV路径,显著提升性能。
2026年5月25号 9:09
137.6k
腾讯开源多语言翻译“利器”Hy-MT2,轻量版仅440MB可本地运行,小程序已上线
腾讯混元近日开源多语言翻译模型Hy-MT2,并同步推出“腾讯Hy翻译”小程序。该模型家族包含三种尺寸,支持33种语言互译及5种民族语言/方言翻译。其中,轻量级Hy-MT2-1.8B采用自研AngelSlim 1.25-bit极端量化技术,专为移动端优化,兼顾高质量与高效率。
2026年5月21号 17:36
267.0k
微信宣布小程序成长计划正式接入Hy3 preview
微信小程序“成长计划”于5月15日完成模型升级,全面接入腾讯混元Hy3preview模型。新版本提供更强的逻辑推理与上下文理解能力,旨在提升开发者在微信生态内的智能化开发与运营体验。官方同步发布升级指南,助力计划实施。
2026年5月15号 11:37
551.9k
中国移动发布MoMA平台:开启AI“水电煤”时代,Token成本降幅达30%
2026移动云大会上,中国移动发布MoMA模型服务平台,推动大模型从实验室走向千行百业,实现AI“随处可用”。平台核心优势是聚合能力,通过统一API网关,用户一次接入即可调用包括自研“九天”基座大模型在内的300余款主流模型,实现“拎包入住”。
2026年5月11号 9:58
194.8k
腾讯混元 Hy3 预览版上线两周,Token 调用量激增超十倍
腾讯混元最新数据显示,自Hy3预览版上线后,Token调用量持续攀升,达到前代Hy2的十倍。增长主要集中于代码和智能体场景,尤其在WorkBuddy、Codebuddy和Qclaw等应用中,增幅超16.5倍。过去一周Token调用量达3.66万亿,获周榜总榜及市场占有率双第一,编程和智能体应用表现突出。
2026年5月7号 17:28
231.4k
