最近,商汤联合上海AI实验室等机构发布了大语言模型InternLM-123B。在全球51个评测集的测试中,它的12项成绩排名第一,综合实力位居全球第二,部分指标超越GPT-4。这主要得益于商汤在数据处理方面的强大能力,以及庞大的SenseCore算力基础。在技术迭代速度上,商汤也领先同行,半年时间就将InternLM-104B升级至123B。可以说,InternLM-123B的强劲表现拉近了中国与国外在大模型领域的差距。如果商汤能继续保持技术迭代的速度,很可能会成为首个达到GPT-4水平的国产大模型。
相关推荐
哈佛教授“收徒”AI:仅用两周将 Claude 培养成物理系研二学生
哈佛大学通过两周“导师制”训练,使AI模型Claude达到物理专业研二水平,标志着人工智能正从知识检索工具演变为能深度参与前沿科研的伙伴。
2026年3月26号 11:04
59.0k
Kimi杨植麟:大模型训练进入AI主导研究的第三阶段
月之暗面创始人杨植麟在中关村论坛上指出,大模型训练已进入由AI主导的第三阶段,实现从依赖天然数据和人工标注向高度自动化自我进化的范式转移。此前经历了依赖互联网数据与人工标注的第一阶段,以及侧重大规模数据处理的第二阶段。
2026年3月25号 14:02
178.8k
小米AI全栈布局进入爆发期,系统级智能助手MiClaw开启端侧新范式
小米2025年财报显示,总收入4573亿元,同比增长25%,调整后净利润392亿元,大增43.8%。公司预测2026年为AI应用爆发年,正加速将大模型、多模态技术与“人车家全生态”深度融合,已完成基础模型布局,自研大模型已在语音、语言等领域应用。
2026年3月25号 11:21
157.4k
狂飙 455%!京东发布 AI 全家桶:JoyAI 大模型开源,具身智能计划采集千万小时视频
京东AI布局从“单点突破”转向“全线爆发”,公布AI研发与应用进展,涵盖基础大模型、数字人、具身智能及智能体生态,旨在将AI深度植入供应链与电商场景。其中,京东首次开源基础大模型JoyAI,调用量环比暴增4.55倍。
2026年3月25号 11:03
174.3k
7 天狂飙2. 3 万Star!GitHub“外包公司”项目走红:戳破大模型的全能幻觉
开源项目agency-agents以“拼装专家”模式走红,不追求大模型参数,而是通过分工协作打造“即插即用”的数字外包团队。截至2026年3月24日,该项目GitHub星标突破6万,一周内净增2.3万,登顶全球周增长榜首,迅速席卷开发者社区。
2026年3月24号 14:20
224.0k
