谷歌推出全新的开源模型系列「Gemma」,Gemma 与 Llama 2、Mistral 相比表现出色,具有独特的设计原则。Gemma 使用GeGLU激活函数,参数规模较大但能够取代其他开源模型,展示了强大潜力。
相关推荐
Starcloud 在太空中成功训练大型语言模型
Starcloud公司利用搭载NVIDIA H100GPU的卫星,在太空中成功训练了nano-GPT模型并完成Gemma模型推理,标志着太空数据中心发展的重要进展。
2025年12月11号 16:57
137.7k
首个太空数据中心诞生!Starcloud 在轨道上训练大语言模型
初创公司Starcloud成功在太空轨道上训练大语言模型,成为全球首例。其卫星搭载英伟达H100芯片,并运行基于谷歌开源模型Gemma的应用程序,开启了太空数据中心的新纪元。公司计划为客户提供商业服务,卫星发回的信号展示了其独特视角。
2025年12月11号 11:18
160.2k
法国 AI 公司 Mistral 发布新模型,力求与 OpenAI 和谷歌保持竞争
法国AI公司Mistral发布新模型,旨在追赶谷歌、OpenAI等全球领先实验室。此次推出包括号称“最佳开放权重多模态多语言模型”的大型模型,以及适用于机器人设备的小型模型,凸显全球AI领域竞争加剧。
2025年12月3号 9:47
133.9k
汇丰银行与 Mistral 达成合作,借助 AI 提升运营效率
汇丰银行与AI公司Mistral合作,引入先进AI工具提升业务效率,重点优化多语言文档处理、翻译及文件分析等内部流程,以技术创新推动运营升级。
2025年12月1号 14:15
157.3k
谷歌 Gemma 模型争议揭示 AI 开发生命周期的风险
谷歌Gemma模型因误传美国参议员布莱克本的虚假信息引发争议,被指诽谤。谷歌于10月31日宣布将Gemma3模型从AI Studio平台撤下,以防止误解。目前该模型仅通过API可用,AI Studio上已无法访问。
2025年11月4号 9:57
143.3k
