谷歌發佈最強開源語言模型Gemma2 性能超越Llama3

就在不久前的谷歌I/O柏林大會上，谷歌宣佈開源其最新語言模型Gemma2，該模型在性能和效率方面取得了重大突破。Gemma2提供9B和27B兩種參數規模的版本，其中27B版本的性能已經接近參數量爲70B的Llama3模型，但模型大小僅爲後者的40%左右。

Gemma2的主要特點包括:

（1）提供9B 和27B 參數尺寸

(2) 一流的性能

(3) 能夠進行高效推理(在單個 NVIDIA H100GPU 或 TPU 主機上運行)

(4) 爲開發人員和研究人員設計的易於使用的模型

此外，Gemma2 還具有以下特點：

（1）卓越的性能:27B型號可與尺寸超過2倍的Llama3 70B型號相媲美

(2) 高效率:單個GPU即可實現全精度推理

(3) 廣泛的硬件支持:從遊戲筆記本電腦到雲端

(4) 開放許可:也可以用於商業用途

開發人員友好的設計

爲方便開發者使用，Gemma2兼容多種主流AI框架，如Hugging Face、JAX、PyTorch和TensorFlow等。谷歌還提供了新的Gemma2Cookbook，包含實際應用示例和指南。此外，谷歌計劃在不久的將來支持通過Google Cloud Vertex AI輕鬆部署Gemma2。

twitter_Tom Huang(@tuturetom)_20240627-161818_1806361424043885034_photo.jpg

在負責任的AI發展方面，谷歌推出了一系列舉措，包括提供負責任的生成式AI工具包、開源LLM比較器（用於模型評估），以及計劃開源SynthID文本水印技術。谷歌還承諾進行嚴格的安全評估並公佈結果。

twitter_Tom Huang(@tuturetom)_20240627-161849_1806361553094234268_photo.jpg

目前，開發者和研究人員可以通過Google AI Studio免費獲取Gemma2模型。模型權重也可以從Kaggle和Hugging Face平臺下載。對於學術研究人員，谷歌還提供了Google Cloud積分計劃，申請截止日期爲8月9日。

值得注意的是，Gemma2在權威的LMSys榜單上的表現超過了QWen1.5模型，進一步證明了其強大的性能。這一突破性成果將爲AI領域帶來新的機遇和挑戰，推動開源語言模型的進一步發展。

三年下注600億發力AI，小米大模型斬獲全球雙料第一提速智能化轉型

小米集團董事長雷軍5月26日透露，2026年一季度研發投入90億元，同比增長33.4%，研發人員超2.6萬人，全年研發投入預計突破400億元。自研大模型Xiaomi MiMo-V2.5-Pro在Artificial Analysis榜單中，綜合智能指數與Agent指數均位列全球開源模型並列第一。

估值破 200 億美元！月之暗面“拆牆”赴港，AI獨角獸開啓資本新紀元

月之暗面完成約20億美元融資，估值突破200億美元后，宣佈拆除紅籌架構，正式啓動赴港上市進程。此舉旨在響應北京對境內企業境外上市的新監管規定，紅籌架構作爲科技企業常用模式，正面臨調整。公司架構重整將爲IPO鋪路。

三年下注600億發力AI，小米大模型斬獲全球雙料第一提速智能化轉型