在剛剛結束的2025年 I/O 開發者大會上,谷歌宣佈開源全新醫療 AI 模型 ——MedGemma。這款基於 Gemma3架構的模型專爲醫療領域設計,具備強大的多模態圖像和文本理解能力,旨在提升醫療診斷與治療效率。
MedGemma 提供兩種配置選項,分別爲4B 和27B 參數模型。4B 參數模型主要用於醫療圖像的分類和解讀,能夠生成詳細的診斷報告或回答與圖像相關的問題;而27B 參數模型則專注於處理臨牀文本,特別適合於患者分診和決策輔助。這意味着,醫生可以更快地獲得有關患者病情的有價值信息,從而更有效地制定治療方案。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
其中,4B 模型的圖像編碼器採用了 SigLIP 技術,預訓練數據涵蓋了胸部 X 光、皮膚病學、眼科及組織病理學等多個領域的圖像,使得其在處理複雜醫療圖像時表現出色。相比之下,27B 模型則以270億參數爲基礎,專注於深度理解醫療文本,爲臨牀推理提供支持,幫助醫務人員更快速地進行決策。
更爲靈活的是,開發者可以選擇在本地運行這些模型進行實驗,或者通過谷歌雲的 Vertex AI 平臺將其部署爲 HTTPS 端點,方便進行大規模應用。谷歌還提供了 Colab 筆記本等豐富的資源,幫助開發者進行模型的微調和集成。
此外,谷歌鼓勵開發者針對特定的使用場景對模型進行驗證和微調,並提供了相關指導和工具,支持開發者在適配過程中使用提示工程、上下文學習及 LoRA 等方法進行高效的參數微調。這使得 MedGemma 不僅是一款先進的 AI 工具,更是開發者和醫務人員在日常工作中提升效率的重要助手。
MedGemma 的推出標誌着醫療 AI 領域的又一重大進展,爲未來的醫療實踐帶來了無限可能。
