近日,谷歌宣佈推出全新開源模型 TxGemma,專爲提升治療性藥物的研發效率而設計。這一模型由谷歌 DeepMind 團隊基於其先進的 Gemma 模型家族微調開發,融合了強大的語言理解、科學預測以及多輪對話功能,旨在爲藥物研發領域帶來革命性的突破。TxGemma 的發佈被視爲人工智能技術在生物醫藥領域的重要進展,有望大幅縮短藥物從實驗室到臨牀的週期,同時降低高昂的研發成本和失敗率。
全流程支持藥物研發
TxGemma 的核心優勢在於其能夠模擬藥物研發的完整流程,從早期藥物篩選到後期臨牀試驗結果預測,覆蓋多個關鍵環節。研究人員可以利用該模型進行藥物分子的毒性預測、藥物靶點識別以及療效評估等任務。得益於其強大的計算能力,TxGemma 能夠快速分析小分子化合物、化學物質和蛋白質等生物實體特性,幫助科學家更高效地篩選出潛在的候選藥物,並預測其在臨牀試驗中的表現。這種端到端的支持使得 TxGemma 成爲藥物研發中的“全能助手”,有望改變傳統研發模式中耗時長、風險高的現狀。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
三種規模,靈活適配需求
爲了滿足不同研究場景和計算資源的需求,TxGemma 提供了三種模型規模:2B(20億參數)、9B(90億參數)和27B(270億參數)。這些模型根據參數量的大小,適用於從輕量級任務到高複雜度研究的多種應用場景。每種規模的模型均包含“預測”(Predict)版本,專爲特定任務優化,例如判斷某一分子是否具有毒性或能否通過血腦屏障。此外,9B 和27B 規模的模型還推出了“聊天”(Chat)版本,不僅能執行預測任務,還能通過自然語言與研究人員進行多輪對話,解釋預測背後的推理過程,並回答覆雜的科學問題。這種對話能力爲研究人員提供了一個互動性更強的工具,進一步提升了研發的靈活性和深度。

性能卓越,通用性突出
TxGemma 的性能表現尤爲亮眼,尤其是其最大的27B 參數“預測”版本。據悉,該版本在幾乎所有測試任務中都超越或匹敵了谷歌此前的通用模型 Tx-LLM,顯示出極高的預測精度和穩定性。更令人矚目的是,27B 模型甚至能與專爲單一任務設計的專業模型相媲美,展現了其在多任務場景下的強大適應性。這種通用性不僅減少了研究人員對多種專用模型的依賴,還爲跨領域藥物研發提供了新的可能性。谷歌表示,TxGemma 的開發過程中使用了來自 Therapeutics Data Commons 的700萬個訓練樣本,確保其在藥物相關任務上的專業性和可靠性。

開源模式推動協作創新
作爲一款開源模型,TxGemma 已通過谷歌的 Vertex AI 平臺和 Hugging Face 向全球研究社區開放。谷歌強調,TxGemma 的設計初衷不僅在於提供強大的計算工具,更在於通過開放性激發全球科學家和開發者的協作創新。研究人員可以根據自身需求對模型進行微調,適配特定的治療性藥物開發場景。谷歌還同步發佈了配套的 Colab 筆記本,展示如何將 TxGemma 集成到複雜的研究工作流中,進一步降低了使用門檻。
未來展望
藥物研發一直是一個高風險、高投入的領域。據統計,90%的候選藥物在第一階段臨牀試驗後即告失敗,而成功研發一款新藥往往需要數十億美元和超過十年的時間。TxGemma 的出現爲這一現狀帶來了新的希望。通過結合人工智能的預測能力和多輪對話功能,該模型不僅能加速藥物篩選和優化過程,還能爲研究人員提供更具洞察力的決策支持。業界專家認爲,TxGemma 的開源發佈可能推動藥物研發進入一個更加高效和協作的新時代。
隨着 TxGemma 的逐步應用,其在實際藥物研發中的表現將成爲關注的焦點。谷歌表示,未來將繼續優化模型性能,並期待社區反饋以推動其進一步迭代。可以預見,隨着人工智能與生物醫藥的深度融合,像 TxGemma 這樣的工具將在拯救生命、改善人類健康的道路上發揮越來越重要的作用。
官方介紹:
https://developers.googleblog.com/en/introducing-txgemma-open-models-improving-therapeutics-development/
