山洪暴發因其突發性和局部性,一直是全球氣象預報中最難攻克的“幽靈”災害。今日,谷歌宣佈通過一種極具創意的方案破解了這一難題:利用大語言模型挖掘新聞報道中的非結構化數據,成功構建了覆蓋全球的山洪預測體系。

傳統深度學習模型往往因缺乏歷史氣象監測數據而難以在偏遠地區發揮作用。谷歌研究團隊改變了思路,利用的閱讀理解能力,深度梳理了全球 500萬篇新聞報道。

  • 數據轉化:模型從新聞中提取出 260萬次洪水事件的記錄,並將這些定性描述轉化爲帶有地理標籤和時間戳的定量數據,形成了名爲“Groundsource”的獨特數據集。

  • 模型訓練:基於這些“地面真實情況”,研究人員訓練了一個 LSTM 神經網絡模型,能夠通過全球氣象預報數據預測特定區域的山洪概率。

谷歌抗災項目負責人表示,Groundsource 數據集最大的意義在於其“均衡性”。

  • 服務弱勢地區:對於那些無力承擔昂貴氣象雷達、缺乏完整氣象記錄的國家和地區,該模型提供了一種低成本的預警方案。

  • 實戰驗證:目前,谷歌已在爲150個國家的城市區域標註了風險等級。南部非洲發展共同體的官員證實,該模型已顯著提升了當地應對洪水的反應速度。

儘管該模型目前在分辨率(20平方公里)和雷達實時性上仍有提升空間,但這種從文字類定性信息中構建定量數據集的方法,爲防災減災開啓了新範式。谷歌團隊表示,未來計劃將這一技術推廣到熱浪、泥流等其他短暫但致命的自然災害預測中。

通過將 AI 的語言理解能力轉化爲物理世界的預警能力,谷歌不僅展示了的技術上限,更爲全球防災減災工作貢獻了一種更具包容性的科技力量。