NVIDIA 支持的初創公司 Starcloud 最近在太空中首次成功訓練了大型語言模型(LLM),標誌着向太空數據中心邁出了重要一步。隨着對計算能力和能源需求的增加,利用太空資源成爲未來的發展方向。
Starcloud 於上個月成功發射了其 Starcloud-1衛星,該衛星搭載了 NVIDIA H100GPU,完成了對 Andrej Karpathy 所研發的 nano-GPT 模型進行訓練,並在谷歌 DeepMind 的 Gemma 模型上進行了推理。Starcloud 的創始人兼首席執行官 Philip Johnston 在 LinkedIn 上表示:“我們剛剛在太空中使用 NVIDIA H100成功訓練了第一個 LLM!我們也是第一個在太空中運行谷歌 Gemma 版本的團隊!”
Johnston 進一步指出,這一成就標誌着將計算資源轉移至太空的重大進展,旨在減輕地球能源資源的消耗,利用幾乎無限的太陽能。Starcloud 的首席技術官 Adi Oltean 也表示,H100在太空中的運作需要公司工程團隊的創新和努力,團隊計劃未來測試更多模型。
Starcloud 成立於2024年,主張建立太空計算中心,以應對傳統數據中心面臨的環境壓力。國際能源署預計,到2030年,數據中心的電力消耗將翻一番。此外,地球上的設施面臨水資源匱乏和排放上升的問題,而太空平臺可以利用不間斷的太陽能,避免降溫難題。
該公司計劃建造一個完全由太陽能供電的太空數據中心,規模達到5吉瓦,覆蓋面積達四公里,預計將超越美國最大的發電廠,同時比同等規模的地面太陽能農場更爲便宜和緊湊。
除 Starcloud 外,谷歌、SpaceX 及貝索斯的藍色起源等公司也在探索太空數據中心的可能性。谷歌最近宣佈了 Suncatcher 項目,旨在將 AI 數據中心置於軌道上,利用衛星與高通量光學連接形成分佈式計算集羣。谷歌首席執行官 Sundar Pichai 稱之爲 “月球計劃”,計劃在2027年進行早期測試。
與此同時,SpaceX 也計劃利用下一代 Starlink 衛星建立太空數據中心,並預計在未來五年內成爲最低成本的 AI 計算選擇。
劃重點:
🌌 Starcloud 在太空中首次訓練大型語言模型,標誌着向太空數據中心的重大進展。
☀️ 該公司計劃建立一個5吉瓦的太陽能數據中心,預計將超越最大的地面發電廠。
🚀 多家公司正在探索太空數據中心的可能性,推動太空計算的快速發展。
