埃隆·馬斯克近日在社交媒體上分享了一段視頻,展示了特斯拉正在奧斯汀總部建設的Cortex AI超級計算機羣的內部構造。這個被重新命名的超級計算機羣是特斯拉“Giga Texas”工廠的一部分,預計將在啓動時需要130兆瓦的冷卻和電力,到2026年這一數字將增長至500兆瓦。
Cortex超級計算機羣的建設規模令人震撼,預計將包含70,000個AI服務器。馬斯克的視頻展示了正在組裝的大量服務器機架,每行包含16個計算機架,每個機架有8個服務器。視頻中可見大約16-20行機架,估算大約有2,000個GPU服務器,這還不到預計完全規模的3%。

在特斯拉7月的財報電話會議中,馬斯克透露Cortex超級計算機羣將包含“50,000個Nvidia H100顯卡,外加20,000個我們自己的硬件”。這比他之前提到的數量有所減少,之前他曾估計Cortex將擁有50,000個特斯拉Dojo AI硬件單元。特斯拉自己的硬件預計將在稍後階段上線,而Cortex在啓動時將完全依賴Nvidia的硬件。
Cortex超級計算機羣的建設目的是爲了“解決現實世界的AI問題”。在特斯拉的2024年第二季度財報電話會議中,這包括訓練特斯拉的全自動駕駛(FSD)系統,這將爲消費者特斯拉汽車和即將推出的“Cybertaxi”產品提供動力,以及訓練Optimus機器人的AI,Optimus是一款預計在2025年開始有限生產的自主人形機器人,將被用於特斯拉的製造流程。
Cortex超級計算機羣的散熱系統同樣引人注目。馬斯克在6月份展示了正在建設中的巨大風扇系統,該系統將爲整個超級計算機羣提供冷卻。這個風扇堆棧爲Supermicro提供的液體冷卻解決方案提供冷卻,該解決方案設計用於最終處理500兆瓦的冷卻和電力。
Cortex超級計算機羣加入了馬斯克正在開發的超級計算機羣行列。目前,馬斯克數據中心中第一個投入運營的是孟菲斯超級計算機羣,由xAI擁有,由100,000個Nvidia H100顯卡驅動。孟菲斯的所有100,000個服務器都通過單一的RDMA(遠程直接內存訪問)網絡連接,並同樣得到Supermicro的幫助進行冷卻。
