隨着生成式人工智能熱潮的持續,算力資源已成爲科技巨頭們爭奪的核心。近日,谷歌因 Gemini AI 平臺需求激增,被迫收緊了資源供應,旨在應對日益增長的開發者及企業負載壓力。
自 2025 年春季以來,Gemini API 的調用請求量翻倍,使得這一核心算力資源供不應求。爲了保障生態系統的公平使用,谷歌於 2026 年 5 月 17 日正式實施了基於算力額度的使用限制,採用類似流量套餐的滾動更新機制。對於超出配額的請求,系統將觸發頻率限制,確保所有合作伙伴在資源吃緊的背景下均能獲得基礎調用支持。
在這一系列變動中,Meta 受到的衝擊最爲顯著。據悉,由於 Meta 對該模型的需求遠超其他客戶,谷歌此前已明確表示無法足額滿足其申請的算力配額。這一突發限制直接打亂了 Meta 多項內部 AI 項目的推進節奏。爲應對算力壓力,同時配合公司內部壓縮人工智能研發成本的戰略,Meta 已緊急要求員工優化調用流程,提升代碼及令牌的使用效率。
業內人士指出,此次資源調控反映出全球 AI 算力底座面臨的嚴峻現實:儘管大模型能力不斷躍升,但支撐其高效運行的基礎算力基礎設施建設速度,仍難以完全追趕上爆發式的應用需求。對於像 Meta 這樣深度依賴雲端算力的廠商而言,如何在資源受限的前提下維持研發速度,將成爲下階段競爭的關鍵課題。
