跨數據中心的創新：Moonshot AI 與清華大學提出 PrfaaS 架構

隨着大型語言模型（LLM）在推理過程中對計算資源的需求不斷增加，傳統的服務架構面臨瓶頸。Moonshot AI 與清華大學的研究團隊最近推出了一種新架構 —— 預填充即服務（PrfaaS），旨在打破大型語言模型服務中對數據中心和計算機資源的限制。

目前，大型語言模型的推理過程通常分爲預填充和解碼兩個階段。預填充階段是模型處理輸入並生成鍵值緩存（KVCache）的高計算密集型過程，而解碼階段則是模型逐個生成輸出的內存帶寬密集型過程。傳統架構需要在同一數據中心中完成這兩個階段，這在計算和帶寬上造成了限制。

PrfaaS 通過將預填充任務卸載到專用的高計算集羣上，並利用通用以太網將生成的 KVCache 傳輸到本地解碼集羣，從而實現了跨數據中心的高效服務。研究表明，該架構在處理性能上顯著提升，相比於傳統模型，服務吞吐量提高了 54%。在實際案例研究中，該架構還表現出更低的延遲和更高的效率。

PrfaaS 架構的設計將計算、網絡和存儲三大子系統分開管理，通過精確的路由機制確保長請求能高效傳輸，避免了傳統方法中因資源分配不均而導致的擁堵問題。同時，該系統還引入了雙時間尺度調度機制，以應對不同流量模式的變化，進一步優化資源利用。

隨着對跨數據中心推理需求的增加和新型硬件的不斷涌現，PrfaaS 無疑爲未來的 AI 應用提供了新的解決方案。

OpenAI表態支持特朗普AI行政令：願在模型發佈前接受政府安全評估

OpenAI表示將遵守特朗普簽署的人工智能模型發佈前審查行政命令。公司全球事務負責人喬治·奧斯本在倫敦SXSW活動上確認，將簽署這項自願性命令並參與評估。他強調OpenAI對自身責任“非常嚴肅”，並指出作爲掌握強大技術的公司，需謹慎行事。

OpenAI CEO 薩姆・奧特曼：積極主動的 AI 將成爲未來趨勢

OpenAI首席執行官薩姆·奧特曼提出AI產品發展三階段理論：第一階段是聊天模型（如ChatGPT），第二階段爲基於代理的系統（如Codex），第三階段是“積極主動的AI”，即後臺持續運行、自動執行任務的AI。當前代理階段是最大產品類別，主要響應客戶需求，但用戶使用中仍存在侷限。

MiniMax 因新模型計費模式變更致歉：承認溝通不足，公佈老用戶補償與退款方案

稀宇科技（MiniMax）推出新一代旗艦模型MiniMax-M3時，將按次計費改爲按Token消耗量計費，未提前充分溝通。由於Token消耗遠超預期，導致重度用戶額度快速耗盡，引發開發者強烈不滿。6月2日晚，MiniMax發佈致歉聲明，承認溝通不足。

OpenAI表態支持特朗普AI行政令：願在模型發佈前接受政府安全評估