亞馬遜 SageMaker AI 推出兼容 OpenAI API 的實時推理端點

近日，亞馬遜 SageMaker AI 宣佈推出支持 OpenAI 兼容 API 的實時推理端點。用戶只需更改端點 URL，即可使用 OpenAI SDK、LangChain 或 Strands Agents 等工具調用 SageMaker AI 上的模型，無需進行額外的客戶端定製、SigV4 封裝或代碼重寫。

這一更新使 SageMaker AI 端點開放了一個 /openai/v1 路徑，能夠接受聊天補全請求並直接返回響應，包括流式輸出。所有使用標準 SageMaker AI API 和 SDK 的端點和推理組件均已啓用 OpenAI 端點。通過更改 URL，用戶的現有應用程序可以無縫接入。

SageMaker AI 的功能豐富，支持在自有基礎設施上構建多步驟 AI 代理的工作流，例如使用 Strands Agents 或 LangChain。用戶的代理可以使用與其原有框架相同的 OpenAI 接口調用模型，同時推理過程在自己的 GPU 實例上進行。此外，用戶還可以在同一個 SageMaker AI 端點上託管多個模型，比如用於通用任務的 Llama、針對特定領域的微調 Mistral 模型，以及用於分類的小型模型，所有模型都可通過相同的 OpenAI SDK 訪問。

爲了使用這些功能，用戶需要具備一定的前提條件，包括擁有 AWS 賬戶及相應的權限，安裝 SageMaker 和 OpenAI 的 Python SDK，並準備好存儲在 Amazon S3 中的模型。此外，使用 SageMaker AI OpenAI 兼容端點需要進行 Bearer Token 認證，SageMaker Python SDK 中包含了生成 Token 的工具，能夠簡化認證流程。

在實際操作中，用戶可以輕鬆部署單模型端點或推理組件端點，以便於在單個端點上託管多個模型。通過 OpenAI Python SDK，用戶可以簡單地調用這些模型，獲取需要的推理結果。這項新功能的推出，使得 SageMaker AI 與現有的 AI 應用無縫對接，爲用戶提供了更高效、更靈活的推理解決方案。

劃重點：
🌟 新增 OpenAI 兼容 API：SageMaker AI 實時推理端點現支持 OpenAI API，只需更改 URL 即可調用模型。
🛠️ 多模型託管：用戶可在同一端點上託管多個模型，使用相同的 OpenAI SDK 進行訪問。
🔑 簡化認證流程：支持 Bearer Token 認證，方便用戶安全地訪問 SageMaker AI 端點。

谷歌推出“內置 Gemini”解決方案，全面賦能第三方智能音箱與攝像頭

谷歌在Google I/O 2026發佈Gemini生態進展後，於5月21日推出“內置Gemini”方案，將AI能力引入第三方智能家居硬件，首期聚焦智能攝像頭和音箱。此舉旨在複製Google Assistant的生態擴張路徑，重塑交互體驗，核心是向開發者提供技術輸出。

400tokens/s 刷新全球紀錄!智譜聯合TileRT推出 GLM-5.1高速版 API

智譜發佈GLM-5.1高速版API，輸出速度達400tokens/s，刷新全球大模型API速度紀錄。該模型打破“高性能=高延遲”或“高速=輕量”的傳統認知，首次在國產大模型中實現旗艦級能力與極致低延遲的融合，用戶無需在響應速度與模型質量間取捨。

Anthropic 第二季度預計營收109億美元實現首度盈利，算力重組對標 OpenAI

據《華爾街日報》報道，Anthropic預計今年第二季度實現5.59億美元營業利潤，季度營收環比激增130%至109億美元，成爲全球首家盈利的前沿AI實驗室，增速超越早期谷歌和臉書。核心驅動力是編碼工具在企業端規模化普及及旗艦模型Claude的廣泛應用。

亞馬遜 SageMaker AI 推出兼容 OpenAI API 的實時推理端點

相關推薦

谷歌推出“內置 Gemini”解決方案，全面賦能第三方智能音箱與攝像頭

400tokens/s 刷新全球紀錄!智譜聯合TileRT推出 GLM-5.1高速版 API

估值重塑與價值捕捉：瑞銀覆盤港股互聯網與AI投資新邏輯

Mac 用戶迎效率神器：Codex 迎重大更新，屏幕窗口可直接“喂”給 AI

Anthropic 第二季度預計營收109億美元實現首度盈利，算力重組對標 OpenAI

​亞馬遜 SageMaker AI 推出兼容 OpenAI API 的實時推理端點

相關推薦

谷歌推出“內置 Gemini”解決方案，全面賦能第三方智能音箱與攝像頭

400tokens/s 刷新全球紀錄!智譜聯合TileRT推出 GLM-5.1高速版 API

估值重塑與價值捕捉：瑞銀覆盤港股互聯網與AI投資新邏輯

Mac 用戶迎效率神器：Codex 迎重大更新，屏幕窗口可直接“喂”給 AI

Anthropic 第二季度預計營收109億美元實現首度盈利，算力重組對標 OpenAI

亞馬遜 SageMaker AI 推出兼容 OpenAI API 的實時推理端點