登录体验完整功能(收藏、点赞、评论等) — 已累计有 9451 人加入

让AI触手可及,让应用激发潜能

亚马逊SageMaker AI推出兼容OpenAI API的实时推理端点

2026年5月21日,亚马逊旗下云AI开发平台SageMaker AI正式推出支持OpenAI兼容API的实时推理端点功能,开发者仅需修改原有应用的端点URL,无需重写代码、额外完成特殊签名封装,就可通过OpenAI官方SDK、LangChain、Strands Agents等主流开发工具直接调用托管模型,大幅降低企业跨平台迁移大模型应用的成本。

不少做生成式AI应用开发的团队最近都有一个共同的痛点:前期用OpenAI的接口规范快速搭建了产品原型,等到要上线部署私有微调模型、满足数据合规要求的时候,光是适配云厂商的专属推理接口就要花掉一两周的开发时间。这次SageMaker AI的更新,直接瞄准了这个行业共性的痛点给出了落地方案。

过去三年OpenAI的API接口已经逐渐成为全球大模型应用开发的事实工业标准,市面上超过80%的RAG知识库应用、多智能体工作流、对话式产品,在开发阶段都优先选择OpenAI的接口规范进行编码。不同云厂商各自的专属推理接口,往往有不同的鉴权逻辑、参数定义、流式输出格式,开发者迁移应用的时候要反复调试适配,非必要的开发成本占据了整体迭代周期的近30%。

本次上线的新推理端点,为所有存量和新增的SageMaker AI托管推理实例开放了专属的/openai/v1请求路径,开发者无需对原有OpenAI SDK的调用逻辑做任何修改,仅替换端点URL就可以发起标准的聊天补全请求,原生兼容流式输出、上下文传参、工具调用等所有OpenAI标准API的核心能力,也无需额外完成亚马逊云生态的SigV4签名封装,大幅简化了跨生态的调用流程。所有原本适配标准SageMaker API的推理组件,都默认开启该兼容能力,不需要开发者额外进行配置。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯