OpenAI近日面向全球开发者发布两项语音API关键更新,推出实时模型gpt-realtime-1.5及配套音频模型,同时升级Responses API支持WebSocket协议。内部测试显示,新模型使数字字母转录准确率提升约10%,逻辑音频任务准确率提高5%,指令执行准确率提升7%,AI智能体响应速度狂飙40%,大幅强化语音交互与复杂任务处理能力。
对于依赖语音交互构建AI应用的开发者而言,语音指令识别偏差、上下文传输冗余、智能体响应滞后一直是难以突破的瓶颈——而OpenAI最新的两项API更新,正在精准解决这些核心问题。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录