登录体验完整功能(收藏、点赞、评论等)

OpenAI语音API重大升级:转录精度提10%,智能体响应狂飙40%

OpenAI近日面向全球开发者发布两项语音API关键更新,推出实时模型gpt-realtime-1.5及配套音频模型,同时升级Responses API支持WebSocket协议。内部测试显示,新模型使数字字母转录准确率提升约10%,逻辑音频任务准确率提高5%,指令执行准确率提升7%,AI智能体响应速度狂飙40%,大幅强化语音交互与复杂任务处理能力。

对于依赖语音交互构建AI应用的开发者而言,语音指令识别偏差、上下文传输冗余、智能体响应滞后一直是难以突破的瓶颈——而OpenAI最新的两项API更新,正在精准解决这些核心问题。

作为本次更新的核心,OpenAI推出了全新实时模型gpt-realtime-1.5及其配套音频模型,目标直指语音命令的可靠性痛点。根据OpenAI内部测试数据,新模型在数字和字母的转录准确率上提升约10%,彻底改善了以往AI在识别“第8页”“验证码X3K7”这类含关键字符指令时的常见错误。同时,逻辑音频任务准确率提高5%,指令执行准确率提升7%,意味着AI智能体在处理“先播放背景音乐,再创建会议提醒”这类多步语音指令时,偏差率大幅降低,执行逻辑更贴合用户真实需求。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创