登录体验完整功能(收藏、点赞、评论等)

IBM发布Granite 4.0 1B Speech 轻量化语音大模型瞄准企业边缘场景

2026年3月16日,IBM正式发布专为边缘计算与企业级部署打造的紧凑型多模态语音大模型Granite 4.0 1B Speech。该模型参数量仅为前代产品的50%,性能实现显著跃升,新增日语自动语音识别、关键词偏置功能,英文转录准确率大幅提升,目前已支持6种主流语言的语音识别与双向互译。

对于大量布局线下语音交互场景的企业而言,语音大模型的落地长期面临两难选择:云端部署存在传输延迟高、敏感数据泄露风险等问题,端侧部署则受限于终端算力,往往要在模型准确率和运行效率之间做取舍。IBM此次推出的新语音模型,恰好击中了这一长期存在的市场痛点。

近年来,零售门店智能客服、工业设备语音操控、线下网点实时翻译等场景的需求持续增长,这类场景普遍要求语音交互能力在本地运行,既不能有过高的延迟,也不能将用户语音数据上传至云端处理。过往行业内的同级别语音模型要么参数过大无法在普通边缘终端运行,要么为了压缩体积牺牲了识别准确率,无法满足企业级场景的可靠性要求。

此次发布的Granite 4.0 1B Speech最核心的优势在于参数量仅为上一代同系列产品的50%,但核心性能反而实现了显著提升。该模型采用创新的两阶段设计架构:第一阶段先将音频信号转换为文本,第二阶段再调用专属的Granite语言模型完成后续推理任务,这种模块化设计允许开发者根据场景需求灵活裁剪功能,比如仅需要语音转录能力时可以关闭翻译模块,进一步降低资源占用。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创