随着千亿参数级通用大语言模型(LLM)在企业落地过程中逐步触达规模与成本的双重瓶颈,面向垂直场景定制优化的小语言模型(SLM)正成为市场新热点。据行业测算,同等推理任务下SLM的运行成本仅为通用大模型的1/10到1/5,推理速度提升3至8倍,同时可实现本地化部署规避数据泄露风险,正在推动企业AI架构的全面重构。
过去三年,全球企业在生成式AI领域的投入增速连续保持在40%以上,但超过6成的落地项目都卡在了规模化商用环节。核心痛点集中在三个层面:一是成本过高,千亿参数级大模型单月推理成本往往超过百万级别,对大多数业务场景单一的企业来说投入产出比极低;二是数据合规风险,调用公网通用大模型需要将企业内部的业务数据、客户信息等上传至第三方服务器,金融、制造、政务等敏感领域的合规要求完全无法满足;三是响应效率不足,通用大模型参数冗余,针对简单的场景化任务往往会出现不必要的推理过程,延迟远高于企业业务系统的要求。
此前行业调研显示,62%的中大型企业因数据隐私问题暂停了公网大模型的深度业务集成,仅将其用于非核心的文案生成、公开信息查询等低风险场景,核心业务的AI改造迟迟无法推进。
和千亿参数级的通用大模型不同,当前主流的商用SLM参数规模大多集中在10亿到100亿之间,不需要覆盖全领域的通识知识,仅需针对企业特定的业务数据集做小批量微调,就能达到甚至超过通用大模型在对应场景下的表现。
某头部制造企业的落地案例显示,其针对设备运维场景微调的70亿参数SLM,故障预判准确率比调用的通用大模型高出12个百分点,单次推理速度提升6倍,单月运行成本仅为过去的1/8,且完全部署在企业内部私有云,没有任何数据外流的风险。
针对企业普遍担心的“幻觉”问题,由于SLM的训练数据全部来自经过校验的企业内部业务资料,输出结果的准确率普遍能达到95%以上,远高于通用大模型在垂直场景不到80%的准确率水平。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 天前
北京时间2026年5月19日,大模型独角兽Anthropic正式宣布对旗下两款核心AI产品Claude Design、Claude Code完成重磅功能升级。本次调整覆盖Pro、Max、Team、Enterprise全量订阅套餐,将所有付费用户的Token使用上限直接翻倍,同时将Claude Code快速模式的底层模型默认切换为最新Opus 4.7,不加价的前提下大幅降低创作者与开发者的使用门槛。

1 天前
2026年5月,亚马逊正式为其大模型重构的新一代语音助手Alexa+推出名为Alexa Podcasts的AI定制播客功能,该功能首批面向美国地区用户开放公测,用户仅通过一句简单语音指令,无需上传素材、编写脚本,即可在数分钟内获得完全匹配个人兴趣的专属播客内容,大幅拓展了消费级AI语音助手的落地边界。

1 天前
2026年5月,谷歌分拆企业SandboxAQ宣布与大模型厂商Anthropic达成深度合作,将自研科学AI模型集成至Claude平台,无需专业计算背景即可调用药物研发工具。背靠前谷歌CEO埃里克·施密特担任主席的团队,SandboxAQ已累计融资超9.5亿美元,此次合作直指传统药物研发平均耗时十年、耗资数十亿美元的行业痛点。

1 天前
国内头部大模型创业公司月之暗面(旗下拥有Kimi大语言模型)近期完成股东名单重大更新,国智投、北京人工智能基金等国资机构及中国移动正式入局,总额20亿美元的新一轮融资已步入收尾阶段,不到半年其累计融资额突破39亿美元,最新估值较去年11月的43亿美元实现4倍增长,成为国内资本关注度最高的AI创业项目之一。

1 天前
近日谷歌旗下整合了新一代Gemini大模型的秘密终端项目GoogleBook引发全行业热议,据上游供应链披露的不完全参数显示,该设备可实现70%的AI运算本地离线完成,近期第三方调研机构针对120名AI行业分析师的问卷显示,仅38%受访者看好其成为现象级产品,本文将拆解该项目的市场机会与现存争议。

1 天前
据行业测算,2024年全球终端侧AI芯片出货量同比增幅将超过72%,苹果为快速扩大自研生成式AI功能Apple Intelligence的落地覆盖范围,在新款消费电子设备中采用了定制化算力调配方案,OpenAI、谷歌、DeepSeek等头部厂商也同步推进GPT-5、Google Gemini等大模型的端侧适配研发,AI终端赛道竞争正进入全新落地阶段。

1 天前
2026年5月19日腾讯云正式官宣,旗下智能体开发平台ADP搭载的两款核心大模型Hy3preview、DeepSeek-V4-Pro,将于2026年5月27日10点结束全用户免费公测,全面转入正式商业化运营,后续采用实际调用量按量计费规则,配套四档梯度订阅套餐覆盖不同规模用户需求,为国内智能体落地的成本体系划定了新的参考标尺。

1 天前
以OpenAI为代表的全球大模型厂商当前算力缺口年增速超70%,多地超大型集中式数据中心落地因能耗、用地争议持续受阻,资深AI基础设施分析师张辰近期提出全新落地构想,将家庭闲置的AI边缘设备组网形成分布式算力池,可降低30%以上新增算力投入成本,快速填补集中式算力的供给缺口。