国内AI大模型领军企业阶跃星辰(Stepfun)于2026年4月2日正式发布Step 3.5 Flash系列大模型,该系列针对移动端、高频交互场景深度优化,在保留核心逻辑理解与多模态处理能力的前提下实现毫秒级响应,推理成本大幅降低,目前所有Step Plan付费用户已获得首批体验权限,标志着国产大模型在性能与成本平衡赛道取得新突破。
如果你最近打开过搭载AI助手的智能硬件,大概率会有过这样的体验:问出一个简单的问题后,需要等待2-3秒才能得到回复,这种延迟感直接劝退了不少用户的高频使用意愿。而大模型厂商的成本压力同样不小:日均调用量破千万的应用,单月推理成本往往能突破百万级。这种供需两端的共同痛点,正是阶跃星辰本次新系列模型瞄准的核心目标。
过去三年,大模型行业的竞争始终围绕“能力上限”展开,参数规模从百亿跃升到万亿级别,多模态理解、逻辑推理能力不断追平人类水平,但落地端的“最后一公里”问题始终未得到解决。
尤其在移动端APP、智能硬件、在线客服等高频交互场景,用户对单轮响应的容忍阈值普遍低于1秒,而通用大模型的推理延迟往往在1秒以上,高昂的调用成本也让中小开发者很难扛住规模化后的支出压力。行业调研数据显示,2025年有近6成AI原生应用因为延迟和成本问题终止运营,场景化的适配优化已经成为大模型厂商的核心竞争点。
作为Step 3.5家族的轻量化分支,本次发布的Flash系列并没有牺牲核心能力换速度,官方测试数据显示,其逻辑理解、多模态处理能力与Step 3.5基础版的吻合度达到92%,完全可以满足绝大多数日常交互场景的需求。
在核心性能上,Flash系列针对端侧部署、高频调用做了专项的架构优化,单轮文字生成、语义解析的延迟稳定控制在300毫秒以内,达到通用大模型的5倍响应速度,即便是解析复杂商业图表、处理万字以上长文本,也能在1秒内输出核心结论。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
6 小时前
北京时间2026年5月19日,大模型独角兽Anthropic正式宣布对旗下两款核心AI产品Claude Design、Claude Code完成重磅功能升级。本次调整覆盖Pro、Max、Team、Enterprise全量订阅套餐,将所有付费用户的Token使用上限直接翻倍,同时将Claude Code快速模式的底层模型默认切换为最新Opus 4.7,不加价的前提下大幅降低创作者与开发者的使用门槛。

6 小时前
2026年5月,亚马逊正式为其大模型重构的新一代语音助手Alexa+推出名为Alexa Podcasts的AI定制播客功能,该功能首批面向美国地区用户开放公测,用户仅通过一句简单语音指令,无需上传素材、编写脚本,即可在数分钟内获得完全匹配个人兴趣的专属播客内容,大幅拓展了消费级AI语音助手的落地边界。

6 小时前
2026年5月,谷歌分拆企业SandboxAQ宣布与大模型厂商Anthropic达成深度合作,将自研科学AI模型集成至Claude平台,无需专业计算背景即可调用药物研发工具。背靠前谷歌CEO埃里克·施密特担任主席的团队,SandboxAQ已累计融资超9.5亿美元,此次合作直指传统药物研发平均耗时十年、耗资数十亿美元的行业痛点。

6 小时前
国内头部大模型创业公司月之暗面(旗下拥有Kimi大语言模型)近期完成股东名单重大更新,国智投、北京人工智能基金等国资机构及中国移动正式入局,总额20亿美元的新一轮融资已步入收尾阶段,不到半年其累计融资额突破39亿美元,最新估值较去年11月的43亿美元实现4倍增长,成为国内资本关注度最高的AI创业项目之一。

6 小时前
近日谷歌旗下整合了新一代Gemini大模型的秘密终端项目GoogleBook引发全行业热议,据上游供应链披露的不完全参数显示,该设备可实现70%的AI运算本地离线完成,近期第三方调研机构针对120名AI行业分析师的问卷显示,仅38%受访者看好其成为现象级产品,本文将拆解该项目的市场机会与现存争议。

6 小时前
2026年5月19日腾讯云正式官宣,旗下智能体开发平台ADP搭载的两款核心大模型Hy3preview、DeepSeek-V4-Pro,将于2026年5月27日10点结束全用户免费公测,全面转入正式商业化运营,后续采用实际调用量按量计费规则,配套四档梯度订阅套餐覆盖不同规模用户需求,为国内智能体落地的成本体系划定了新的参考标尺。

6 小时前
以OpenAI为代表的全球大模型厂商当前算力缺口年增速超70%,多地超大型集中式数据中心落地因能耗、用地争议持续受阻,资深AI基础设施分析师张辰近期提出全新落地构想,将家庭闲置的AI边缘设备组网形成分布式算力池,可降低30%以上新增算力投入成本,快速填补集中式算力的供给缺口。

6 小时前
亚马逊本月正式为旗下智能语音助手Alexa的付费升级版本Alexa+上线AI播客生成功能,用户无需手动操作,仅通过语音指令就能在数秒内获得任意主题的定制化播客内容,目前该服务已在北美地区面向所有订阅Alexa+会员的用户开放,是生成式AI落地智能家居交互场景的最新标杆级案例。