登录体验完整功能(收藏、点赞、评论等)

少找工具,多做创作

阶跃星辰推出Step 3.5 Flash系列 主打低本极速交互场景

国内AI大模型领军企业阶跃星辰(Stepfun)于2026年4月2日正式发布Step 3.5 Flash系列大模型,该系列针对移动端、高频交互场景深度优化,在保留核心逻辑理解与多模态处理能力的前提下实现毫秒级响应,推理成本大幅降低,目前所有Step Plan付费用户已获得首批体验权限,标志着国产大模型在性能与成本平衡赛道取得新突破。

如果你最近打开过搭载AI助手的智能硬件,大概率会有过这样的体验:问出一个简单的问题后,需要等待2-3秒才能得到回复,这种延迟感直接劝退了不少用户的高频使用意愿。而大模型厂商的成本压力同样不小:日均调用量破千万的应用,单月推理成本往往能突破百万级。这种供需两端的共同痛点,正是阶跃星辰本次新系列模型瞄准的核心目标。

过去三年,大模型行业的竞争始终围绕“能力上限”展开,参数规模从百亿跃升到万亿级别,多模态理解、逻辑推理能力不断追平人类水平,但落地端的“最后一公里”问题始终未得到解决。

尤其在移动端APP、智能硬件、在线客服等高频交互场景,用户对单轮响应的容忍阈值普遍低于1秒,而通用大模型的推理延迟往往在1秒以上,高昂的调用成本也让中小开发者很难扛住规模化后的支出压力。行业调研数据显示,2025年有近6成AI原生应用因为延迟和成本问题终止运营,场景化的适配优化已经成为大模型厂商的核心竞争点。

作为Step 3.5家族的轻量化分支,本次发布的Flash系列并没有牺牲核心能力换速度,官方测试数据显示,其逻辑理解、多模态处理能力与Step 3.5基础版的吻合度达到92%,完全可以满足绝大多数日常交互场景的需求。

在核心性能上,Flash系列针对端侧部署、高频调用做了专项的架构优化,单轮文字生成、语义解析的延迟稳定控制在300毫秒以内,达到通用大模型的5倍响应速度,即便是解析复杂商业图表、处理万字以上长文本,也能在1秒内输出核心结论。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创