国内AI大模型领军企业阶跃星辰(Stepfun)于2026年4月2日正式发布Step 3.5 Flash系列大模型,该系列针对移动端、高频交互场景深度优化,在保留核心逻辑理解与多模态处理能力的前提下实现毫秒级响应,推理成本大幅降低,目前所有Step Plan付费用户已获得首批体验权限,标志着国产大模型在性能与成本平衡赛道取得新突破。
如果你最近打开过搭载AI助手的智能硬件,大概率会有过这样的体验:问出一个简单的问题后,需要等待2-3秒才能得到回复,这种延迟感直接劝退了不少用户的高频使用意愿。而大模型厂商的成本压力同样不小:日均调用量破千万的应用,单月推理成本往往能突破百万级。这种供需两端的共同痛点,正是阶跃星辰本次新系列模型瞄准的核心目标。
过去三年,大模型行业的竞争始终围绕“能力上限”展开,参数规模从百亿跃升到万亿级别,多模态理解、逻辑推理能力不断追平人类水平,但落地端的“最后一公里”问题始终未得到解决。
尤其在移动端APP、智能硬件、在线客服等高频交互场景,用户对单轮响应的容忍阈值普遍低于1秒,而通用大模型的推理延迟往往在1秒以上,高昂的调用成本也让中小开发者很难扛住规模化后的支出压力。行业调研数据显示,2025年有近6成AI原生应用因为延迟和成本问题终止运营,场景化的适配优化已经成为大模型厂商的核心竞争点。
作为Step 3.5家族的轻量化分支,本次发布的Flash系列并没有牺牲核心能力换速度,官方测试数据显示,其逻辑理解、多模态处理能力与Step 3.5基础版的吻合度达到92%,完全可以满足绝大多数日常交互场景的需求。
在核心性能上,Flash系列针对端侧部署、高频调用做了专项的架构优化,单轮文字生成、语义解析的延迟稳定控制在300毫秒以内,达到通用大模型的5倍响应速度,即便是解析复杂商业图表、处理万字以上长文本,也能在1秒内输出核心结论。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
11 小时前
Rainmaker Securities总裁Glen Anderson最新披露,当前全球私人股权二级市场活跃度创下历史峰值,AI创企Anthropic成为最受追捧的交易标的,同赛道头部企业OpenAI交易热度出现明显下滑,而SpaceX临近的IPO计划,或将对整个一级科技创投市场的资金流向产生颠覆性影响。

16 小时前
谷歌近日面向企业级客户发布全新AI推理管控套件,针对当前企业部署大模型时平均推理成本占AI总支出60%以上、峰值时段服务可用性不足92%的行业痛点,提供动态算力调度、故障自动切换等功能,可帮助企业将推理环节综合成本降低30%左右,同时大幅提升生成式AI服务的运行稳定性。

16 小时前
2026年美国中期选举进入倒计时阶段,头部大模型企业Anthropic近日宣布成立全新政治行动委员会(PAC),计划定向支持认同其分级AI监管、算力资源倾斜、AIGC版权保护等政策议程的议员候选人。此次动作是头部AI企业从技术研发向政策上游延伸的标志性事件,也意味着全球AI行业的政策博弈进入白热化阶段。

16 小时前
据科技媒体The Information及行业分析师Eric Newcomer披露,AI大模型厂商Anthropic已于近期完成对秘密运营的生物科技AI初创公司Coefficient Bio的收购,本次交易为全股票形式,总对价达4亿美元。这是Anthropic首次落地生命科学垂直领域布局,也标志着大模型厂商商业化正加速向生物医药赛道渗透。

16 小时前
近日,AI大模型企业Anthropic宣布为旗下对话式AI产品Claude推出Windows平台本地交互能力,新版本可直接跨应用调取用户邮件、本地存储的各类文档,还能自主执行系统级任务操作。据官方披露,该功能可将文档整理、日程响应类办公流程的处理效率提升45%,无需用户手动上传文件即可完成复杂指令。

16 小时前
谷歌近期推出定价仅3美元的AI算力棒Magic Stick,主打为服役超过5年的老旧Windows、Mac PC提供轻量化AI算力支撑,用户无需更换硬件即可流畅运行Gemini全系AI服务,解决旧设备本地算力不足无法加载大语言模型的痛点。该产品瞄准全球超12亿台服役超期的存量PC市场,最快2024年第四季度正式开售。

16 小时前
美国科技媒体Digital Trends近期发布的行业调查显示,全球已有超6成大中型保险公司引入AI系统负责核保风控、理赔核查等核心业务环节。美国消费者权益组织2024年调研数据显示,37%的拒赔案例由AI算法单独判定,其中42%存在事实认定偏差,相关算法决策的公正性问题已引发多国监管部门重点关注。

1 天前
谷歌近期正在推进端侧轻量化大模型Gemini Nano 4的终端适配工作,预计2025年第一季度发布的下一代安卓旗舰机型将率先搭载该模型。其端侧推理性能较上一代提升62%,支持离线语音交互、实时图像生成等12项新增本地AI功能,无需上传数据至云端即可完成运算,在隐私安全性、响应速度上均有显著提升。