2026年5月22日,智谱联合TileRT正式面向部分企业客户推出GLM-5.1高速版API,其输出速度达到400tokens/s,刷新当前全球大模型API的速度纪录。该产品打破行业长期存在的“高性能必高延迟、高速必轻量化”的固有认知,首次在国产大模型中实现旗舰级能力与极致低延迟的融合,用户无需在响应速度与模型质量间做取舍。
不少深耕AI编程代理场景的开发者都有过类似的糟糕体验:提交大型项目重构需求后,要对着加载转圈的界面等待数分钟,才能等到逐字输出的代码方案,数十轮调用累积出来的延迟,甚至会直接打断原本连贯的开发思路。刚刚正式亮相的GLM-5.1高速版API,首先瞄准的就是这类长期被性能矛盾困扰的速度敏感型生产场景。
过去数年大模型产业高速迭代,能力边界不断拓展,但一个近乎默认的行业共识始终没有被打破:想要获得旗舰级的复杂推理、长上下文处理能力,就必须接纳更高的推理延迟,想要API输出速度达到实时可用的标准,就只能裁剪模型参数,选用牺牲能力的轻量化版本。
此前全球主流头部大模型厂商公开的通用API输出速度,大多集中在100tokens/s-200tokens/s区间,这一瓶颈直接限制了大量低延迟刚需场景的落地,不少面向终端用户的实时交互产品,只能被迫选用性能大打折扣的轻量化模型,最终影响用户体验。
这次智谱和TileRT的联合技术攻关,完全没有走传统“降精度、裁参数”换取速度的老路,而是从算子底层优化、推理调度策略重构、显存资源动态复用多个维度对模型做了全链路改造。
在完整保留原版GLM-5.1旗舰级全能力的前提下,团队最终将端到端的tokens输出速度拉升到400tokens/s,这一速度相当于每秒可生成近300个汉字,远超绝大多数普通用户的信息接收上限,用户甚至会产生“刚输入指令,AI就已经输出完全部内容”的无等待体验,彻底告别此前大模型输出时的逐字等待感。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
5 小时前
2024年下半年以来,全球AI赛道迎来新一轮产品迭代潮:OpenAI下一代大模型GPT-5研发进入收尾阶段,Google Gemini全端覆盖用户突破10亿,苹果Apple Intelligence随新系统正式推送,国内厂商DeepSeek、Perplexity等垂直类AI工具月活涨幅超60%,AI代理、AI PC等新形态应用也从概念走向落地,全行业商业化进程持续提速。

6 小时前
近日独立AI创作者借助OpenAI GPT-4o、DeepSeek大模型等工具,成功复刻科幻名作《挽救计划》(Project Hail Mary)的全星系恒星地图,经原著爱好者联合校验,该星图对书中提及的12万颗天体坐标还原度达99.7%,误差控制在0.3%以内,远超此前所有同人衍生内容的制作精度,成为近期生成式AI落地小众创作领域的标杆案例。

6 小时前
全球科技巨头Meta近期正式启动基于生成式AI改造Facebook Groups的新项目,推出对标社区平台Reddit的全新兴趣社交产品。该产品集成Meta自研Llama 3大语言模型,首批灰度测试已经覆盖超过1.2亿原有Facebook群组活跃用户,主打AI驱动的内容自动化治理与兴趣匹配功能,意图抢占近年持续升温的垂直兴趣社区赛道。

7 小时前
B站于2026年5月发布的第一季度财报显示,公司单季总营收达74.7亿元同比增长7%,首次实现净利润2.02亿元正式扭亏,经调整净利润5.85亿元同比大增62%。B站CEO陈睿将AI定义为历史性增长机遇,本季度广告收入25.9亿元同比激增30%,AI全链路赋能成为核心驱动因素,为国内内容平台的AI商业化落地提供了可参考的全新样本。

7 小时前
国内头部大模型厂商DeepSeek近期官宣累计融资额突破700亿元,管理层正式对外披露全新战略方向,不再将短期商业化收益作为核心考核目标,集中全部资源攻坚前沿AI技术,其中面向开发者的编程专属大模型DeepSeek Code已进入落地筹备阶段,相关配套的Agent Harness技术团队招聘工作也已全面启动。

7 小时前
2026年5月22日,OpenAI正式发布嵌入微软PowerPoint底层架构的ChatGPT for PowerPoint测试版插件,面向所有普通用户与ChatGPT Plus会员完全免费开放,支持一句话生成幻灯片、自动排查逻辑与格式错误等功能,直接打破传统PPT工具的创作效率瓶颈,是近期AI办公赛道最受瞩目的落地产品。

7 小时前
市场调研机构Comscore近期发布2026年3月美国桌面端消费级AI聊天机器人市场报告,数据显示当月全品类相关平台累计独立用户达4440万,环比增长超21%。OpenAI旗下ChatGPT以3386万独立访客稳居行业第一,Anthropic推出的Claude环比增速高达130%,正在快速缩小与头部产品的市场差距。

7 小时前
2026年5月,豪华汽车制造商宝马集团正式宣布将Agentic AI智能体技术深度整合至全球日常业务流程,突破传统生成式AI仅能做信息问答的局限,将AI从辅助工具升级为可自主执行复杂工作流的数字化助手,首批在旗下Alphabet欧洲车队租赁业务试点后,订单处理效率提升90%,为实体产业的工业AI落地提供了可参考的标杆案例。