2026年5月20日阿里云峰会上,阿里云正式宣布完成面向智能体时代的全栈技术体系升级,联合旗下平头哥发布新一代训推一体AI芯片真武M890,性能较上一代提升3倍,配套推出磐久AL128超节点服务器,重构芯片、云平台、大模型到推理的全链路,为海量智能体连续运行提供底层算力支撑。
在2026阿里云峰会的算力公开演示区,技术团队现场公开了搭载全新芯片的实测数据:面向7B参数多智能体并发运行场景,单卡的单位能耗推理吞吐达到当前行业主流同定位产品的2.1倍,这一数据远超在场多数行业人士的此前预期。
过去五年的云基础设施迭代,核心都是围绕人类用户的交互需求设计,算力潮汐效应明显,峰值集中在用户活跃的工作时段。而当大模型驱动的智能体开始走向大规模落地,场景需求发生了本质变化:大量面向工业、科研、自动运维的智能体需要24小时不间断运行,同时支持多任务并行调度、随时响应环境变化,传统训推分离的算力架构不仅成本居高不下,也很难兼顾训练精度和推理效率的平衡。
本次平头哥推出的真武M890训推一体AI芯片,正是为适配智能体场景量身打造的底层算力底座。该芯片内置144GB原生大显存,实测综合性能达到上一代真武810E的3倍,同时原生覆盖从FP32全精度到FP4超低精度的全谱系数据精度支持,无需额外硬件适配,就能同时满足智能体迭代微调的高精度训练需求,以及大规模并发推理的低延迟需求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
由连续创业者Brett Adcock创立的AI初创公司Hark近日宣布完成7亿美元A轮融资,其秘密研发多年的核心产品为面向全场景的通用AI交互界面,本次融资完成后Hark投后估值达到60亿美元,创下近年全球AI初创企业A轮融资的规模纪录,资金将主要用于技术研发、团队扩张以及产品落地推进。

1 小时前
近日,由知名潜能开发导师Tony Robbins与多名冥想应用Calm前核心员工共同创立的心理健康科技公司The Path正式对外公布其自研AI心理干预模型的测试结果:该模型在行业权威心理健康安全AI基准测试Vera-MH中拿到95的高分,远超当前市面主流消费级聊天机器人最高65分的水平,为AI心理治疗场景落地补上了关键的安全短板。

1 小时前
2026年5月21日,科技行业资深评论人Will Douglas Heaven发布深度行业观察指出,Anthropic推出的专属AI编码工具Code with Claude正在快速渗透全球开发者群体,最新调研数据显示已有超62%的受访全职开发者将半数以上常规编码任务交由该类工具完成,软件开发的底层生产逻辑已经发生永久性转向。

1 小时前
微软近期面向Windows 11全量推送的功能更新,正式修复了困扰数千万用户的高频搜索卡顿、结果错配顽疾,该项目由微软Windows生态副总裁帕诺斯·帕奈牵头主导,将原生大模型检索能力与系统底层逻辑深度打通,官方测试数据显示优化后系统搜索综合响应速度提升42%,同时实现了Copilot服务的全域快速唤起。

2 小时前
近期谷歌正式面向消费级市场推出完整的AI代理生态规划,计划2026年年内上线超20款覆盖生活全场景的原生AI代理应用,同时向第三方开发者开放全栈适配接口。不过最新行业调研数据显示,目前仅32%的普通消费者愿意授权AI代理处理个人事务,这套酝酿已久的新生态落地前景仍存在不小的不确定性。

2 小时前
近期国内工业铝锭现货价同比上涨20%,下游光伏、新能源汽车产业链的铝原料缺口持续扩大,多家资源回收赛道初创企业正在落地基于计算机视觉的AI分选系统,行业技术负责人李默透露,该套AI方案可将废铝识别回收率提升37%,大幅压缩传统人工分选的运营成本,有望在2027年形成千万吨级的稳定再生铝供给源。

2 小时前
近日谷歌正式官宣,原本仅搭载在Pixel系列手机上的端侧AI功能Magic Cue将全面开放适配更多第三方应用。该功能依托谷歌Gemini端侧大模型实现上下文智能识别,预计2024年底将覆盖超20款安卓生态头部应用,用户无需跳转就能完成信息提取、快捷操作,大幅降低跨应用操作的交互成本。

2 小时前
近期网络安全研究团队披露,海外匿名社区4chan内依托AI生成技术开展非伦理图像定制的从业者(圈内被称为“AI巫师”),近半年数量上涨370%。这类从业者依托基于开源Stable Diffusion微调的专属模型,仅需数分钟就能将普通日常照片转换为高度逼真的非授权裸照,单张定制报价从5美元到上百美元不等,现有主流平台的AI内容反滥用机制几乎完全失效。