AI芯片厂商SambaNova当地时间2月24日推出第五代RDU AI芯片(SN50),该芯片性能达上代产品5倍,在Llama 3.3 70B大模型上的推理速度为英伟达B200 GPU的5倍。同时,SambaNova与英特尔达成多年期合作,并完成3.5亿美元E轮融资,英特尔资本参与其中;软银将率先在日本下一代AI数据中心部署这款芯片。
在全球AI算力需求爆发的当下,智能体推理场景的算力瓶颈正成为行业突破的核心方向,而SambaNova的最新动作,恰好击中了这一市场痛点。这家专注于可重构数据流AI芯片的企业,通过第五代产品的发布,进一步夯实了在推理专用芯片赛道的技术优势。
SN50芯片专门面向智能体推理工作负载打造,主打超低延迟、高吞吐量、节能三大核心优势。从技术架构来看,它采用大容量内存+HBM+SRAM的三层次存储结构,通过优化数据流转路径显著降低了推理时延。官方数据显示,SN50的整体性能达到上一代RDU芯片的5倍,在运行Llama 3.3 70B大模型时,推理速度更是英伟达B200 GPU的5倍,这一表现将极大提升复杂智能体应用的响应效率。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 天前
2026年4月3日消息,2023年成立的印度AI初创公司Sarvam AI正式开启新一轮融资,计划募集3亿至3.5亿美元,由贝塞默风险投资领投,亚马逊、英伟达及沙特阿美旗下风投Prosperity7Ventures均在参投行列,融资完成后公司投后估值将达15亿至15.5亿美元,凸显全球资本对印度本土AI赛道的长期看好。

1 天前
2026年4月2日商务部例行新闻发布会上,新闻发言人何亚东针对Meta拟收购专注AI Agent技术的初创企业Manus一事作出正式回应,明确表示中国支持企业基于发展需求开展跨国经营与技术合作,但相关交易需严格遵守中国法律法规、履行法定程序。此次收购此前被市场视为Meta补强通用人工智能(AGI)布局的核心动作。

2 天前
近日谷歌宣布调整AI Pro订阅服务权益,所有已付费的AI Pro订阅用户无需额外支付费用,即可将原有云存储空间升级至5TB。该订阅服务包含Gemini Advanced大模型使用权限、Google Workspace AI增强功能等权益,本次升级覆盖全球超百万活跃付费用户,预计将进一步提升谷歌AI订阅产品的市场竞争力。

2 天前
国际开源Java开发框架Spring正式推出Spring AI专属开发套件,支持开发者沿用Spring原生开发约定,无需额外学习Python栈AI开发技术,即可快速搭建可落地的Java语言AI Agent,据官方测试数据,同复杂度AI Agent的开发周期可缩短62%,目前该工具包已面向全球开发者开放正式版下载。

2 天前
2026年4月2日,智谱正式发布专为视觉编程打造的原生多模态Coding基座模型GLM-5V-Turbo。该模型融合视觉理解与代码生成能力,上下文窗口达200k,可将设计稿、网页界面等视觉信息转化为可运行代码,在多模态编程、GUI Agent等核心基准测试中实现同尺寸模型性能领先,填补了AI Agent从纯字符感知到视觉感知的技术空白。

2 天前
2026年4月2日,国内民航出行服务平台航旅纵横正式上线AI预订机酒功能,依托AI大模型与AI Agent技术能力,用户仅需通过自然语言输入出行需求,系统即可自动完成机票、酒店的搜索、筛选、推荐全链路操作,无需手动比对勾选,大幅降低用户决策与操作成本,成为垂直领域AI落地业务执行场景的典型样本。

2 天前
2026年4月2日,AI搜索初创公司Perplexity AI在美国旧金山联邦法院遭遇集体诉讼,被指控未经用户许可,即便用户开启专属隐身模式,仍通过内置追踪器向Meta、Google共享包含财务、税务信息在内的敏感聊天内容。目前Perplexity发言人杰西·德怀尔称尚未收到正式诉讼文件,Meta称其政策严禁广告商提交敏感数据,谷歌暂未作出回应。

2 天前
2026年4月2日,腾讯QQ宣布正式原生接入开源AI框架OpenClaw(别名“小龙虾”),此次技术整合由腾讯轻量云与QQ团队联合主导,官方内置QQ Bot插件随OpenClaw v2026.3.31版本同步上线,核心代码已并入OpenClaw主仓库。该插件支持私聊、多媒体消息交互及多账号管理,大幅简化AI Bot部署流程,标志着即时通讯与生成式AI生态融合进入新阶段。