AI基础设施初创公司Gimlet Labs近日完成8000万美元A轮融资,其核心技术可实现AI推理负载在NVIDIA、AMD、Intel、ARM、Cerebras、d-Matrix等多厂商不同架构芯片上的同时调度运行,以轻量化方案破解当前行业普遍面临的AI推理算力瓶颈,为大模型规模化落地降本提效提供了全新技术路径。
随着大模型应用进入规模化落地阶段,AI推理的算力需求正在以每年3倍以上的速度增长,而供应链不稳定带来的芯片架构碎片化问题,正在成为制约推理成本下降的核心障碍。
据行业统计,当前大模型落地的全生命周期成本中,推理侧支出已经占比超过70%,但绝大多数企业的算力池利用率不足60%。其中最核心的痛点在于,过去两年受高端通用GPU供应限制,越来越多企业开始混合采购AMD、ARM架构通用芯片,以及Cerebras、d-Matrix等专用AI加速器,不同厂商的芯片软件栈互不兼容,很难实现统一调度,大量闲置算力无法被有效利用。
不少企业为了适配不同架构的芯片,不得不投入大量研发资源对大模型做定向裁剪,不仅拉长了落地周期,也额外增加了技术成本。
Gimlet Labs推出的核心技术,跳出了此前行业普遍采用的模型定向适配单芯片架构的思路,通过在推理框架与底层硬件之间增加一层轻量化的调度中间件,无需企业修改大模型原有代码,即可自动将推理任务拆分到不同架构的芯片上并行运行,最终实现多厂商芯片的算力池化。
据公开测试数据,这套方案可将混合架构算力池的整体利用率提升至90%以上,同等推理负载下的算力成本可降低35%到55%。本次8000万美元A轮融资,将主要用于技术迭代、团队扩张以及商业化场景的落地验证,目前其方案已经在多家云服务商、大模型企业完成POC测试。
此前行业破解推理瓶颈的思路大多集中在专用芯片研发、大模型压缩两个方向,而Gimlet Labs的方案恰好击中了当前企业“多芯片混合部署”的普遍需求,不需要企业替换现有硬件投入,即可快速实现算力效率提升。
随着AI推理场景越来越分散,未来企业的算力采购将进一步走向多厂商、多架构的混合模式,跨架构调度技术也将成为AI基础设施层的核心刚需,甚至有可能改变整个AI算力行业的供应链格局,降低下游企业对单一芯片厂商的依赖度。

1 小时前
国产AI企业DeepSeek旗下服务于2026年3月29日至31日连续三天出现异常波动,网页端、移动端App及API接口均出现连接中断或响应延迟,三次故障时长分别为1小时48分、10小时13分、1小时3分,其中30日超10小时大规模宕机对开发者生态及企业级应用影响显著。目前服务已全面修复,事件引发业界对大模型基础设施承压能力的深度思考。

1 小时前
2026年4月,企业软件巨头甲骨文被曝启动大规模裁员计划,拟通过削减人力成本回笼资金加码AI基础设施布局。据分析机构TD Cowen测算,若裁员规模达2万至3万人,可释放超100亿美元现金流。甲骨文联席CEO克莱·马古伊克此前透露,公司已锁定5530亿美元AI相关积压订单,其中包括OpenAI的4550亿美元大额采购单。

5 小时前
美国众包AI模型反馈初创企业Yupp.ai于近日正式宣布停止运营,该公司上线至今不足1年,此前曾获得由a16z加密基金合伙人Chris Dixon主导的3300万美元融资,投资方囊括多家硅谷知名投资机构。本次头部AI创企意外关停,也引发行业对AI基础设施赛道商业化路径、需求匹配度的新一轮讨论。

10 小时前
2026年3月29日第二届浦江AI学术年会开幕期间,上海人工智能实验室DeepLink团队正式发布《超节点技术体系白皮书》。该白皮书联合8所顶尖高校、16家核心产业伙伴共同形成产业共识,针对超节点规模化落地过程中异构协同难、跨域调度效率低、工程化部署复杂等核心痛点,为产业实践提供了体系化的理论指导。

22 小时前
2026年3月30日,联想天禧AI生态正式宣布开启天禧AI Claw(内部代号“龙虾”)内测,本次内测面向C端用户开放免费云端超大模型体验权限,产品采用端云混合部署架构,支持本地设备关机状态下云端任务持续运行。用户需将天禧个人超级智能体升级至3.6版本即可提交申请,获得邀请码后即可解锁相关功能。

23 小时前
2026年3月31日,全球头部AI网关开发商LiteLLM正式宣布终止与合规服务商Delve的所有合作,将转由竞品机构重新开展安全认证。此前LiteLLM开源版本遭遇凭证窃取恶意攻击,暴露出Delve为其颁发的两项安全认证存在审计失职,甚至涉嫌数据造假、雇佣无资质审计人员,引发全行业对AI基础设施合规体系的信任质疑。

23 小时前
云原生算力优化服务商ScaleOps近期完成1.3亿美元C轮融资,本轮资金将主要投入基于Kubernetes架构的实时自动化算力调度技术研发,针对性解决当前AI产业高速扩张带来的GPU供给短缺、云服务成本飙升等行业痛点,为大模型训练、推理等场景提供高性价比的算力支撑方案。

1 天前
2026年3月27日,昆仑万维在2026中关村论坛年会专场发布会上正式公布2026AGI战略,天工AI董事长兼CEO周亚辉宣布推出三大SOTA级核心模型,升级构建“3+1”AI平台经济生态,同步落地“天工AIGC全家桶”生态体系,目标为全球内容创作者提供匹敌企业级的全栈AI生产力,进一步释放AGI技术的商业化落地价值。