专注大语言模型(LLM)工作负载的AI芯片初创企业MatX,由两位前谷歌TPU工程师创立,于当地时间2月24日完成5亿美元B轮融资,投资方包括世芯AIchip、美满Marvell等企业及多家投资机构。其正在研发的MatX One芯片据称可实现业界领先的LLM吞吐量,延迟表现媲美SRAM优先芯片,为AI算力部署提供新的优化路径。
当大语言模型向万亿参数级迭代,企业部署AI算力时的核心矛盾愈发凸显:如何在保障实时交互低延迟的同时,支撑起海量并发请求的高吞吐?这一长期困扰云服务商、AI应用厂商的难题,正被MatX以技术创新的方式尝试破解。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录