Groq是专注于AI推理加速的AI基础设施平台,核心定位是为开发者和企业提供速度更快、成本更低的大模型推理服务。平台依托自研的LPU(语言处理单元)架构,针对大语言模型推理场景做了专门优化,区别于传统通用GPU推理方案,Groq在推理延迟和推理成本上都有明显优势,能够帮助各类开发者和企业快速落地大模型应用,适配从原型测试到商业化落地的全阶段需求。
在实际测试中,Groq的LPU推理速度相比主流GPU提升2-5倍,大模型单token生成延迟可控制在毫秒级;在C端AI聊天场景下,用户提问后可实现近乎实时的回复,无明显等待感,交互体验远超传统推理方案;在高并发场景下,Groq能够支撑更多并发推理请求,同时单位推理成本比GPU方案低30%以上,帮助企业大幅降低AI基础设施投入成本,不少创业团队已经基于Groq的推理服务上线了商用AI产品。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 个月前
在AI计算需求激增的时代背景下,初创公司Starcloud凭借其创新构想迅速崛起。这家成立于17个月前并通过Y Combinator孵化器快速成长的企业,已成功完成1.7亿美元的A轮融资,成为YC历史上最快达到“独角兽”估值(10亿美元以上)的初创公司。其核心战略聚焦于在近地轨道部署数据中心,旨在利...

2 个月前
全球企业级软件厂商Oracle近日正式推出JDK 26通用可获得性(GA)版本,作为短周期迭代版本,该版本将提供6个月的Premier级别官方支持,新增多项面向生成式AI、大模型应用开发的原生工具链优化,可帮助开发者显著降低Java生态下AI应用的开发与部署成本。

2 个月前
近日,芯片巨头英伟达发布超预期财报,本季度营收达681.3亿美元,数据中心业务营收同比增长75%,财年净利润突破1200亿美元。同时,英伟达取消与OpenAI原计划的千亿级投资合作,改为注资30亿美元,双方仍保持紧密技术协作,全球AI计算投资需求是其增长核心驱动力。

18 小时前
2026年5月19日,蚂蚁集团自研的智能终端可信连接技术框架GPASS迎来新落地场景:搭载该技术框架的乐奇AI眼镜新版本正式上线城市伴游功能。作为杭州文旅、支付宝与乐奇联合打造的“镜游杭州”项目核心载体,首个文旅官方智能体“杭小忆”同步入驻,可实时为用户提供周边景点讲解、交互问答、导航等全链条服务。

18 小时前
北京时间2026年5月19日,大模型独角兽Anthropic正式宣布对旗下两款核心AI产品Claude Design、Claude Code完成重磅功能升级。本次调整覆盖Pro、Max、Team、Enterprise全量订阅套餐,将所有付费用户的Token使用上限直接翻倍,同时将Claude Code快速模式的底层模型默认切换为最新Opus 4.7,不加价的前提下大幅降低创作者与开发者的使用门槛。

18 小时前
2026年5月,亚马逊正式为其大模型重构的新一代语音助手Alexa+推出名为Alexa Podcasts的AI定制播客功能,该功能首批面向美国地区用户开放公测,用户仅通过一句简单语音指令,无需上传素材、编写脚本,即可在数分钟内获得完全匹配个人兴趣的专属播客内容,大幅拓展了消费级AI语音助手的落地边界。

18 小时前
2026年5月,谷歌分拆企业SandboxAQ宣布与大模型厂商Anthropic达成深度合作,将自研科学AI模型集成至Claude平台,无需专业计算背景即可调用药物研发工具。背靠前谷歌CEO埃里克·施密特担任主席的团队,SandboxAQ已累计融资超9.5亿美元,此次合作直指传统药物研发平均耗时十年、耗资数十亿美元的行业痛点。

18 小时前
国内头部大模型创业公司月之暗面(旗下拥有Kimi大语言模型)近期完成股东名单重大更新,国智投、北京人工智能基金等国资机构及中国移动正式入局,总额20亿美元的新一轮融资已步入收尾阶段,不到半年其累计融资额突破39亿美元,最新估值较去年11月的43亿美元实现4倍增长,成为国内资本关注度最高的AI创业项目之一。