登录体验完整功能（收藏、点赞、评论等） — 已累计有 9196 人加入

谷歌推出企业级AI推理管控工具兼顾成本控制与运行可靠性

AI创作导航 1 个月前

风向

92

收藏

谷歌近日面向企业级客户发布全新AI推理管控套件，针对当前企业部署大模型时平均推理成本占AI总支出60%以上、峰值时段服务可用性不足92%的行业痛点，提供动态算力调度、故障自动切换等功能，可帮助企业将推理环节综合成本降低30%左右，同时大幅提升生成式AI服务的运行稳定性。

AI生成配图

图源: 图像由AI生成

从某头部电商平台公开的内部数据来看，去年其大模型客服系统全年调用量超过12亿次，仅推理环节的算力支出就超过8000万元，而今年618大促期间的峰值调用量更是突破日常的7倍，一度出现部分请求响应延迟超5秒的问题——这也是当前多数企业落地生成式AI时遇到的共性难题。

不同于大模型训练环节的一次性算力投入，推理是大模型上线后响应用户请求的过程，会随着调用量的增长持续产生支出。Gartner发布的2024年AI产业报告显示，今年全球企业在AI推理环节的总支出将首次超过训练支出，占AI总算力投入的52%，部分高频调用大模型的互联网、金融企业，推理成本占AI总支出的比例甚至超过70%。

除了成本高企之外，推理环节的稳定性不足也是企业的普遍痛点：峰值时段算力不足导致的响应延迟、节点故障导致的服务中断，都会直接影响C端用户体验或内部业务效率。

此次谷歌推出的AI推理管控工具，面向所有使用谷歌云Vertex AI服务的企业客户开放，无需额外付费即可激活使用，核心覆盖三大场景需求。

一是**动态算力削峰机制**，企业可自主设置单月推理成本上限、优先级请求规则，当调用量超出阈值时，系统会自动将非核心请求分流到成本更低的轻量大模型，避免算力溢出产生额外支出。

大语言模型生成式AI 企业级服务 AI推理谷歌云

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

点赞收藏分享

相关网站

捏Ta

AI生成内容创作引擎

提示工程指南

提示工程领域专业学习平台

Grok Bikini AI

AI生成定制比基尼设计工具

Capsolver

AI自动解验证码

AKOOL

生成式AI营销视频创作平台

Claude

Claude 是由 Anthropic 研发的 AI 助手与大语言模型

OpenAI

OpenAI 是全球领先的人工智能研究机构与模型提供商

Pixal3D

AI 3D模型与动作生成工具

相关资讯

© 2026 AI创作导航. All Rights Reserved.

滇ICP备2026002425号-1 公安备案图标

公安备案图标

滇公网安备 53252802528133号