登录体验完整功能(收藏、点赞、评论等) — 已累计有 8671 人加入

让AI触手可及,让应用激发潜能

AI大模型全生命周期成本拆解:终训仅占总支出极小比例

据海外科技媒体InfoWorld最新行业调研显示,OpenAI、Anthropic等头部生成式AI企业的大语言模型全生命周期成本中,最终训练环节支出仅占总投入的10%~15%,其余成本集中在数据预处理、推理算力、安全对齐、运维迭代等环节,这也是全行业对模型蒸馏等低成本技术替代方案高度敏感的核心原因。

过去两年,行业讨论大模型成本时,往往会把目光集中在训练阶段的算力投入:GPT-3训练时消耗了约355个GPU年,GPT-4的训练成本更是被传超过1亿美元。但这种普遍认知,其实忽略了AI模型成本结构的绝大部分组成。

2024年以来,头部AI厂商的盈利焦虑持续升温。即使是坐拥超1亿月活用户的ChatGPT,其母公司OpenAI至今仍未实现稳定盈利,单月仅推理算力支出就超过1亿美元。这种投入与营收的错配,根源就在于行业此前对大模型成本的估算存在严重偏差:大众所熟知的“终训成本”,只是整个模型生命周期中占比极小的一次性支出。

对于To B服务的大模型厂商而言,非训练成本的占比还要更高。为了满足企业客户的定制化需求、数据安全要求和服务可用性承诺,厂商需要额外投入大量资源做私有化部署、专属调优和7*24小时运维,这部分成本往往是通用大模型终训成本的3~5倍。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创