登录体验完整功能(收藏、点赞、评论等) — 已累计有 12529 人加入

AI大模型全生命周期成本拆解:终训仅占总支出极小比例

详情页推荐

据海外科技媒体InfoWorld最新行业调研显示,OpenAI、Anthropic等头部生成式AI企业的大语言模型全生命周期成本中,最终训练环节支出仅占总投入的10%~15%,其余成本集中在数据预处理、推理算力、安全对齐、运维迭代等环节,这也是全行业对模型蒸馏等低成本技术替代方案高度敏感的核心原因。

过去两年,行业讨论大模型成本时,往往会把目光集中在训练阶段的算力投入:GPT-3训练时消耗了约355个GPU年,GPT-4的训练成本更是被传超过1亿美元。但这种普遍认知,其实忽略了AI模型成本结构的绝大部分组成。

2024年以来,头部AI厂商的盈利焦虑持续升温。即使是坐拥超1亿月活用户的ChatGPT,其母公司OpenAI至今仍未实现稳定盈利,单月仅推理算力支出就超过1亿美元。这种投入与营收的错配,根源就在于行业此前对大模型成本的估算存在严重偏差:大众所熟知的“终训成本”,只是整个模型生命周期中占比极小的一次性支出。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。