据海外科技媒体InfoWorld最新行业调研显示,OpenAI、Anthropic等头部生成式AI企业的大语言模型全生命周期成本中,最终训练环节支出仅占总投入的10%~15%,其余成本集中在数据预处理、推理算力、安全对齐、运维迭代等环节,这也是全行业对模型蒸馏等低成本技术替代方案高度敏感的核心原因。
过去两年,行业讨论大模型成本时,往往会把目光集中在训练阶段的算力投入:GPT-3训练时消耗了约355个GPU年,GPT-4的训练成本更是被传超过1亿美元。但这种普遍认知,其实忽略了AI模型成本结构的绝大部分组成。
2024年以来,头部AI厂商的盈利焦虑持续升温。即使是坐拥超1亿月活用户的ChatGPT,其母公司OpenAI至今仍未实现稳定盈利,单月仅推理算力支出就超过1亿美元。这种投入与营收的错配,根源就在于行业此前对大模型成本的估算存在严重偏差:大众所熟知的“终训成本”,只是整个模型生命周期中占比极小的一次性支出。
对于To B服务的大模型厂商而言,非训练成本的占比还要更高。为了满足企业客户的定制化需求、数据安全要求和服务可用性承诺,厂商需要额外投入大量资源做私有化部署、专属调优和7*24小时运维,这部分成本往往是通用大模型终训成本的3~5倍。
按照全生命周期核算,一款商用大模型的成本构成可以分为三大部分。
第一部分是前期数据投入,包括训练数据的爬取、清洗、标注、版权采购,通常占总支出的25%~30%,GPT-4等多模态大模型的数据成本占比还要更高,仅视频、音频类素材的版权采购成本就可达数千万美元。
第二部分是最终训练环节,也就是行业常说的“一次性烧卡”阶段,占比仅为10%~15%,随着集群调度技术的优化,这一比例还在持续下降。
第三部分也是最大的成本项,是上线后的持续运维投入,包括用户调用产生的推理算力成本、安全对齐迭代、版本更新、漏洞修复等,占总支出的比例普遍超过55%,用户量越大的模型,这部分成本的占比越高。
这种成本结构也解释了为什么头部AI厂商对模型蒸馏技术的商业化高度警惕。作为一种轻量化模型技术,模型蒸馏可以将千亿参数大模型的能力迁移到十亿甚至亿级参数的小模型上,复刻核心能力的成本仅为原模型终训成本的1%甚至更低。
如果第三方厂商通过蒸馏技术复刻头部大模型的能力,相当于直接跳过了头部企业前期投入的绝大部分成本,只需要支付极低的训练和推理成本就能推出效果接近的竞品,会直接冲击现有大模型的付费商业体系。
目前,头部AI厂商已经把成本优化的重点从训练环节转向后续的运维环节。包括OpenAI、谷歌DeepMind在内的企业都在布局稀疏化推理、边缘算力调度、动态参数调用等技术,目标是在2025年将推理成本降低至当前的十分之一。
业内分析认为,未来大模型企业的核心竞争力不再是训练出参数更高的模型,而是能否在保证效果的前提下,最大限度压低全生命周期的非训练成本,率先实现规模化盈利。

14 小时前
2026年3月30日,格隆汇援引界面新闻消息披露,国产大模型厂商月之暗面(Moonshot AI)推出Kimi K2.5大模型仅一个月后,公司年度经常性收入(ARR)正式突破1亿美元,成功跻身全球AI商业化第一梯队。此次亮眼营收印证了思考型大模型在企业端的高变现价值,行业也出现企业客户预付千万美元抢购算力配额的罕见现象。

14 小时前
2026年3月30日,据Readhub报道,被誉为“欧洲版OpenAI”的法国AI初创企业Mistral AI完成8.3亿美元债务融资,这笔资金由7家银行组成的财团提供,将全部投入算力基础设施建设,核心采购计划为1.38万片英伟达顶级AI芯片,旨在强化大模型训练推理能力,打破中美在通用人工智能领域的主导格局,是欧洲AI发力全球竞赛的标志性动作。

15 小时前
2026年3月30日,爱奇艺正式宣布旗下专业AI智能体平台纳逗Pro开启预商用,这是国内首个步入市场化阶段的影视制作专业智能体。平台接入爱奇艺自研奇智大模型,协同多个主流生成式AI模型,可支持从剧本生成到成片输出的一站式长篇影视创作,2025年底启动内测至今已服务爱奇艺内容团队及多家行业合作伙伴,爱奇艺高级副总裁刘文峰介绍了产品的核心定位。

15 小时前
知名科技媒体InfoWorld最新发布的行业分析指出,当前生成式AI商业化浪潮下,全球企业已经明显分化为两大阵营:一类已进入AI业务常态化运营落地阶段,另一类仍停留在小范围技术实验探索层面。分析认为,决定企业能否从实验阵营跃迁至落地阵营的核心要素,是企业是否储备了可快速适配AI技术的开发工程师,这一分化正在重塑行业竞争格局。

16 小时前
2026年3月30日,埃隆·马斯克旗下AI创业公司xAI曝出核心人事变动,公司最后一位联合创始人、原谷歌DeepMind明星工程师Tony Wu确认离职。这意味着xAI2023年成立时招募的12位来自OpenAI、谷歌、微软的顶尖创始成员,在成立不到三年内已全部流失,此事引发业内对xAI技术研发连续性、内部管理的广泛讨论,也折射出当前AI大模型赛道人才争夺的激烈现状。

18 小时前
2026年3月30日,中文大模型权威基准测评SuperCLUE发布2026年3月最新测评结果,本次共有22款国内外主流大模型参评,覆盖六大核心能力维度。测评显示,字节跳动旗下豆包Doubao-Seed-2.0-pro以71.53分拿下国内第一,跻身全球第一梯队,与OpenAI GPT-5.4的分差已缩小至0.95分,小米MiMo在数学推理单项取得顶尖成绩,标志国产大模型进入高速追赶新阶段。

18 小时前
2026年3月30日,微软正式接手由数据中心开发商Crusoe开发、原计划由OpenAI扩建的美国得克萨斯州阿比林市大型AI数据中心项目。项目完工后,该算力园区将拥有10栋AI数据中心建筑,配套900兆瓦专属发电厂,整体AI总算力将达到2.1吉瓦,微软与OpenAI将共同入驻同一园区。

21 小时前
在2024中国科幻大会期间,科幻作家刘慈欣与王晋康就生成式AI对文学创作的影响展开公开对话。刘慈欣认为当前AI缺乏真实生命体验与创作灵魂,暂无法替代人类作家,但需警惕技术迭代速度;王晋康则提出AI将为科幻创作带来颠覆性革命,二人的观点分歧引发行业对人类创作独特性的广泛讨论。