据海外科技媒体InfoWorld最新行业调研显示,OpenAI、Anthropic等头部生成式AI企业的大语言模型全生命周期成本中,最终训练环节支出仅占总投入的10%~15%,其余成本集中在数据预处理、推理算力、安全对齐、运维迭代等环节,这也是全行业对模型蒸馏等低成本技术替代方案高度敏感的核心原因。
过去两年,行业讨论大模型成本时,往往会把目光集中在训练阶段的算力投入:GPT-3训练时消耗了约355个GPU年,GPT-4的训练成本更是被传超过1亿美元。但这种普遍认知,其实忽略了AI模型成本结构的绝大部分组成。
2024年以来,头部AI厂商的盈利焦虑持续升温。即使是坐拥超1亿月活用户的ChatGPT,其母公司OpenAI至今仍未实现稳定盈利,单月仅推理算力支出就超过1亿美元。这种投入与营收的错配,根源就在于行业此前对大模型成本的估算存在严重偏差:大众所熟知的“终训成本”,只是整个模型生命周期中占比极小的一次性支出。
对于To B服务的大模型厂商而言,非训练成本的占比还要更高。为了满足企业客户的定制化需求、数据安全要求和服务可用性承诺,厂商需要额外投入大量资源做私有化部署、专属调优和7*24小时运维,这部分成本往往是通用大模型终训成本的3~5倍。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
14 小时前
近日,亚马逊云科技(AWS)正式为旗下全托管生成式AI平台Bedrock上线高级提示优化工具,业内分析师测算,企业在规模化部署生产级AI应用时使用该工具,最高可降低40%的推理成本,同时输出准确率提升15%以上,大幅降低了生成式AI落地的技术门槛与运营投入。

15 小时前
2026年5月,OpenAI正式推出ChatGPT个人理财专属功能,支持用户绑定个人银行及证券、支付账户,后台将自动聚合用户的投资组合表现、日常消费、订阅服务、待支付账单等多维度财务数据,为用户生成统一的可视化财务看板,这是大语言模型首次规模化落地C端个人理财垂直场景。

17 小时前
2026年5月15日,人工智能公司xAI正式推出Agentic命令行工具Grok Build早期测试版,该产品定位智能开发助手,可实现项目结构分析、代码编写、错误调试、开发任务自动化等功能,目前仅向SuperGrok Heavy订阅用户开放,用户可通过x.ai/cli申请体验,后续将根据用户反馈快速迭代优化。

17 小时前
2026年5月15日,微信官方发布《全球青少年AI+小程序洞察报告》,披露其运营四年的AI教育小程序平台核心数据:师生AI创作年均消耗词元突破500亿个,相当于375万次深度对话,已覆盖全球近8万名学生、1.7万名老师,累计生成28万余个小程序项目,标志生成式AI已深度融入青少年编程教育场景。

17 小时前
2026年5月15日,千问APP正式宣布与国家药监局信息中心达成深度战略合作,全面接入覆盖药品、化妆品、医疗器械三大类别的数百万份国家级权威数据,可通过权威数据源实时校核大幅降低健康咨询类回答的幻觉问题,将为平台数千万用户提供精准用药指导、成分检索等服务,标志着国产大模型垂直领域专业化、合规化建设取得关键进展。

17 小时前
2026年5月行业监测数据显示,埃隆·马斯克旗下由SpaceX与xAI合并而成的SpaceXAI正遭遇严重人才危机,2026年2月至今已有超50名顶尖研发人员离职,覆盖编程助手、世界模型、Grok语音交互、预训练等核心团队,近20名离职人员转投Meta、Thinking Machines Lab等竞品,引发行业对其技术迭代能力的广泛质疑。

17 小时前
2026年5月15日,人工智能企业OpenAI宣布将旗下代码生成模型Codex正式集成至iOS、Android双端ChatGPT移动应用,面向全球开发者提供移动端远程编码管理能力。目前Codex周活跃用户已突破400万,本次更新打破办公场景限制,支持多开发环境实时同步,开发者可利用碎片时间处理紧急代码需求。

17 小时前
2026年5月15日,百度正式宣布成立作为大模型战略最高决策与协调机构的百度模型委员会(BMC),该机构由深度参与文心大模型多代迭代的青年研究员组成,基础模型研发部、应用模型研发部将直接向其汇报,实现大模型从底层技术研发到上层产品落地的全链路统一管理,标志着百度大模型竞争正式进入体系化作战阶段。