2026年3月13日,Meta宣布旗下新一代开源大语言模型Llama4发布时间从原定计划推迟至2026年5月。Meta创始人扎克伯格此前曾多次公开表示对Llama4寄予厚望,此次推迟源于研发团队在性能微调、逻辑推理优化环节遭遇技术挑战。作为Meta核心AI战略的基石,Llama4的进度直接关系到其与OpenAI、谷歌等巨头的大模型市场竞争排位。
据Meta内部知情人士透露,此次Llama4的发布延期并非临时调整——原本研发团队计划在2026年3月底对外推出预览版本,供开源社区首批开发者测试,但在近两周的内部压测中,团队发现模型在复杂多轮推理场景下的一致性表现未达预期,才最终敲定了延期两个月的方案。
在当前的大模型市场,闭源阵营与开源阵营的竞争早已进入胶着状态。OpenAI的GPT系列、谷歌的Gemini系列持续迭代功能,不断挤压开源模型的应用空间;而开源阵营中,Llama系列始终是最具号召力的产品,目前Llama系列模型在全球开源大模型部署占比已经超过62%,是Meta抢夺AI市场话语权的核心抓手。扎克伯格在此前的2026年Q1财报电话会上曾明确表示,Llama4是Meta年内最重要的产品,承担着撬动企业级AI服务市场的重任。
此次Llama4延期的核心原因,正是顶级大模型研发普遍面临的共性难题:如何在提升性能的同时兼顾算力效率。据内部消息,Meta研发团队此前给Llama4设定了两个核心目标:一是通用推理能力追平GPT-4o,二是同参数下推理算力成本较Llama3降低40%。但在近期的测试中,团队发现如果要达到预期的推理能力,模型的算力消耗会超出预设阈值近30%,同时复杂指令遵循的一致性还存在15%左右的波动。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
4 小时前
Rainmaker Securities总裁Glen Anderson最新披露,当前全球私人股权二级市场活跃度创下历史峰值,AI创企Anthropic成为最受追捧的交易标的,同赛道头部企业OpenAI交易热度出现明显下滑,而SpaceX临近的IPO计划,或将对整个一级科技创投市场的资金流向产生颠覆性影响。

9 小时前
近期Meta、微软、谷歌等海外头部科技企业相继公布天然气电厂建设计划,为旗下高速扩张的AI数据中心提供稳定电力支撑。随着生成式AI普及,单座AI算力中心能耗是传统数据中心的3-5倍,现有公共电网已难以满足企业爆发式算力供电需求,化石能源供电方案也引发了业内对碳目标达成、长期运营风险的广泛讨论。

9 小时前
谷歌近日面向企业级客户发布全新AI推理管控套件,针对当前企业部署大模型时平均推理成本占AI总支出60%以上、峰值时段服务可用性不足92%的行业痛点,提供动态算力调度、故障自动切换等功能,可帮助企业将推理环节综合成本降低30%左右,同时大幅提升生成式AI服务的运行稳定性。

9 小时前
2026年美国中期选举进入倒计时阶段,头部大模型企业Anthropic近日宣布成立全新政治行动委员会(PAC),计划定向支持认同其分级AI监管、算力资源倾斜、AIGC版权保护等政策议程的议员候选人。此次动作是头部AI企业从技术研发向政策上游延伸的标志性事件,也意味着全球AI行业的政策博弈进入白热化阶段。

9 小时前
据科技媒体The Information及行业分析师Eric Newcomer披露,AI大模型厂商Anthropic已于近期完成对秘密运营的生物科技AI初创公司Coefficient Bio的收购,本次交易为全股票形式,总对价达4亿美元。这是Anthropic首次落地生命科学垂直领域布局,也标志着大模型厂商商业化正加速向生物医药赛道渗透。

9 小时前
2026年以来,微软、Meta、Google等全球科技巨头先后启动配套天然气发电厂建设项目,以满足AI大模型训练、推理所需的超算数据中心爆发式增长的能耗需求。行业测算显示,头部AI算力集群的单位能耗是传统数据中心的5-10倍,这一能源布局已引发行业关于碳排放、长期能源结构合理性的广泛讨论。

9 小时前
近日,AI大模型企业Anthropic宣布为旗下对话式AI产品Claude推出Windows平台本地交互能力,新版本可直接跨应用调取用户邮件、本地存储的各类文档,还能自主执行系统级任务操作。据官方披露,该功能可将文档整理、日程响应类办公流程的处理效率提升45%,无需用户手动上传文件即可完成复杂指令。

9 小时前
谷歌近期推出定价仅3美元的AI算力棒Magic Stick,主打为服役超过5年的老旧Windows、Mac PC提供轻量化AI算力支撑,用户无需更换硬件即可流畅运行Gemini全系AI服务,解决旧设备本地算力不足无法加载大语言模型的痛点。该产品瞄准全球超12亿台服役超期的存量PC市场,最快2024年第四季度正式开售。