马斯克官宣Grok 4.20下周登场 较4.1版实现重大改进
2月15日,xAI CEO埃隆·马斯克通过X平台对外官宣,旗下大模型Grok的最新版本4.20将于下周正式发布,相比去年11月推出的Grok 4.1版将实现重大改进。作为参考,Grok 4.1曾以1483分的Elo成绩登顶LMArena文本能力排行榜,其“即时响应”版本性能甚至超越多数竞品的“全推理”模式,还大幅降低了AI“幻觉”发生率,此次升级无疑将为白热化的大模型赛道再添变数。
作为马斯克布局AI领域的核心载体,xAI自成立起就对标OpenAI等行业巨头,Grok系列模型更是被寄予“打造最具竞争力通用大模型”的厚望。去年11月发布的Grok 4.1,曾凭借突破性的性能表现让行业眼前一亮:在LMArena这个业内权威的文本能力排行榜上,它以1483分的成绩高居榜首,领先第二名足足31分,拉开了显著的技术差距。
更值得关注的是Grok 4.1的“即时响应”模式——这是xAI针对大模型推理效率与性能平衡的一次创新尝试。通常情况下,大模型的“即时响应”为了追求速度,会压缩推理步骤,难免牺牲准确性,但Grok 4.1的即时版本不仅保持了超快响应速度,性能甚至超过了其他主流模型开启“全推理”模式的表现,同时还将令人头疼的AI“幻觉”发生率大幅降低。这一成果让它在实时对话、快速信息处理等C端和轻量化B端场景中,具备了不可替代的优势。
此次马斯克直接用“重大改进”来定义Grok 4.20,虽未透露具体的升级方向,但结合Grok 4.1的技术路径,业内普遍猜测新版本可能在三个方向有所突破:一是进一步优化即时推理架构,在保持速度的同时提升复杂逻辑推理、数学运算等任务的处理能力;二是持续压低“幻觉”率,强化事实准确性与知识可靠性,满足专业领域的严谨需求;三是可能拓展多模态能力,比如加入图像生成、视频理解等功能,补齐当前纯文本模型的应用短板。
AI行业分析师张鸣在接受采访时表示:“Grok系列的快速迭代速度超出了很多人的预期,尤其是在推理效率优化上的成果,恰好切中了当前大模型落地的核心痛点——企业和用户既需要高性能,又需要低成本、低延迟的服务。Grok 4.20如果能延续这一优势,很可能会吸引更多开发者和用户转向xAI生态,对OpenAI GPT-4o、谷歌Gemini 2等头部模型形成直接挑战。”
从当前大模型竞争格局来看,各大玩家都在性能、速度、成本、可靠性等维度角力,Grok 4.1已经证明了xAI的技术硬实力,而即将到来的4.20版本,无疑将成为检验其研发爆发力的又一次关键节点。对于普通用户而言,Grok的升级意味着能接触到更高效、精准的AI助手;对于整个行业来说,这种技术突破会倒逼其他厂商加速研发,推动大模型技术向更实用、更普惠的方向发展。
距离Grok 4.20的发布只剩一周时间,xAI将拿出怎样的“重大改进”,能否在LMArena排行榜上再次刷新纪录,甚至在更多场景中展现优势,都将成为AI圈接下来最受关注的焦点。随着大模型赛道的竞争日益激烈,每一次重要升级都是一次行业的风向标,Grok 4.20的登场,或许会为2026年的AI市场带来第一波重磅冲击。

4 小时前
当地时间2026年3月30日,有“HBM之父”之称的韩国科学技术院电气与电子工程学院教授金正浩公开对外表态,当前以英伟达GPU为核心的AI芯片体系即将发生根本性变革,未来高带宽内存(HBM)、高带宽闪存(HBF)将成为计算核心,GPU与CPU将退居配角,这一预判也引发全球半导体行业对存算一体架构落地节奏的广泛讨论。

4 小时前
2026年4月,中国信通院基于新发布的《云端OpenClaw基线能力要求》开展首批安全评估,腾讯公司公关总监张军披露,旗下龙虾特攻队系列的WorkBuddy、QClaw、轻量云OpenClaw、云桌面云手机Claw、ClawPro共5款产品全部通过评估,覆盖功能可信、收费可控等五大核心安全维度,为国内AI龙虾类产品落地树立了安全合规标杆。

4 小时前
2026年4月1日消息,高德正式全量开源全球首个基于统一架构的具身操作基座模型ABot-M0。该模型可作为“通用大脑”适配多种形态的具身机器人,在Libero、Libero-Plus等多个权威基准测试中达到SOTA表现,其中在Libero-Plus基准上任务成功率达80.5%,较此前业界标杆方案Pi0提升近30%。

4 小时前
国内大模型厂商智谱日前发布2025年全年业绩公告,全年营收达7.24亿元,同比增长131.9%,经调整净亏损31.82亿元,同比扩大29.1%。其最新推出的GLM-5发布24小时内即获字节、阿里、腾讯等头部大厂接入,国内前10大互联网公司已有9家深度集成GLM系列模型,旗下GLM Coding Plan付费开发者规模突破24.2万。

4 小时前
2026年4月,AI智能体与自动化框架OpenClaw正式发布v2026.3.31版本,俗称“龙虾”框架的该平台首次原生捆绑腾讯QQ机器人作为内置渠道插件。本次更新免去了开发者此前依赖第三方桥接工具的接入流程,实现QQ生态全覆盖,支持多账号配置、安全凭证管理等功能,大幅降低AI智能体接入社交场景的开发门槛。

5 小时前
2026年4月,华为面向内测用户推送HarmonyOS 6负一屏应用「智慧助手·今天」15.0.22.210测试版本,首次接入Claw智能体能力,新增AI任务提醒、晨间简报、AI搜索、通勤动态提醒等多项功能,覆盖日程管理、信息查询、场景化服务等多个日常场景,为鸿蒙生态的端侧AI交互落地新增核心入口。

5 小时前
美国科技巨头Meta近日公布新一代超算级AI数据中心Hyperion的配套能源方案,将新建10座天然气发电厂为其专属供能,整体发电容量达1.2GW,足以覆盖美国南达科他州全州的民生与工业用电需求,该方案也引发行业对AI算力能耗与清洁能源转型路径的广泛讨论。

11 小时前
2026年4月,AI创企Anthropic旗下闭源编程工具Claude Code意外泄露引发行业震荡,项目负责人鲍里斯·切尔尼公开承认团队手动操作部署流程失误导致事故,第三方基于泄露代码推出的平替版本上线后短时间内便斩获GitHub 10万星,Anthropic随后紧急启动下架封杀措施,此次事件也引发行业对闭源AI项目安全管控的广泛讨论。