深度求索(DeepSeek)近日正式推出新一代大语言模型DeepSeek V4,该模型在数学推理、代码生成、长文本处理等多个核心基准测试中,成绩超过OpenAI的ChatGPT、谷歌的Gemini以及Anthropic的Claude三款头部主流大模型。业内认为这款大模型刷新了当前开源大模型的性能上限,也给全球通用大模型赛道注入了新的竞争活力。
此次DeepSeek V4对外公布的测试结果覆盖了当前大模型能力评估的核心维度,其中在数学推理基准MATH、代码能力基准HumanEval两项测试中,DeepSeek V4的得分分别达到76.2分和89.1分,不仅超过同定位的ChatGPT 3.5和Gemini 1.5 Flash,也比DeepSeek上一代版本提升了近8个百分点。在128k长度的长文本理解测试中,DeepSeek V4的准确率也比Claude 3 Sonnet高出4个百分点,综合表现已经跻身全球大模型第一梯队行列。
不同于不少大模型研发团队靠堆叠参数提升性能的思路,DeepSeek V4选择了效率优先的技术路线。该模型采用了新一代稀疏注意力机制,在仅120亿激活参数的规模下,实现了接近3000亿参数量闭源模型的通用能力,同时单轮推理成本比同性能级别的头部模型降低了30%以上。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
40 秒前
科技巨头Meta近日与亚马逊云科技AWS达成全新合作,将在AWS部署数千万颗Graviton Arm架构处理器核心,用于搭建支撑下一代AI研发的多架构计算堆栈。目前Meta已整合英伟达、AMD、Arm以及自研芯片的多元算力资源,该布局是Meta为AI智能体时代提前储备算力,押注无单一芯片能满足下一代AI需求的判断。

1 小时前
2026年4月24日,中国AI创业公司DeepSeek正式推出全新迭代的V4大语言模型,长期关注全球AI产业的撰稿人Caiwei Chen指出,这款千呼万唤的新一代大模型,在推理效率上实现显著提升,并且深度适配国产AI芯片架构,被业内认为是既能够降低AI落地的算力成本,也为国产芯片厂商商业化打开新增长空间的标志性产品。

2 小时前
2026年4月,AI领域最新人才流动动态显示,此前Meta曾从独立AI研发机构Thinking Machines Lab挖走多名核心大模型研发人才,近期这一流动出现双向反转,已有至少7名原任职于Meta GenAI部门的资深研究员加入Thinking Machines Lab。业内认为,这反映出头部大厂与独立AI实验室的人才博弈出现新变化,核心人才争夺进入更复杂的新阶段。

3 小时前
2026年4月,主打可控AI生成服务的创业项目ComfyUI宣布完成3000万美元新融资,本轮融资完成后项目整体估值达到5亿美元。ComfyUI为创作者提供图像、视频、音频AI生成的高灵活度编辑能力,满足专业创作者对AI生成内容的精细化调整需求,此次融资也印证了一级市场对可控AI创作工具赛道的投资信心。

4 小时前
近日欧洲AI领域曝出重磅交易消息,德国本土主权AI领军企业Aleph Alpha正推进与全球知名生成式AI厂商Cohere的合并计划,该交易目前已获得双方管理层同意,尚待Aleph Alpha全体股东投票批准。本次合并若落地,将诞生欧洲规模领先的独立生成式AI厂商,冲击当前美国科技巨头主导全球To B AI市场的格局,引发欧洲科技圈对主权AI发展路径的热议。

4 小时前
2026年4月,全球科技巨头谷歌已敲定对AI初创公司Anthropic的最新投资计划,总规模最高可达400亿美元,涵盖现金与算力资源支持。Anthropic刚有限发布面向网络安全领域的大模型Mythos,全球头部AI玩家正加速囤积算力、争抢头部创业项目,以在通用与垂直AI赛道竞争中占据优势,行业洗牌速度进一步加快。

5 小时前
据科技圈最新一级市场交易消息,埃隆·马斯克旗下太空探索技术公司SpaceX已提出价值600亿美元的收购要约,计划收购热门AI原生代码编辑器Cursor。本次交易若达成,将成为AI开发工具领域近年规模最大的并购案,也将进一步扩充马斯克的全球AI产业布局,引发业内对AI赛道估值与行业格局变动的广泛讨论。

5 小时前
近日,前OpenAI研究科学家主导研发的全新生成式AI大模型正式推出,该项目由腾讯支持落地。与此同时,国内大模型创业公司DeepSeek也发布了迭代升级的全新旗舰大模型。近期国内生成式AI赛道动作频频,头部科技企业与前沿创业机构同步推进技术更新,行业产品迭代速率明显加快,竞争格局正迎来新的变化。