登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

DeepSeek V4正式发布 多项测试领先头部主流大模型

深度求索(DeepSeek)近日正式推出新一代大语言模型DeepSeek V4,该模型在数学推理、代码生成、长文本处理等多个核心基准测试中,成绩超过OpenAI的ChatGPT、谷歌的Gemini以及Anthropic的Claude三款头部主流大模型。业内认为这款大模型刷新了当前开源大模型的性能上限,也给全球通用大模型赛道注入了新的竞争活力。

此次DeepSeek V4对外公布的测试结果覆盖了当前大模型能力评估的核心维度,其中在数学推理基准MATH、代码能力基准HumanEval两项测试中,DeepSeek V4的得分分别达到76.2分和89.1分,不仅超过同定位的ChatGPT 3.5和Gemini 1.5 Flash,也比DeepSeek上一代版本提升了近8个百分点。在128k长度的长文本理解测试中,DeepSeek V4的准确率也比Claude 3 Sonnet高出4个百分点,综合表现已经跻身全球大模型第一梯队行列。

不同于不少大模型研发团队靠堆叠参数提升性能的思路,DeepSeek V4选择了效率优先的技术路线。该模型采用了新一代稀疏注意力机制,在仅120亿激活参数的规模下,实现了接近3000亿参数量闭源模型的通用能力,同时单轮推理成本比同性能级别的头部模型降低了30%以上。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创