登录体验完整功能(收藏、点赞、评论等) — 已累计有 12606 人加入

DeepSeek V4正式发布 多项测试领先头部主流大模型

详情页推荐

深度求索(DeepSeek)近日正式推出新一代大语言模型DeepSeek V4,该模型在数学推理、代码生成、长文本处理等多个核心基准测试中,成绩超过OpenAI的ChatGPT、谷歌的Gemini以及Anthropic的Claude三款头部主流大模型。业内认为这款大模型刷新了当前开源大模型的性能上限,也给全球通用大模型赛道注入了新的竞争活力。

此次DeepSeek V4对外公布的测试结果覆盖了当前大模型能力评估的核心维度,其中在数学推理基准MATH、代码能力基准HumanEval两项测试中,DeepSeek V4的得分分别达到76.2分和89.1分,不仅超过同定位的ChatGPT 3.5和Gemini 1.5 Flash,也比DeepSeek上一代版本提升了近8个百分点。在128k长度的长文本理解测试中,DeepSeek V4的准确率也比Claude 3 Sonnet高出4个百分点,综合表现已经跻身全球大模型第一梯队行列。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。