DeepSeek V4正式发布多项测试领先头部主流大模型

AI创作导航管理员 LV4 资深连续登录7天萌新

2 个月前

风向

169

深度求索（DeepSeek）近日正式推出新一代大语言模型DeepSeek V4，该模型在数学推理、代码生成、长文本处理等多个核心基准测试中，成绩超过OpenAI的ChatGPT、谷歌的Gemini以及Anthropic的Claude三款头部主流大模型。业内认为这款大模型刷新了当前开源大模型的性能上限，也给全球通用大模型赛道注入了新的竞争活力。

此次DeepSeek V4对外公布的测试结果覆盖了当前大模型能力评估的核心维度，其中在数学推理基准MATH、代码能力基准HumanEval两项测试中，DeepSeek V4的得分分别达到76.2分和89.1分，不仅超过同定位的ChatGPT 3.5和Gemini 1.5 Flash，也比DeepSeek上一代版本提升了近8个百分点。在128k长度的长文本理解测试中，DeepSeek V4的准确率也比Claude 3 Sonnet高出4个百分点，综合表现已经跻身全球大模型第一梯队行列。

据了解 DeepSeek团队计划在本月内正式开放DeepSeek V4的API调用服务同时面向开发者开放可本地部署的微调版本进一步降低高性能大模型的使用门槛

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

DeepSeek V4正式发布多项测试领先头部主流大模型

最新文章

X社区 · 无限公约

二狗PPT

美团调整大模型生态：限用豆包，全面推进自研LongCat体系

印度科技大亨自投3000万美元打造AI办公套件对标微软Office

Cloudflare推出精细化AI流量管理工具破解站长爬虫管控两难

xAI发布Voice Agent Builder测试版两分钟搭建生产级语音智能体

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

让AI触手可及，让应用激发潜能

DeepSeek V4正式发布 多项测试领先头部主流大模型

最新文章

X社区 · 无限公约

二狗PPT

美团调整大模型生态：限用豆包，全面推进自研LongCat体系

印度科技大亨自投3000万美元 打造AI办公套件对标微软Office

Cloudflare推出精细化AI流量管理工具 破解站长爬虫管控两难

xAI发布Voice Agent Builder测试版 两分钟搭建生产级语音智能体

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

安装网站应用

DeepSeek V4正式发布多项测试领先头部主流大模型

印度科技大亨自投3000万美元打造AI办公套件对标微软Office

Cloudflare推出精细化AI流量管理工具破解站长爬虫管控两难

xAI发布Voice Agent Builder测试版两分钟搭建生产级语音智能体