登录体验完整功能(收藏、点赞、评论等) — 已累计有 9199 人加入

让AI触手可及,让应用激发潜能

DeepSeek代码大模型霸榜国际基准 性能反超GPT-4o

国内AI企业DeepSeek发布的代码大模型DeepSeek-Coder-V2近日在国际权威代码评测基准上登顶,在HumanEval数据集上准确率达93.2%,超越OpenAI旗舰模型GPT-4o的92.0%;在MBPP数据集上准确率为92.5%,同样领先竞品。这一突破标志着国产代码大模型已跻身全球第一梯队,引发行业对其技术路线的广泛关注。

当地时间6月12日,国际代码模型评测平台EvalAI的最新榜单更新,一条数据引发AI行业震动——DeepSeek-Coder-V2以93.2%的准确率拿下HumanEval数据集的榜首,这一成绩比OpenAI刚刚发布的GPT-4o高出1.2个百分点,也是国产代码大模型首次在核心评测基准上超越OpenAI的旗舰模型。

随着企业数字化转型的深入,代码生成工具已成为提升研发效率的核心刚需。IDC数据显示,2024年全球AI代码生成市场规模将同比增长47%,达到18.7亿美元;国内市场增速更快,预计同比增长62%至5.2亿元。此前,OpenAI的GPT-4、谷歌的Gemini Code等国际模型长期垄断代码评测榜单,国产模型虽有布局但始终未进入第一梯队。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯