登录体验完整功能(收藏、点赞、评论等) — 立即登录

少找工具,多做创作

DeepSeek代码大模型霸榜国际基准 性能反超GPT-4o

国内AI企业DeepSeek发布的代码大模型DeepSeek-Coder-V2近日在国际权威代码评测基准上登顶,在HumanEval数据集上准确率达93.2%,超越OpenAI旗舰模型GPT-4o的92.0%;在MBPP数据集上准确率为92.5%,同样领先竞品。这一突破标志着国产代码大模型已跻身全球第一梯队,引发行业对其技术路线的广泛关注。

当地时间6月12日,国际代码模型评测平台EvalAI的最新榜单更新,一条数据引发AI行业震动——DeepSeek-Coder-V2以93.2%的准确率拿下HumanEval数据集的榜首,这一成绩比OpenAI刚刚发布的GPT-4o高出1.2个百分点,也是国产代码大模型首次在核心评测基准上超越OpenAI的旗舰模型。

随着企业数字化转型的深入,代码生成工具已成为提升研发效率的核心刚需。IDC数据显示,2024年全球AI代码生成市场规模将同比增长47%,达到18.7亿美元;国内市场增速更快,预计同比增长62%至5.2亿元。此前,OpenAI的GPT-4、谷歌的Gemini Code等国际模型长期垄断代码评测榜单,国产模型虽有布局但始终未进入第一梯队。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创