AI初创公司深度求索(DeepSeek)近日推出多模态大模型DeepSeek-V2,在MMLU、GSM8K等12项全球权威基准测试中,通用推理、代码生成等多任务性能追平OpenAI GPT-4o,其中数学推理细分得分超出GPT-4o 3.2个百分点。该模型支持文本、图像、音频全模态输入输出,目前已率先向企业客户开放定向测试申请通道。
7月18日的DeepSeek技术发布会现场,当团队负责人展示DeepSeek-V2在GSM8K数学推理测试中95.2%的得分时,台下的企业客户代表发出了小声的惊叹——这个成绩比OpenAI GPT-4o的92%高出3.2个百分点,是国内首个在核心基准上反超GPT-4o的多模态大模型。
在GPT-4o将多模态能力推到大众视野后,国内AI厂商的迭代节奏明显加快。过去半年里,百度文心一言4.0、字节豆包4.0、智谱GLM-4等多模态模型密集发布,但大多在通用性能上对标GPT-4,而非最新的GPT-4o。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录