国内AI公司深度求索(DeepSeek)正式发布新一代通用大语言模型DeepSeek-V2,该模型支持128K超长上下文窗口,在MMLU、GSM8K等权威基准测试中得分逼近OpenAI GPT-4o,同步推出的多模态版本可处理文本、图像、音频输入,为金融、制造等企业级场景提供高效AI解决方案,标志着国内大模型在通用性能上进一步缩小与国际顶尖水平的差距。
想象一下,无需将百万字的项目合同拆分成数十段,AI模型就能一次性通读并精准提炼所有风险条款——这正是DeepSeek-V2大模型带来的新可能。该模型采用自研的MoE(混合专家模型)架构,搭配动态路由算法,在保持推理效率的前提下,将上下文窗口扩展至128K,相当于可容纳约10万字的文本内容。
在核心性能测试中,DeepSeek-V2表现亮眼:MMLU(多任务语言理解)测试得分为86.7%,仅比GPT-4o低0.3个百分点;GSM8K数学推理数据集上得分达92.6%,与GPT-4o的93%基本持平。这意味着其在复杂知识理解、逻辑推理等通用能力上,已追平国际顶尖模型的水平。
除了纯文本版本,DeepSeek同步推出DeepSeek-V2多模态模型,实现文本、图像、音频三大模态的无缝融合。例如,企业用户上传一张机械装配图纸,模型可快速识别零件参数、装配逻辑,生成标准化的操作手册;上传一段1小时的商务会议录音,能实时转写并提炼核心议题、行动项及时间节点。
在MMBench多模态基准测试中,该模型整体得分超过80%,尤其在视觉推理任务上表现突出——对包含复杂图表的技术文档,理解准确率较上一代提升了15个百分点。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
11 小时前
创新工场董事长李开复近日在专访中阐释“AI主权”概念,其涵盖技术控制权、数据安全、本土文化法律适配三大核心维度。他明确指出各国无需盲目复刻闭源巨头OpenAI的发展路径,资源有限的市场主体可依托开源模型走本地化建设的“第三条路”,中国企业DeepSeek已验证该模式可实现不到美国同行十分之一的投入达标同等性能。

11 小时前
2026年5月13日,腾讯云正式发布DeepSeek模型升级及切换公告,宣布将于5月22日10时起停止支持DeepSeek-V3-0324、DeepSeek-V3.1-Terminus、DeepSeek-R1-0528三款旧版模型调用,配套推出的升级版本在推理效果、时延等指标上均优于旧版,平台提示现有用户尽快完成迁移以保障服务稳定运行。

11 小时前
2026年5月,全球AI技术测评团队完成了面向软件开发场景的AI Agent专项基准测试,本次测试覆盖市面上17款主流商用、开源AI Agent产品,覆盖代码生成、漏洞修复、架构设计三大核心开发场景,DeepSeek Dev Agent、OpenAI GPT-4o Coding Agent、Code...

11 小时前
2026年5月新一轮AI大模型迭代周期落地,OpenAI推出的GPT-5.5、DeepSeek发布的V4版本、Anthropic更新的Claude Opus 4.7三款产品,从推理成本、响应速度、多模态处理能力多维度升级,可帮助To B类AI服务商通过智能任务路由优化技术栈,最高实现利润率翻倍,直接重构行业成本收益规则。

12 小时前
消费电子巨头三星已启动旗下首款AI智能眼镜的量产筹备工作,该产品正式命名为Galaxy Glasses,预计2025年7月面向全球市场发售。作为三星布局空间计算与生成式AI交互场景的核心硬件,Galaxy Glasses将搭载多模态AI交互系统,可实现独立语音交互、实时翻译、AR内容显示等功能,有望重构消费级可穿戴设备的使用场景。

13 小时前
近日谷歌被曝拟将新注册免费账号的默认云存储额度下调至5GB,该调整将直接关联Gemini生成式AI服务的免费使用权限。同期OpenAI GPT-5研发进入收尾阶段、DeepSeek上线新代码模型、苹果Apple Intelligence逐步落地全球市场,2025年消费级AI服务的竞争已进入资源绑定的新阶段。

11 天前
美国AI安全与研发公司Anthropic近日宣布,联合全球另类资产管理巨头黑石、头部私募机构Hellman & Friedman、国际投行高盛共同成立全新企业级AI服务公司。新公司将聚焦各行业中型企业需求,将Anthropic旗下大语言模型Claude落地到企业核心业务场景,首批Anthropic应用AI工程师已确认入驻新公司核心团队。

11 天前
近期全球AI赛道动作密集,OpenAI推进GPT-5研发、微软Copilot商业化覆盖超1亿用户、谷歌Gemini多模态能力迭代、苹果Apple Intelligence完成端侧部署适配,国产厂商DeepSeek、Perplexity等也在垂直场景跑出差异化优势,端侧大模型渗透率预计2025年将突破40%,行业已进入技术落地与场景渗透的关键期。