DeepSeek获数亿美元B轮融资发布推理提速300%的轻量大模型

AI创作导航 2 个月前

风向

AI初创企业DeepSeek（深度求索）近日宣布完成数亿美元B轮融资，由红杉中国、高瓴创投联合领投，资金将用于通用大模型技术迭代与垂直场景落地。同时，公司发布新一代轻量通用大模型DeepSeek-Lite全系列，参数覆盖7B至70B，推理速度较上一代提升300%，在中文理解与代码生成基准测试中跻身全球Top3阵营。

2024年以来，国内通用大模型赛道的融资热度持续攀升，据不完全统计，上半年公开披露的融资事件已超22起，单笔融资额多在亿元级别，资本的目光正从“技术炫技”转向“落地可行性”。DeepSeek此次能吸引两家顶级机构联合领投，核心在于其在超长上下文处理、代码生成两大领域的硬实力——此前推出的DeepSeek-Code-V2曾在HumanEval代码基准测试中拿下92.3%的Pass@1准确率，反超GPT-4o的91.2%。

不同于早期大模型公司融资时多强调参数规模，DeepSeek在本次融资沟通中重点展示了落地数据：目前其代码大模型已接入国内120+头部互联网企业的开发平台，帮助开发人员平均提升编码效率45%；通用大模型则与6家全国性银行合作，将智能客服的问题解决率从63%拉升至91%。红杉中国合伙人表示，“我们看好DeepSeek在轻量化模型领域的技术突破，这是解决大模型落地成本过高的核心路径之一”。

此次发布的DeepSeek-Lite系列，核心是采用了自研的结构化稀疏技术与轻量化指令微调方案。在性能层面，70B参数版本在CMMLU中文基准测试中得分达78.6%，仅比GPT-4的80.1%低1.5个百分点；而在部署成本上，7B参数版本可在单张RTX 4090消费级GPU上实现实时推理，延迟低至80ms，部署成本仅为同性能大模型的1/6。

DeepSeek 大语言模型人工智能 AI融资轻量大模型

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

PitchPal

AI生成创业融资申请文书

提示工程指南

提示工程领域专业学习平台

Claude

Claude 是由 Anthropic 研发的 AI 助手与大语言模型

OpenAI

OpenAI 是全球领先的人工智能研究机构与模型提供商

DeepSeek

深度求索旗下开源大模型与AI服务平台

Animate Anything AI

AI在线图片转视频工具

AI Music Gen

免费AI文生带人声音乐工具

C Dance AI

多模态AI动作视频生成工具