AI初创企业DeepSeek(深度求索)近日宣布完成数亿美元B轮融资,由红杉中国、高瓴创投联合领投,资金将用于通用大模型技术迭代与垂直场景落地。同时,公司发布新一代轻量通用大模型DeepSeek-Lite全系列,参数覆盖7B至70B,推理速度较上一代提升300%,在中文理解与代码生成基准测试中跻身全球Top3阵营。
2024年以来,国内通用大模型赛道的融资热度持续攀升,据不完全统计,上半年公开披露的融资事件已超22起,单笔融资额多在亿元级别,资本的目光正从“技术炫技”转向“落地可行性”。DeepSeek此次能吸引两家顶级机构联合领投,核心在于其在超长上下文处理、代码生成两大领域的硬实力——此前推出的DeepSeek-Code-V2曾在HumanEval代码基准测试中拿下92.3%的Pass@1准确率,反超GPT-4o的91.2%。
不同于早期大模型公司融资时多强调参数规模,DeepSeek在本次融资沟通中重点展示了落地数据:目前其代码大模型已接入国内120+头部互联网企业的开发平台,帮助开发人员平均提升编码效率45%;通用大模型则与6家全国性银行合作,将智能客服的问题解决率从63%拉升至91%。红杉中国合伙人表示,“我们看好DeepSeek在轻量化模型领域的技术突破,这是解决大模型落地成本过高的核心路径之一”。
此次发布的DeepSeek-Lite系列,核心是采用了自研的结构化稀疏技术与轻量化指令微调方案。在性能层面,70B参数版本在CMMLU中文基准测试中得分达78.6%,仅比GPT-4的80.1%低1.5个百分点;而在部署成本上,7B参数版本可在单张RTX 4090消费级GPU上实现实时推理,延迟低至80ms,部署成本仅为同性能大模型的1/6。
更值得关注的是,DeepSeek-Lite首次实现了“全场景自适应推理”:当处理短文本问答时,模型会自动切换到快速推理模式,速度提升5倍;当处理超长文档总结(最高支持64万token上下文)时,仍能保持90%以上的内容还原度。
DeepSeek创始人兼CEO周明透露,本轮融资的40%将用于垂直场景的模型定制与落地,重点布局工业制造、金融科技与职业教育三大领域。其中,针对工业制造的专属模型预计将于2024年底推出,可支持CAD图纸自动生成、工艺参数优化等功能,有望帮助制造企业缩短研发周期30%以上。
同时,公司计划在未来6个月内开放DeepSeek-Lite的API免费试用权限,面向中小开发者与创业团队降低准入门槛,进一步推动大模型技术的普惠化应用。

8 分钟前
2026年3月,科技媒体TechCrunch披露AI创投领域新现象:部分初创公司通过新型估值机制,对同一类股权采用双轨定价策略,刻意营造独角兽估值假象。该模式通过拆分股权附属权益实现价格差异,依托最新一轮融资的高价抬升公司整体估值,目前已引发创投圈关于信息披露与行业诚信的广泛讨论。

9 分钟前
2026年3月4日,OpenAI在谷歌DeepMind发布Gemini 3.1 Flash-Lite不到两小时后,紧急推出GPT-5.3 Instant。这款产品放弃跑分竞赛,直击用户日常对话痛点,拒绝回答与说教式免责声明大幅减少,幻觉率最高降低27%,写作更具人情味,试图以真实体验升级抢占AI聊天市场主动权。

10 分钟前
Anthropic于3月3日正式宣布为旗下AI编程工具Claude Code启动语音模式灰度推送,将此前广受开发者青睐的直觉编程推向更高效的语音编程新阶段。该功能内置在工具底层架构中,内测用户可通过长按空格键录入语音开发需求,无需额外外设,有望大幅缩短开发者的思路中断时间,目前正按计划逐步扩大测试范围。

11 分钟前
2026年3月4日,知名AI领域学者吴恩达针对当前全球AI赛道的过度炒作现象发声,指出通用人工智能(AGI)距离真正实现仍有数十年之遥,企业与人才不应将其作为当下发展的核心目标。他同时提到,AGI的定义正被营销辞令滥用降级,当前主流AI模型仍极度依赖训练数据,呼吁行业回归务实的技术落地路径。

13 分钟前
2026年3月4日,谷歌悄然推出全新AI大模型Gemini 3.1 Flash-Lite,这款被业内称为“穷人版旗舰”的产品,输出速度达363token/秒,单价仅0.25美元每百万Token,跑分碾压GPT-5 mini与Gemini 2.5 Flash,更以仅为竞品1/4的价格对标高阶模型Claude,是继Gemini 3.1 Pro屠榜之后,谷歌又一款重磅AI产品。

13 分钟前
2026年3月4日,AI大模型赛道爆发快速攻防战:谷歌DeepMind刚发布Gemini 3.1 Flash-Lite不到2小时,OpenAI紧急推出GPT-5.3 Instant。该模型针对性优化对话交互,减少生硬拒绝与说教式回答,幻觉率较前版下降27%,写作能力实现显著提升,打响了本周AI赛道的首场竞速。

15 分钟前
2026年3月初,美国顶级产品播客Lenny’s Podcast邀请Claude设计负责人开展主题访谈,探讨AI与审美设计的融合议题,节目上线仅一周播放量已接近8万次,评论区众多设计师留言称“说中了当下处境”,嘉宾提出的“设计流程已死,但设计师价值从未如此之高”引发行业对AI时代设计师角色的深度讨论。

15 分钟前
摘要:2026年开春,AI大模型行业迎来周期性降温,资本耐心持续消退,投资人不再追捧概念式融资,转而聚焦技术不可替代性与盈利模式落地。作为2021年成立于上海的AI技术研发商MiniMax,此前曾被市场给予2500亿市值的估值,如今正进入行业周期下的“成色验证期”,其技术实力与商业化路径成为市场关注的核心焦点。