2026年4月24日,中国大模型开发商深度求索(DeepSeek)正式发布全新DeepSeek-V4系列大语言模型预览版,并同步开放源码。该系列实现了1M(百万字)超长上下文能力的标准化,分为Pro、Flash双版本覆盖不同需求,其中1.6T总参数的Pro版性能对标顶级闭源模型,整体推理、Agent协作能力处于国内及开源领域领先位置。
DeepSeek-V4系列并没有采用单一规格的产品策略,而是针对不同开发需求推出两个定位清晰的版本,兼顾极致性能与落地成本。
DeepSeek-V4-Pro定位高端性能场景,总参数达到1.6T,推理阶段激活参数为49B,目前性能已经对标全球顶级闭源模型。根据公开测试数据,该模型在Agentic Coding编程代理评测中取得开源模型第一的成绩,交付质量接近Claude Opus 4.6水平;在数学、STEM、竞赛代码等高推理难度测评中,性能超越所有公开参评的开源模型,达到世界一流推理水平。
DeepSeek-V4-Flash则主打轻量化场景的极致性价比,总参数284B,激活参数仅13B。虽然该版本通用世界知识储备略低于Pro版,但在处理日常对话、简单代码生成、短文档分析等轻量任务时,推理速度更快,推理成本仅为Pro版的几分之一,能够满足中小开发者与初创企业的低成本落地需求。
在此次更新中,最具行业价值的突破是实现了1M(即百万字)超长上下文能力的标准化。此前不少大模型都推出过超长上下文版本,但大多是针对特定场景的定制优化,难以作为通用能力稳定输出。DeepSeek通过模型结构创新,将百万字上下文处理能力打造为模型的基础通用能力,可稳定支持整本书籍分析、完整代码库理解、数十小时长对话整理等复杂需求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
15 分钟前
2026年4月,苹果旗下紧凑型台式电脑Mac mini因成为个人用户运行本地AI大模型的热门选择,市场需求暴增后出现全渠道缺货情况。第三方交易平台eBay现已出现大量加价转卖的Mac mini货源,多款全新、二手机型溢价幅度明显高于常规二级市场水平,这一缺货现象也侧面反映出个人本地AI部署需求的快速增长。

1 小时前
2026年4月,专注AI编程赛道的初创公司Cursor启动新一轮大额融资,给出500亿美元的预期估值。此前SpaceX曾传出有意以600亿美元整体收购Cursor,但此次融资对接中,包括Iconiq在内的多家顶级后期投资机构均明确拒绝投资,业内将遇冷归因于全球AI资本已完成向OpenAI、Anthropic等头部巨头的初期布局,投资情绪整体转向审慎。

1 小时前
2026年4月24日,国产AI领军企业DeepSeek正式发布新一代旗舰大模型DeepSeek V4,本次发布采用细分化产品策略,推出DeepSeek-V4-Flash、DeepSeek-V4-Pro双版本,分别覆盖轻量高频应用与复杂推理两类核心场景,整合了原有deepseek-chat与deeps...

1 小时前
2026年4月,AI创业公司Anthropic开发的Claude Mythos AI模型曝出安全事件:这款因网络安全能力过强、被内部判断不适合公开发布的测试模型,被未授权黑客非法获取访问权限。据彭博社报道,事件发生在Anthropic邀请少量企业参与封闭测试阶段,一向以“AI安全优先”为品牌定位的Anthropic,此次事件再次引发行业对大模型安全边界的广泛讨论。

1 小时前
2026年4月24日,特斯拉正式宣布中国区车载语音服务接入字节跳动旗下豆包大模型,本次合作采用双模型落地方案,由AI创业公司DeepSeekChat提供底层AI互动功能。这是特斯拉2025年8月与火山引擎达成合作后,在中国市场的又一重要本土化布局,也是特斯拉首次全面接入中国本土大模型技术,将推动国产大模型车载商业化进程,重塑国内车载AI行业竞争格局。

1 小时前
2026年4月,英伟达首席执行官黄仁勋向OpenAI首席执行官萨姆·奥特曼通报,英伟达旗下1万名来自工程、法务、营销等全部门员工,已提前接入基于GPT-5.5技术的OpenAI Codex编程工具。黄仁勋推动全员推广使用该工具,英伟达还配套搭建了Codex实验室,将推出系列培训帮助员工掌握工具,目前内部试用已取得显著成效。

2 小时前
2026年4月23日,腾讯完成AI板块人才引进与组织架构调整后,正式发布并开源混元系列全新大模型混元Hy3 preview。该模型是混元架构重建后训练的首款成品,也是混元系列迄今性能最强的智能模型,采用快慢思考结合的混合专家架构,总参数达2950亿,支持256K最大上下文窗口,目前已落地腾讯旗下十余款核心产品。

2 小时前
2026年4月,Meta正式推出“模型能力倡议”(MCI),由Meta首席执行官马克·扎克伯格与首席AI官亚历山大·王联合推动,计划收集员工日常工作行为数据加速旗下新大语言模型Muse Spark的训练进程。本次拟采集的数据包含鼠标点击、键盘输入、屏幕内容等原生操作信息,旨在填补AI对人类日常计算机使用逻辑的认知空白,该举措也再次引发业界对AI训练数据隐私边界的讨论。