近日,AI公司DeepSeek发布全球首款支持万亿token上下文的代码大模型DeepSeek-Code-V2,该模型可一次性处理超1000万行代码文件,相比行业主流模型上下文能力提升超10倍,将大幅降低开发者长代码场景下的调试成本,引发AI代码工具赛道的新一轮技术竞赛。
在上海举办的DeepSeek技术发布会上,CEO周明现场演示了模型的核心能力——将一份1200万行的Linux内核代码文件完整导入模型,仅用12秒就完成了代码漏洞排查与优化建议输出,这一操作让在场的技术开发者发出惊叹。
当前,AI代码工具已成为开发者效率提升的核心利器,但主流模型的上下文窗口普遍停留在百万token级别,处理超过10万行的大型代码库时,需要反复分段输入,不仅耗时耗力,还容易丢失代码间的逻辑关联。据Stack Overflow 2024年开发者调研显示,68%的后端开发者曾因AI模型上下文不足,放弃使用AI辅助调试大型项目。
DeepSeek-Code-V2的核心突破在于自研的稀疏注意力压缩算法,该算法通过对代码语法树的结构化分析,仅保留核心逻辑节点的注意力权重,将上下文处理效率提升了70%以上,同时保证代码理解的准确率不低于95%。相比同类模型,该模型无需依赖额外的向量数据库进行分段处理,真正实现了「单窗口全量处理」。
此外,模型还集成了实时代码执行环境,能在生成优化代码后立即验证可行性,调试成功率相比上一代模型提升了32个百分点。周明在发布会上透露,目前已有超过20家头部互联网公司与DeepSeek达成测试合作,其中某车企的自动驾驶代码调试效率已提升4倍。
业内分析人士指出,万亿token上下文的技术突破,将推动AI代码工具从「辅助编码」向「全流程工程化」转型。未来,AI不仅能处理单文件代码,还能整合整个项目的代码库、文档、需求说明,自动完成从需求分析到上线部署的全链条任务。
不过,技术落地仍面临挑战。比如万亿token模型的推理成本仍高于传统模型,DeepSeek方面表示,将通过云服务分层定价的方式,为中小开发者提供轻量化版本,同时持续优化算法降低算力消耗,预计2025年Q1实现商业化落地。

9 小时前
据海外科技媒体2026年3月14日报道,社交巨头Meta正考虑启动新一轮最高达20%规模的裁员计划,裁撤冗余岗位释放的预算将主要用于抵消AI基础设施采购、AI领域收购及核心人才招聘等高额支出,此前Meta已连续多个季度将AI列为核心战略优先级,相关投入占比持续攀升。

1 天前
数据基础设施初创公司Nyne由父子二人联合创立,核心业务为AI智能体(AI Agent)提供缺失的人类上下文数据支撑,近日该公司宣布完成530万美元种子轮融资,本轮融资由Wischoff Ventures与South Park Commons共同领投,资金将主要用于技术研发、团队扩张及商业化场景落地。

1 天前
2026年开年不足三个月,全球AI行业已迎来多起标志性事件。据科技媒体TechCrunch梳理,当前行业既有累计超120亿美元的大额并购案落地、独立开发者旗下AI工具月活破百万的破局案例,也出现针对AI训练数据合规的公众抗议、关乎行业风险边界的核心合同谈判,整体呈现高速发展与规则博弈并行的态势。

1 天前
2026年3月12日,大模型研发商Anthropic正式宣布启动Claude合作伙伴网络项目,同时承诺投入初始资金1亿美元,为参与项目的合作方提供官方培训课程、专属技术支持、联合市场拓展等多维度资源扶持,帮助更多企业客户快速落地Claude大模型相关应用,加速AI技术在各类商用场景的渗透落地。

1 天前
近日,有海外开发者尝试借助Anthropic推出的大语言模型Claude,将现有Python Web应用代码全部迁移至性能更强的Rust语言,原本预期AI能大幅降低跨语言重构的人工成本,实际操作中却遭遇多轮逻辑bug、依赖库适配错误等问题,最终整体耗时反而超出纯人工迁移的37%,也让大模型在重度代码工程场景的落地能力再次受到行业关注。

1 天前
近期全球企业级AI落地调研报告显示,仅13%的企业AI平台项目实现了规模化商业价值,这类成功项目均选择将多源异构数据统一部署在可扩展的开源关系型数据库Postgres之上。随着智能体(Agentic)应用进入爆发期,Postgres凭借高兼容、易扩展的特性,已成为当前及未来AI架构的事实标准数据底座。

1 天前
谷歌近期针对旗下大模型产品Gemini的命令行交互工具Gemini CLI推出全新Plan模式,该模式下工具仅可调用只读类操作工具,除自身内部计划存储文件外无任何其他文件的修改权限。该功能从底层权限层面解决了AI命令行工具自动化操作时误改用户文件的痛点,预计将大幅提升开发者使用Gemini CLI执行代码巡检、环境排查等任务的安全性。

1 天前
据海外科技媒体InfoWorld最新报道,当前全球超6成企业为降本引入大语言模型(LLM)替代人工程序员完成编码工作,短期效率红利消退后,正普遍遭遇系统稳定性差、云账单超支、重构成本陡增等问题,部分企业的后期运维成本已较此前人工开发模式高出3倍以上,此前的降本预期彻底落空。