DeepSeek OCR是DeepSeek推出的下一代文档智能工具,基于自研上下文光学压缩引擎,采用两阶段Transformer架构:第一阶段融合窗口SAM视觉Transformer、CLIP-Large编码器和16倍卷积压缩器,将高分辨率文档压缩为精简视觉Token;第二阶段用3B参数混合专家模型解码,训练数据覆盖3000万真实PDF页及合成图表、公式、化学结构等内容。相比传统OCR,它对复杂布局的识别精度更高、算力消耗更低,Fox基准测试精确匹配准确率达97%,单NVIDIA A100显卡日处理量可达20万页,适配多场景文档数字化需求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
7 天前
2026年4月7日,微软宣布面向Microsoft 365 Insider项目成员开放iOS版Word Copilot协同创作功能测试。用户可通过自然语言指令调用AI生成、修改文档内容,配套支持共享文档修改预览确认、操作快速回溯等安全机制,进一步降低移动场景下文档编辑门槛,提升办公效率。

21 天前
2026年3月24日,AI初创公司Anthropic正式发布Claude“电脑使用(Computer Use)”功能预览版,该功能可支持Claude绕过文本交互限制,直接操作Mac设备,通过移动鼠标、点击应用、编辑文件等动作独立完成多类复杂任务,意味着AI助手正式从对话工具向可深度代劳的“数字员工”方向演进。

21 天前
2026年3月24日,AI大模型企业Anthropic正式为旗下AI助手Claude推出“Computer Use”桌面控制功能,目前以研究预览版面向Pro、Max付费用户开放。该功能落地于面向知识工作者的Claude Cowork与面向开发者的Claude Code两款产品,同步上线的Dispatch功能支持用户通过手机端Claude远程下发任务,由桌面端自主完成系统操作。

25 天前
据全球科技媒体TechCrunch2026年3月发布的行业观察,当前主打便携形态的AI笔记硬件产品密集上市,可实现会议音频自动转录、核心要点提炼、行动项自动梳理功能,部分产品支持多语言实时翻译,相较软件类笔记工具转录准确率平均提升22%,待机时长最高可达72小时,正在成为B端办公采购的新热门品类。

27 天前
近日谷歌正式为旗下办公套件Google Workspace全量上线Gemini原生AI功能,覆盖邮件总结、内容起草、数据整理、会议纪要跟踪四大核心办公场景,官方内部测试数据显示相关功能可帮助用户降低37%的重复性办公耗时,目前该功能已向所有企业付费订阅用户开放,个人免费版用户将在2026年第二季度逐步获得推送。

1 个月前
2026年3月12日,腾讯旗下自研AI原生桌面智能体工作台WorkBuddy(原OpenClaw腾讯版)宣布完成重大版本升级,正式实现与微信的深度直连并面向所有用户全量开放。用户仅需通过微信发送文字或语音指令,即可远程操控办公PC完成多类办公任务,打破PC终端限制,实现7×24小时随身AI助理服务。

1 个月前
2026年3月,微软宣布旗下Office办公全家桶迎来重磅升级:Word深度集成AI助手Copilot,支持直接编辑文档;Teams推出企业级灵活内容管理功能;OneDrive彻底解决长期困扰用户的路径报错问题。此次升级聚焦用户体验与数据管理优化,有望进一步巩固微软在全球办公软件市场的领先地位,推动办公场景智能化进程。

1 个月前
2026年3月,钉钉正式发布8.2.15版本更新,核心聚焦提升办公工具易用性。本次更新包含业内首创的AI表格「透视表视图」,同时将AI表格Agent接入钉钉群,已落地销售信息汇总、工厂巡检、SOP流程校验等高频业务场景,还上线AI听记思维导图功能,旨在降低复杂数据分析与信息整理门槛,助力企业与个体释放生产力。