2026年6月2日,百度正式发布文心大模型衍生多模态模型PaddleOCR-VL-1.6,在OmniDocBench v1.6权威评测中以96.33%的准确率超越Gemini-3-Pro、GPT-5.2等国内外主流模型,刷新文档解析领域SOTA,综合性能位列全球第一。该模型支持超100种语言识别,可适配多类复杂文档解析场景。

随着全球数字化转型进入深水区,政务、金融、文化、制造等领域的非结构化文档处理需求呈现爆发式增长。传统OCR技术仅能识别标准印刷体文字,面对表格、手写批注、古籍生僻字、印章、混合排版图表等复杂场景时,准确率往往不足80%,需要投入大量人工校验,大幅拉高了数字化成本。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录