如何管理职场办公中庞大的纸质文档信息?你需要一个随时可用、功能齐全的OCR文字识别工具。这里推荐你使用云脉文档云识别APP,它可以让你的手机变成随身携带的扫描仪、传真机、PDF转换器、Text文本提取工具……
随着OCR技术的成熟和普及,市面上的文档识别工具也如雨后春笋,一茬接一茬。为何笔者要强烈推荐云脉文档云识别APP呢?下面我们分别从识别方式、识别引擎、图像处理、识别效率、识别结果处理等方面来对云脉文档云识别软件进行测评。
云脉文档云识别相对其他OCR识别软件的优势在于:识别方式不仅支持图片拍照识别和批量导入识别,还支持PDF文件导入识别。
在拍照识别方式的测试过程中,在部分亮光部分暗光的情形下拍摄,云脉OCR识别效果也非常不错,对环境的适应能力好。
目前,OCR识别技术针对“印刷体字符”来说已经很成熟了。但如果需要识别的文稿是手写体文字,而字迹又相对比较潦草,云脉文档云识别将是你不可或缺的工具。
云脉文档云识别采用先进的深度学习版OCR识别引擎,能够实现复杂场景下的文本识别,不仅支持印刷体识别,还支持手写体识别,可识别对象更丰富。
众所周知,环境光线与文本资料本身是否整洁,字迹是否模糊,是否存在背景图片等都会影响到文字识别最终准确率。云脉文档云识别APP在图像处理方面,采用先进算法与技术架构增强识别数据,通过美化图像,锐化对比、降低噪点等方式可以获得更加清晰完整的图像,提升文字识别准确率。
针对识别后原文档存储还原的问题,云脉文档云识别支持裁切、倾斜校正、增强美化、旋转、压缩存储等图像美化处理,提高扫描图像质量助力原文档清晰存储,功能更强大。
测试内容:分别测试在Doov朵唯 FreemeOS 9.0.0测试环境下,云脉文档云识别1.0.20210203 / H5文档云识别与ABBYY TextGrabber在印刷体拍照识别、印刷体导入识别、手写体导入识别等不同方式下的识别率。
1、印刷体拍照识别
TextGrabber,识别错误9个字符,识别率(606-9)/606=98.51%
云脉文档云识别,识别错误3个字符(606-3)/606=99.50%
2、印刷体导入识别
TextGrabber,识别错误6个字符,识别率(205-9)/205=95.61%
云脉文档云识别,识别错误11个字符,多为标点符号识别错误,识别率(205-11)/205=94.63%
3、手写体导入识别
TextGrabber,识别正确5个字符,识别率5/246=2.03%
云脉文档云识别,识别错误34个字符,识别率(246-34)/246=86.18%
综上可以看出云脉文档云识别的识别率优于ABBYY TextGrabber,特别是在手写体识别时,识别率高出84个点。
在识别结果应用方面,云脉支持打印、内外部分享、双层PDF导出、图片快速检索,同时,还支持文档标签管理,提升文档查找效率,更便于纸质文档利用。
OCR录入文档的方式特别适用于政府办公、金融业务、教育资源等领域。选择一款适合自己的OCR工具,可以大大解放从业人员的双手,提升纸质文档电子化效率,提升办公效率。目前,厦门云脉已经在云脉OCR SDK开发者平台上开放文档识别接口,用户只需要接入API端口即可享受文档识别功能。