大数据时代 OCR技术助力领跑信息数字化

作者: Vivian 来源: 网络 时间: 2018-10-18

当前,国内互联网已成功进入大数据云计算时代,与人工智能技术相辅相成。新的科学技术、新的智能应用源源不绝,不断冲击行业传统结构,促使产业服务更新换代。

以人工智能文字识别为例,十年前,办公室纸质文档数字化还在依赖人工手动录入,发展到现在,绝大多数企业早已转投OCR技术怀抱,通过扫描仪、数码相机等光学设备完成文字信息录入工作。

OCR技术

OCR技术成熟 降低真实场景识别误差

行政办公、档案管理、金融业务,OCR身影无处不在。据云脉技术人员介绍,随着OCR技术的成熟,相关市场应用也在不断进步。OCR技术研究不只停留在标准化规范化文本识别上,在技术成熟的基础上,更多的是寻求真实场景的低误差应用。

受环境光与文本资料本身资质所限,从真实场景中提取文字信息是具有一定难度的。纸质文档本身是否整洁,是否破旧,字迹是否模糊,是否存在背景图片等都会影响到文字识别最终准确率。

面对真实场景文字提取中的正面挑战,厦门云脉技术采用先进算法与技术架构增强识别数据,历经多次实验调整,通过美化图像,锐化对比、降低噪点等方式获得更加清晰完整的图像,使得文字识别准确率在各大现实场景下有明显提升。

OCR技术

云脉开放OCR API接口 缩短研发周期

云脉文字识别是云脉OCR团队自主研发的文字识别AI产品,支持识别包括简繁体中英文在内的十多种语言,识别速度快,识别率高,API开发支持Java、C++、C、 object pascal及objective-C等多种语言。目前已通过接入的方式活跃应用在银行、保险、证券、档案管理、族谱新编等领域。

为方便更多的开发者,云脉OCR开发者平台开放了包括文档识别、名片识别、银行卡识别、身份证识别、票据识别在内的数十种OCR识别技术,支持系统软件的个性定制。

SaaS作为人工智能技术运营的新模式,在历经狂热之后逐渐沉淀并受到行业认可,接入平台API接口,对开发者而言,不仅缩短了系统软件开发周期,极大提高系统研发效率,与此同时降低了开发成本。厦门云脉聚集业界翘楚,为OCR开发者平台的运营稳定提供了技术保障,效率服务海内外开发团队。