近年来随着我国电子政务发展迅速,国家大力推进政务信息化建设。根据最新修订的《中华人民共和国档案法》,要求各级人民政府将档案信息化纳入信息化发展规划,保障电子档案、传统载体档案数字化成果等档案数字资源的安全保存和有效利用。如何将海量的政府文档数据结构化,构建每个字符文字都可分析、可检索、可相互关联的大数据,成为政府亟待解决的课题。
应对这一难题,最有效的方式就是完善档案资料管理系统,而涉及到档案录入、纸质信息读取存储的任务几乎都离不开OCR技术。为此,在OCR领域深耕多年的厦门云脉推出了档案管理系统,帮助政府企业建立独立的档案电子数据库。
云脉档案管理解决政府纸质档案管理困境
政府传统的纸质档案管理模式无法解决各个部门文件的统一管理问题,导致了检索查找非常不便捷,检索不到、检索不准、编研利用不方便、没有全文本无法做大数据等都是一个个数据利用难题。同时,全国档案数量巨大,一直以来,档案文本内容数字化都面临着成本高、效率低、周期长的困境。
运用OCR文字识别技术和大数据等互联网技术手段,可以为政府档案数据由“图像化”向“文本化”转换提供了实现路径。云脉研发的档案管理系统在传统OCR技术研发基础上,加入了大数据和深度学习的算法,识别率高、速度快,抗干扰能力强。
云脉档案管理系统通过云脉的OCR全文识别技术,可以实档案自动全文识别、全文数据快速检索、文档美化、智能纠错等功能,并帮助政府建立档案大数据,在节省政府人力的同时,提高了政府的运行效率。
云脉档案管理系统核心模块介绍
OCR全文识别:利用先进的OCR技术,对图片中的所有文字信息数据进行结构化处理。支持印刷体、手写体及定制化场景的图片文字识别,有效提升信息录入效率。
快速全文检索:图片全文识别后,可以利用检索引擎进行图片内容的全文检索,以字搜图。支持全文内容模糊检索以及关键词检索,并在原图中高亮显示检索内容位置。
图像美化处理:对上传图像,系统可以进行自动切边、倾斜校正、增强美化、压缩存储等美化处理。去污、纠偏、去黑边,提高扫描图像质量。
文本信息导出:随时随地,进行文档导出分享,导出格式包含pdf、word、txt、纯文档图片,提高团队文档的高效协作。