关于档案馆数字化建设的思考

作者: 厦门云脉技术有限公司 来源: http://www.yunmai.com/ 时间: 2016-06-29

当二十世纪的尼葛洛庞帝 (Nicholas Negroponte)在《数字化生存》(Being Digital)一书中,向人们描述着数字时代对我们的生活方式、工作方式甚至思维方式带来的各种冲击时,人类文明已经真实地迈进了二十一世纪,数字化信息时代的大潮朝着我们扑面而来。档案管理和利用如何应对及适应数字化信息时代的需求,是我们档案工作者要思考的。

目前大部分档案馆馆藏档案载体仍然是以纸质为主,纸质档案数字化制作方式一般有二种:第一种是通过计算机人工录入或通过扫描仪扫描由字符识别软件(OCR)识别,制成文本文件;第二种是将档案文件的每一页看成是一张图片,不管上面具体是什么内容,由扫描仪按页扫入计算机制成图形文件。第一种方式占据空间小,是一种真正意义上的全文数字化,但纸质档案信息的记录方式是多种多样的,有的是手写体、繁体字,有的字迹褪化及非文字形式等,此时采用第一种方式就会暴露出如下致命弱点:用OCR字符识别的准确率低;若采用人工录入,不但需要大量的录入人员,而且一时还不能马上胜任此项工作,差错率大且核对困难,投入大,收效慢。而第二种方式实现容易,一般档案工作人员只要稍加培训,即可操作机器,且工作可以定量化,差错率相对较低,即便有一些错扫、漏扫等,也能很快被发现。至于图形文件占空间大的问题,在计算机技术日新月异的今天,相信适合的软件很快就会被开发出来,如果能采用先进的高速扫描机,那么对档案信息数字化无疑是如虎添翼。另外,还因为图像扫描保持了档案原件本来面目,可以使利用者在看到文字内容的同时,也能看到纸质档案的其它一些特征,如原件的纸色、墨迹、印章、圈点、批注等各种原貌,使利用者可以获得更多的线索,开展一些更深入的研究。

档案信息只有在传递过程中才能体现出它应有的价值,以往信息存在于一次文献即档案原件或经过处理的二次文献范畴内,人们需要档案信息,往往需要亲临档案馆,通过阅览摘录、静电复制或拍摄等形式来获取需要的信息。但档案信息在完成数字化后以数字形式存在时,数字网络系统就将成为其主要的传输平台,为档案信息的快速流动提供可能。数字化了的档案信息在传递过程中可以同时进行多向传递,形成传递网络,而且通过因特网可以方便地进行远程传递,不受时间与空间的限制,利用者不必亲临档案馆,就可以在任何时间任何地点通过计算机方便地利用档案信息。

如果把档案馆数字化建设比作一个人体的话,那么档案管理数字化和馆藏信息数字化的建设就是这个人体的骨架和血肉,数字网络系统就是它的神经网络。档案馆信息传输平台应首先构建的是档案馆局域网也可称为内网,一般的要求是在遵循统一的通信协议前提下,通过网络连线将各个部门的计算机资源整合在一起。可根据不同的应用设置服务器,部门的个体计算机通过网络共享网络信息资源,为档案馆核心数据库提供档案信息,也可以得到权限范围内的档案信息。其次是构建外网、公众网等,可使档案信息通过数字网络系统进入信息交流的大动脉----互联网,实现档案资源的共享。