浅谈档案扫描工作的要点

2015-12-19 22:35王晓敬
卷宗 2015年11期
关键词:档案信息化数字化

摘 要:社会的高度信息化给档案工作提出了新的要求,传统的档案保护和利用工作,已不再适应当今科技发展的需求,为了便于档案信息的收集、保存和利用,采用数字图形处理技术等现代化手段对纸质档案进行数字化管理,已成为当今档案信息化建设的重要内容。而这一切都需要已档案扫描为基础来实现。

关键词:档案信息化;数字化;档案扫描

随着现代信息技术的迅速发展和大量电子文件的产生,档案信息化数字网络的建设是档案管理工作的热点和重点。所谓纸质档案数字化(简称数字档案)就是利用数据库、数据压缩、高速扫描等技术手段,将纸质文件系统组织成具有有序结构的档案信息库。它包含两个不同层次:一是档案目录的数字化,目标是建立档案目录数据库,关键是严格规范档案信息的著录标引并科学选定档案目录数据库;二是档案全文信息的数字化。

随着科学技术的不断发展,计算机技术在档案部门应用越来越广泛,计算机的应用给我们档案工作者带来了极大的方便。人们对计算机应用的认识产生了质的飞跃,一方面对计算机管理档案又提出了新的要求,使计算机管理档案的应用项目由当初的几个环节逐步发展到档案管理的过程,计算机系统处理的对象由目录发展到全文。近期,笔者通过对档案的全文扫描、数据存储、全文检索应用等工作实践,认识到要充分发挥计算机检索速度快、存储容量大的优势,必须做好档案的数字化转换,而实现档案数字化转换的手段之一就是通过计算机和扫描仪对档案原件进行扫描并对扫描件进行二次处理,做到档案资源数字化的目标。

在进行档案数字化加工过程中,应注意以下几点:

1 扫描前的准备工作

对需要扫描的馆藏档案进行总体了解和统计。对需要进行全文检索以及目录检索的档案进行分类,因为这两种方法在加工过程中的处理方式不同,因此对纸张的大小及数量进行摸底,做到心中有数。

2 扫描的技术手段

档案扫描是档案数字化转换的基础工作,扫描质量直接关系到磁盘上的档案图像文字的清晰度和还原效果,因此要保证质量必须采取必要的技术手段。档案原件的清晰度直接影响着扫描质量,因此扫描过程中,应针对原件的具体情况,采用相应的技术手段,以达到满意的效果。对于原件比较清晰的文书档案一般采用300dpi,用此分辨率既能够达到与原稿同样地清晰度,并适合打印。但是对于原件不太清楚的档案,应具体情况具体分析,可以采用更高一些的分辨率。对于需要进行全文检索的文书档案,分辨率应不低于600dpi。因为对于全文检索的电子文件需要进行二次处理,虽然较高的分辨率会多消耗计算机的资源,但是全文检索能够提高检索的效率。

3 选择适当的扫描方式

扫描方式直接影响到扫描的速度和扫描件的大小,因此在扫描之前,我们应先根据被扫描档案的类型,选择一种适当的扫描方式,才有可能获得较高的扫描效果。扫描程序一般提供了三种扫描方式:黑白、灰度和彩色。这种三种方式各有优缺点,需要对不同的纸张进行不同的选择。对于一般性的文书档案中“白纸黑字”的原稿,采用黑白扫描即可。对于一些像录取名册等这类复印纸张的档案,可以采用灰度扫描,因为黑白扫描容易丢失内容。对于照片等需要保留色彩信息的档案则采用彩色扫描。

4 图像保存格式

档案扫描是档案信息化建设中一项重要基础工作。目前在档案领域,存储档案数字化图像的标准格式一致是国家档案局推荐的通用文件格式—TIFF文件格式。TIFF(Tagged Image File Fromat),即标记图像文件格式,是一种专门为页面排版开发的一种图像文件格式,是使用最广泛的图像文件格式,大多数扫描仪都支持输出TIFF格式图像文件。目前大多数档案馆扫描原件生成的图像都采用这种文件格式。近年来,由于科学技术的不断发展,档案信息化的要求越来越高,若需对电子档案进行全文检索,则TIFF文件就有了一定的局限性。因此当前在国内数字化档案馆的试点工作中,对传统档案全文数字化,主要采用高速扫描仪将纸质档案扫描成电子格式存储并加以利用的过程,扫描后形成的电子信息为接近原件原貌的PDF(PortableDocument Format的简称,意为“便携式文档格式”)文件格式,PDF文件以PostScrip语言图像模型为基础,无论在哪种打印机上都可以保证精确的颜色和准确的打印效果,即PDF会忠实地再现原稿的每一个字符、颜色以及图像。采用PDF格式可以达到存储容量小、网上传输速度快等特点。当然,这种大批量的档案信息数字化过程需要相关系统软件的配合,实现全文检索。

5 数据备份

档案扫描后形成的扫描件,通过检验并审核“合格”后,应及时的导入综合档案管理数据库服务器,并与本单位的综合档案管理系统实现数据挂接。除了在服务器中的数据备份以外,还应有其他备份方式。本单位采用移动硬盘和光盘刻录两套方案来备份。备份数据并非冗余数据,可以起到以防外衣的作用。对备份数据定期进行检查,检查载体的物理状态及其所存储数据的可读性和可用性,以便于及时发现、及时挽救。若数据库信息发生问题,及时启动备份数据信息进行恢复。

以上为本文在此次档案扫描工作过程中的一点心得体会,不足之处敬请批评指正。在以后的工作中希望檔案同仁互相沟通和交流,为档案事业的发展尽绵薄之力。

参考文献

[1]施红刚.浅谈档案信息资源与开发利用.科技与社会

[2]杨德春.档案信息化建设.科技促进发展

[3]张焕旭.数字档案室创建中纸质档案扫毛工作探究.档案保护

[4]孟强,尹军.文书档案扫描经验谈.山东档案

[5]张艳荣.高校档案扫描操作实务探析.兰台世界

作者简介

王晓敬(1983-),女,河南安阳,馆员,硕士,三峡大学档案馆,档案管理。

猜你喜欢
档案信息化数字化
数字化:让梦想成为未来
家纺业亟待数字化赋能
论经济学数字化的必要性
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
信息时代高校档案信息化建设研究
中职院校档案管理工作存在的问题及措施
医院档案信息化管理存在的问题与对策
档案信息化的思考
数字化制胜