盛静SHENG Jing;王曙明WANG Shu-ming
(永州职业技术学院,永州 425000)
(Yongzhou Vocational Technical College,Yongzhou 425000,China)
档案作为一种重要的信息资源,具有较高的科研价值。在《国民经济和社会发展第十个五年计划的建议》中共中央明确提出:档案作为一种原生的信息资源,在国家信息化建设过程中,档案信息化建设是一个重要的组成部分。通过加强档案信息化建设,提高档案管理的现代化水平,这是先进生产力、先进文化发展的必然要求,同时也是提高档案信息服务水平的必然选择,在档案事业发展过程中,提高档案管理的现代化水平具有重要的现实意义。
2.1 概念 PDF 全称为便携文档格式(Portable Document Format),是一个适合文档交换的开放标准,致力于不依赖文档创建环境,允许用户交换及浏览的一种电子文档格式。具有不限定软硬件及系统环境,高压缩比、长期保存、高质量输出等特点。
2.2 技术 PDF 文件格式已成为国际标准,越来越多的行业和单位正在使用它。PDF 文件是一种具有多层结构的格式文件,其特点是:文件既可以是文本型的(比如由word 生成的文件),也可以是图像型的(比如由扫描生成的文件),双层PDF 技术还可以将tif、jpg、bmp、gif、png、单层PDF(图像)等图像类文件经加工后输出为可全文检索的双层(图层和文字层)PDF 文件。双层PDF 文件是指文件内容既包含文本层,也包含图像层,且其位置上下一一相对应。对于PDF 文件来说,其每一页涉及的内容主要包括:第一上层是对纸质文件进行扫描获取的原始图像,第二下层是通过OCR 软件对图像进行扫描识别后产生的文字结果。通过上述处理,用户在使用PDF 文件的过程中,看到的是扫描图像,原始版面的公章、签名等可以100%保留,在需要的情况下,可以对下层的文字信息进行选择、复制、检索等。
2.3 制作方法 PDF(Portable Document Format)文件格式作为一种特殊的文本格式,是由Adobe 公司所开发,该文本格式与其他文本格式相比,其优点主要表现为:尺寸小、阅读方便,同时便于网络传播和使用。但是,如果对其进行文本、格式等操作就会变得比较困难,因为在解码格式方面,PDF 格式与Doc 格式存在一定的差异,通过回车符、换行符,以及图片格式等在PDF 格式下无法将其直接转换为Doc 文件。具体的解决方式为:
Adobe Reader 6.0 Standard:通过点击菜单栏中的“创建PDF”按钮,对相应的创建途径进行选择,选择“从文件”,选中需要转换的文件。
在文件格式转换过程中,通过Acrobat Distiller 使得转换更加轻松,在这种情况下,借助Office 办公软件打开相应的Doc 文件,然后选择“文件”——“打印”中的Acrobat Distiller 打印机。
Adobe Acrobat 7.0 Professional:对于Adobe7 来说,通常情况下需要进行激活处理,用Paradox Key Generator 生成,在rar 文档中,经解压后出现一个“Keygen”。运行文件夹里的pdx-ac7p.exe 程序,借助该组生成的S/N 进行相应的安装处理,完成安装后,需要重新启动计算机,进入Acrobat 界面,在操作界面上选择弹出菜单列表中的“Activate Option”,并单击“Activation by telephone”按钮,在弹出Acoabat 中,产生Activation code,这时,Paradox Key Generator 程序将会被执行,在界面产生的S/N 及Activation code 中输入Paradox Key Generator,同时取得Authorization code,并手工输入。
利用Office2003 的转换工具:首先使用Adobe Reader打开需要转换的PDF 文件,同时对文件菜单中的打印进行选择,按照“Microsoft Office Document Image Writer”设置“打印机”的“名称”,确认按照MDI 格式将该PDF 文件设为虚拟打印文件。对于“Microsoft Office Document Image Writer”项,如果在“名称”设置的下拉列表中没有找到,在这种情况下,说明安装Office 2003 时没有安装该组件,这时对其进行更新和安装,需要借助Office 2003 安装光盘中的“添加/删除组件”。通过运行Microsoft Office Document Imaging,打开保存的MDI 文件,在工具栏中选择将文本发送到Word 菜单,然后选中弹出窗口中的“在输出时保存图片板式不变”,经过确认后,系统会自动提示“必须在执行此操作前重新运行OCR,这可能需要一些时间”,最后按确认键即可。
PDF 技术使档案数字化管理给搜索、查找、即时阅读带来的便捷是毋庸多言的,能够简化并极大提高管理的质量和效率。许多纸质或其他实物档案,由于年月已久,只要动一动就会散裂或尘化,损毁风险极大,通过PDF 技术数字化采集图片、视频、尺寸、材质、介绍、文字描述等内容就可以在未来相当长一段时期保证原档的完好性,并且便于向需要的人提供参考。
随着PDF 技术的发展,档案数字化管理技术实现了长足的发展,同时随着技术的不断创新,其工作方式、管理模式必将出现新的变革。在一定程度上利用先进的技术对档案进行数字化管理,进而对档案进行多元化、网络化管理,同时转变档案的管理模式。在对档案进行管理的过程中,以保管、利用档案实体为重点,同时以档案信息的数字化存储为核心,使得档案管理走向数字化、规范化、网络化。
[1]郭金光.双层PDF 技术及在档案数字化中的应用[J].陕西档案,2013(02).
[2]周锦云.档案管理系统的设计与实现[J].电子科技大学,2013(03).
[3]熊雨前,徐红轮.PDF 技术及应用[J].数字与微缩影像,2011(03).