夏超群
(河南省图书馆,河南 郑州 450000)
我国是一个历史文化古国,古籍是我国的不可再生的文化遗产,随着时间的变化,古籍的数量将会越来越少。因此怎么保存好现有的古籍已经成为图书和档案管理部门最为重要的任务[1]。由于电子扫描技术具有成本低、操作简单和保存时间比较久的特点,因此对古籍进行数字化管理是解决目前古籍档案管理中面临的一系列问题的最有效的办法。
我们从古籍数字化成就来,能够对古籍数字化归纳为下面几个方面的特点:
我国政府长久以来对非常对古籍保护进行重视,自从二十一世纪以来,我国在政策方面对古籍数字化工作给以高度的支持,给我国古籍数字化工作的健康发展打下良好的基础。
除了不一样级别图书馆以及科研学术机构外,更多的商业机构都参加到了古籍数学化工作当中,另外从参加到的组织来看,国际数字化国际合作力量也越来越大,其给古籍数字化管理发展带来新的方法以及内容。
从经典文集到方志的家谱,从纸质的善本到碑帖的甲骨。我国的古籍资源越来越多。这带来了古籍数字化工作在内容方面也越来越多。民族古籍、中医药的古籍以及农业古籍等等也越来越细化以及深化,不断对现有古籍数字化成果进行完善。
古籍数字化为古籍整理工作的发展以及延长。在数字化的过程当猴子呢个,将面对这构建字库,选择版本和古籍整理基础技术等方面。国外技术以及经验不能给我国古籍数字化建设带来一定的参考和借鉴。这就需要我国古籍数字化工作人员研究一种适合中华古籍数字化技术方案,并且不断的进行升级以及优化。
中华民族是一个拥有着悠久历史的文化古国,古书籍的版本也比较多,就拿我们大家都熟悉的《红楼梦》来说吧,就分为两个版本,其中一个版本是八十回抄本系统,题名为《石头记》,也叫“脂本”系统。另外一种是一百二十回本系统,也叫程高本。这两个系统中还包括乙卯本和庚辰本等版本。古代的人总是说“书非借不能读也”。所以,我们在对古籍进行数字化管理是要选择合适的底本,还要对其进行查缺补漏。而且由于一些保存条件的原因或者书的材质本身的原因,造成了一些藏书已经破损和残缺等现象[2]。
在对古籍进行数字化的过程中面临的难点问题就是汉字的处理。古籍数字化需要字库作为支撑,然而字库中的汉字量是有限的。但是古代的书籍中又有很多的繁体字、通假字、避讳字等,这些不规范的字体导致计算机文字的编码没有办法使用。现阶段行业内一般采用的是Unicode文字处理标准,然而这项技术定义的汉字也仅有7万多字,这个数字量和古籍中所涵盖的汉字量比还有一定的差距,这直接影响了古籍数字化的发展[3]。OCR虽然是一种很先进的信息输入技术,但是他对图像和文字的规范化程度要求都比较高,经常应用于近代文献以及现代文献的数字化中。因为古籍的字迹一般都具有比较模糊和污渍等特点,因此利用OCR进行处理,也没办法真正有效的处理这些信息资源,甚至可能会出现乱码的情况。还有一些手写的古籍更没有办法通过这种技术进行识别。
目前,在我国的图书馆古籍管理人员中,从事古籍数字化扫描工作的人员是非常少的,这是我国古籍数字化的一个普遍问题。使得从事古籍数字化工作的人员的工作压力比较大,如一个工作人员把古籍从前期整理到后期数据著录等工作做完的话,一天只能处理100幅左右的书影,导致扫描的进度较慢,甚至可能会造成漏扫或者重复扫描等问题的发生[4]。
数字化是一类工具,古籍数字化存在许多用途,当有助于古籍的利用及再利用,有助于保护古籍原件及有利于对原件修复等等。古籍数字化多类用途和最终目标不一样,其最终目标是实现保护原典以及方便古籍的而利用及再利用。当前,我国对古籍数字化认识还不够全面。例如:古籍数字化最终定位在了知识发展服务方面。古籍数字化最终目的是更大范围、更便捷以及更有效的让文献给人们所用。古籍数组化应用立足古典保存和内容服务。此外,还能更方便典藏以及研究等。如果对古籍数字化认识不全面将会造成数字化过程中出现一定的风险,或直接影响古籍数字化有关技术方法以及技术指标的选择,同时还会影响古籍数据管理策略方面的制定,其中含有制定有关古籍数字化有关技术等。
古籍数字化是一类系统工程,其要利用科学的规划以及发展战略来统筹。但是,当前我国古籍的数字化工作还缺少宏观的调控以及管理。在这个环境当中,缺少分工协作意识。此外,各单位在建设完成的估计数字化方面,还存在许多不足。首先,选题方面出现偏颇,资源大多在热点的项目当中,特别对商业机构在资源来发的时候大多集中到比较少的常用古籍内。第二,资源集中造成了许多重复的建设,大大对人力以及财力进行了浪费。
如果想建立一个健全完善的古籍数据库,让借阅人员上电脑就能看到古籍的整体面貌,就要建立一个统一的、行之有效的机读目录,且一定要制定统一的标准,这是我国现阶段古籍数字化必须解决的问题。在古籍数字化中,仅对卷册的页码、文献的形态及题名等方面进行健全,且对这些方面进行了一同的分类原则以及分类标准。这将会让制作成的产品更加便于阅览者进行操作及进行访问,更好的让古籍数字化的成果发挥到最大,且更好的对资源进行共享。这些方面的制定不但要通过信息产业界、标准的有关软件、图书馆的情报界等有关软件进行开发商的参与,且也含有一些古籍整理专业人员的参加。只有如此,才可给读者带来对古籍文献进行共享的一个平台。
在进行古籍数字化管理中,有一个非常重要的环节就是对底本的选择,这环节必须要谨慎,尽量从所有底本中选择出最优的底本,善本的好坏对所制作的电子产品质量有非常大的影响,因此在选择底本的过程中,首先要看善本的情况。所谓的善本,就是古书籍中保存相对较完整的书。善本也是我国的一种比较珍贵的历史文化遗产,对其进行科学合理的利用和选择,并对其进行数字化管理,有利于我国文化遗产的长期保存。
要想提高古籍数字化管理人员的素质,不仅要对其进行古籍整理方面的知识的培训,还要对其进行相关的信息技术的培训。所以古籍的数字化管理是在传统的古籍管理的基础上利用当代的科学技术进行信息化管理。为了保证古籍数字化工作能顺利进行,培养一批既具有古籍整理专业知识又掌握当代的信息技术的综合型人才是我们现阶段的首要任务,不仅要具有良好的职业道德,还应具有良好的品行和较高的文化修养。
制作古籍扫描设备的企业要多采纳古籍数字化工作人员的意见,并不断的对软件进行升级,比如要将一些参数的设置固定化,减少重复设定的问题,增加一些按照批次处理的功能等等;还要对扫描设备的硬件配置进行不断的完善,比如可在以往的操作台上增加升降功能。只有不断的更新和完善扫描设备,才能提高古籍数字化的工作效率和书影的质量。此外,还可通过一些通讯软件,多与用户进行实时沟通,并进行不断的改进。
通过我国的古籍保护中心等机构来牵头组织,更好的规划,科学分工,对古籍资源共同建设进行统筹,给控制管理古籍数字化工作进行选题。首先,避免充分建设,盲目的进行建设。第二,鼓励及促进特色古籍资源数字化建设,让古籍数字化工作持续健康的发展。除此之外,利用统筹规划冲破建设单位来另起炉灶,对共享共建提出比较高的要求,尽可能的整合以及利用数字化成果,大大提升使用的效率,降低物力、财力、人力方面的浪费。
我国是一个历史文化古国,古籍是我国的不可再生的文化遗产,随着时间的变化,古籍的数量将会越来越少。因此怎么保存好现有的古籍已经成为图书和档案管理部门最为重要的任务。目前古籍数字化虽然取得了一定的成果,但是还存在一些列问题。所以,我国要对中文古籍档案标准的进行研究,并制定档案标准,还要慎重的选择底本,建立完善的古籍资源库,并加强相关人员的培训工作。