文/李涛
我国的中文古籍数字信息专业,相对其他专业比较冷门[1]。但是,当前社会已经进入以信息为重要资源的时代,对于我国中文古籍的保护工作,也迈入新的阶段,因此对于我国中文古籍数字信息专业人员,在我国将来,也会拥有良好的就业前景[2]。在国外,于20 世纪60 年代末,对信息专业作为研究方向,70 年代提出信息门类,80 年代中期,对信息作出了明确的定义,80年代末,信息专业迅速扩展;但是,当时的信息专业多为计算机信息、信息管理等方面专业,在21世纪的今天,国外也未曾有人将古籍信息专业纳入其中[3]。20 世纪70 年代后期,国内将国外的信息专业概念引进学界,纷纷仿效国外建立信息专业,随着数字技术的到来,古籍数字信息专业也随之建立[4]。但是随着时间的推移,对于国内建立的古籍数据信息专业,其人员就业发展方向,却受到了一定的限制,为此提出我国中文古籍数字信息专业人员未来求职发展方向这一课题。
古籍数字信息化,是社会发展的必然成果,也是为了保护古籍的完整性、推动学术研究的必要手段。因此在采用数字化的方式,保护我国古籍时,必然会面临格式性问题。而这个问题,就是中文古籍数字信息专业人员未来求职发展方向。
在以往,对于中文古籍的保护,多是采取扫描、识别转换成数字文本,存储至计算机的数据库中,但是对于学者来说,却存在很大的困扰,尤其是我国中文古籍,存在异同版本、不同注释语句、人名地名读法不一等区别[5]。所以,中文古籍数字信息专业人员,在求职发展时,可以通过规范古籍数字化的元数据标准,方便数字化中文古籍的索引。在规范古籍数字化的元数据标准时,未曾学习过古籍的人员,难以制定出让所有学者认可的标准。而只学习古籍的人,不具有数字化信息技术,难以将古籍转换成数字信息,因此这份工作也只有中文古籍数字信息专业人员,才可以胜任。
古籍学习人员与数字化信息人员的结合,可以直接为古籍制定统一的标准,并建立专业的元数据库,为学者提供专业的信息资源,为与其他信息系统的对接和共享数据提供必要的接口。所以,中文古籍数字信息专业人员,可以研制统一的版本信息、收藏信息、作者信息和作品信息,并在元数据库中,进行统一的标准,帮助学者查找、搜索所需要的古籍,为古籍的保护,提供坚实的支柱。
古籍在转化成数字信息时,不仅需要规范古籍版本信息、收藏信息、作者信息和作品信息等,还需要在计算机上,确定相应的古籍图片、文档格式。且在存储古籍的过程中会涉及产权等问题,因此更需要专业的数字化格式制定员,制定与古籍相适应的数字化格式。尤其是当前的数字格式种类多样、名目繁多[6]。因此,更需要专业的中文古籍数字信息专业人员,根据古籍的特点,制定与古籍相适应的数字化格式。
不过,当前种类多样、名目繁多的数字格式,对于数字化古籍的查阅,却是一大障碍,因此,中文古籍数字信息专业人员,在制定古籍数字化格式时,还需要与相关的开发公司,研究可兼容其他文档格式的APP,解决当前古籍由于格式信息原因不能统一查阅的问题。但是,从长远角度来说,中文古籍数字信息专业人员,还是需要与业界主要机构相联合,制定出适合所有古籍的文件格式,且这个格式,不仅可以储存简体版本,还要储存古籍的繁体版本。除此之外,由于古籍的读音存在大量的同音不同义、象形字等,所以,该格式还需要具有对古籍进行汉语拼音标注的功能,保证古籍的科学性、严谨性和规范性。
另外,数字化格式制定员所制定的古籍数字化格式,还应该具有全文搜索的功能。尤其是目前,人们之所以喜欢数字化形式的文档,众多原因之一就是数字化文档搜索速度快。一旦数字化格式制定员,所制定的古籍数字化格式不具有这个特点,很难形成较大的用户群,提高古籍的使用率和保护效果。最后,对于古籍数字化格式文档,检索所制定的字词需要予以凸显或标记,以便学者在文档内检索古籍时可以更加简便快捷。上述这些,都是数字化格式制定员,在制定古籍数字化格式时,所必须具有的性质和功能。
除了上述的文字方面格式外,古籍中还含有大量的图片,与文字相互呼应。因此,数字化格式制定员,还需要将古籍原本的图片与数字化的古籍文字相对应,增加数字化古籍的科学性和可信赖性。当前,我国对于图形图像的处理,虽然发展较为成熟,且图片格式的种类、形式,并不逊色于文档格式,也具备较强的可压缩性。但是,处理古籍文献时,所需要处理的图片是海量的,其所要面对的是计算机运行和储存问题,将会成为数字化格式制定员,未来所需要面对重点问题,即制订出具有较高压缩比,且图片清晰,可以再现古籍图片的原始风貌。
从上述两种未来求职发展的情况来看,仅站在古籍保护角度,在这种角度下,对于古籍资源的开发,仅仅只是比原本的图片阅览前进一步,存在很大的局限性。特别是针对古籍版本、句读、偏僻字注释、人名地名的标引等,不同的古籍都会存在一定的异同,且浩瀚的古籍资源,由于内容、历史发展、使用方向等众多原因,都被分散保存在许多各不相关的部门[7],在数字化的过程中,对于古籍规范化和格式化又面临着新的问题。因此中文古籍数字信息专业人员,可以从开发数字化古籍特色资源发展发现入手,深入研究“通鉴、续通鉴等” 特色收藏古籍,并不断与精通古籍整理专业的学者,共同商讨古籍的数字化特色资源开发,突出每一本古籍自己的特色,从而为古籍的规范化和数字化格式奠定基础。
而对于中文古籍数字信息专业人员,其所具有的现代化科技手段及其对古籍的了解都是其他合作式整理古籍、开发古籍人员所不能媲美的,只有同时掌握古籍和现代信息化知识,才能开展古籍研究和开发工作。应用统一的古籍分类法,指出开发出具有数字化特色资源的古籍。
当前,我国古籍汉字众多,且当前的计算机所储存的汉字不过是当前常用字,对于古籍中汉字的处理颇显不足,这已经成为古籍数字化的一大障碍。因此,中文古籍数字信息专业人员,所掌握的古籍知识和现代化信息技术,完全可以胜任汉字字符代码集完善这一工作,加快汉字字符代码集完善进程。
尤其是我国众多学者,都在致力于汉字字符代码集的制定,从最早的《信息交换用汉字编码字符集基本集》所具有的6763 个汉字,到现在计算机已经收录65,531 个汉字字符,更是为当前古籍数字化奠定良好基础。虽然,目前包含六万余字符的超大字符集,对于古籍数字化处理仍嫌不足。因此汉字字符代码集完善人员将会成为中文古籍数字信息专业人员,未来求职发展的众多方向之一。
古籍数字化数据库,牵涉到IT 和古籍研究两个领域人才,而中文古籍数字信息专业人员,却是两个领域的结合,虽然所学众多,存在研究不足、深度不够等问题,但是对于古籍数字化的研究却是正合适的。因此,对于中文古籍数字信息专业人员,其未来求职发展方向之一,就是古籍数字化专题分类。
在目前对古籍的研究下,古籍数字化发展已经具有专题专项发展趋势。在学术层面,即是将与这个古籍相关的专题全部罗列出来,如目前正在建设专题分类的“《红楼梦》研究资料数据库”,在数字化存储中就可以将这个领域和文献全部网罗进来,并在此基础上对该领域中的标点、作者简介、时代划分、体裁归类等进行详细的划分,从而提高古籍资料查找的速度。此时,就需要中文古籍数字信息专业人员,具有研究技术标准、发展方向、选题设置、学科应用等问题的能力。将古籍数字化专题分类做出专业的规划,促使古籍数字化交叉学科得到快速发展。
此次研究从古籍保护角度入手,以学者资料寻找和古籍资料互通角度为辅,研究中文古籍数字信息专业人员未来求职发展方向。但是,此次研究未曾深入考虑古籍数字化信息专业人员对古籍知识和数字化信息技术的掌握程度。因此,在今后的研究中,还需深入研究古籍数字化信息专业人员所需要学习的专业知识,根据学习内容,为古籍数字化信息专业人员寻找合适的求职发展方向。