略述古代地方档案资料的数字化开发与利用

2017-10-28 11:22王心雨
科技视界 2017年15期
关键词:档案数字化

王心雨

【摘 要】为了最大程度上合理充分古代地方档案资料,服务地方文化建设的迫切需要,应该将初步整理出的纸质版档案文件进行数字化处理,处理步骤包括高分辨率扫描,转存为电子文件,并将整合入地方档案数据库。地方档案数据库建设,除了相关硬件的配备之外,在开放浏览页面,应该开辟专门的区域,提供分类浏览和检索浏览,并将检索结果的指向与档案数字图片或相应电子文件相关联,这类服务除了在网络终端得以实现之外,还应进一步拓展至移动终端,开发出相应的APP软件和微信公众号,以收方便浏览利用之效。

【关键词】档案数字化;清宫御档;扬州档案

2010年,广陵书社出版了煌煌十八册《清宫扬州御档》,收录复制了国家第一历史档案馆所藏清代扬州奏折档案计5763件,其中绝大多数资料为首次发现和披露,这在地方档案资料的出版历史上堪称创举。这样一份宝贵的文化资源,虽然已经公开出版发行,但究竟如何能够得以充分利用,仍然值得学术界,尤其是档案界思考探讨,笔者不揣浅陋,尝试结合国内外相关资料的开放经验,对此问题提出自己的看法,仅供相关部门参考。

要让普通读者能够阅读参考这批资料,终极的处理办法,就是聘请专家学者将原文整理成横排简体且有现代标点符号的排印本,然而,这项工作任重道远,不是短期内能完成的。折中的办法,就是对这批档案资料进行数字化开发,并在此基础上加以利用。

目前国际上通行的数字化方法就是对原档进行大分辨率扫描,然后将图像文件或是打包为pdf文件上传至相关服务器,供读者阅读参考。这方面做得比较好的,比如日本国会图书馆,将日本内阁文库所藏包括档案资料在内的古代文献进行了大规模的数字化并陆续上传,又如美国哈佛大学图书馆亦将馆藏文献资料扫描上传,二者成为海外目前最为重要的数字化文献资料源。而国内,国家图书馆目前也在尝试将馆藏古代文献陆续扫描上传,一些地方研究机构如宁波天一阁博物馆也陆续上传了一些文献资料。扬州地方相关部门,应该借鉴这一做法,将出版机构从第一历史档案馆复制的底本资料进行扫描数字化工作。

与此同时,出版机构应该将出版时所拟各件档案题名建成数据库。数据库应该有两大浏览方式,一是分类浏览,一是检索浏览。所谓分类浏览,即以奏折年代、人物、内容、批复等等事项划分。所谓年代,因为所收档案奏折基本上都有较为具体的时间标注,那么可以比较精细的进行排列,特别是康熙、乾隆等跨越时间较长的朝代,可以以年来划分,这样只要读者点击某一年,那么这一年所有的档案题名就一目了然的呈现出来了,不仅如此,从大数据分析的角度,也可据此数据绘制成表,可以借助奏折折件数量的时代分布情况,如清代扬州地区的政务事宜有一个动态的宏观把握。所谓人物,历史是由人构成的,研究历史,就是研究人的历史,所以档案奏折涉及到的人物,应该给予最充分的重视,一方面是奏折的呈递责任人,主要由清代扬州地方官员或是驻扬机构的相关负责人构成,如康熙时代的江宁织造通政使司通政使曹寅,乾隆时代的两淮盐政高恒等等,另一方面是档案题名中所包含的提及的人物,将与二者有关的档案资料单列出来,不仅有利于对相关历史人物的个案研究,也能加深相关历史人物与扬州地方历史的关系研究。内容方面,自然不必说,传统分法主要是政治、经济、文化、交通、法制等等,这本无可厚非,但具体到扬州地方档案资料,不免有泛泛而谈之嫌,而且近六千件的档案文件如此划分,实际上也没有太大意义。所以在相关大类的基础上,应该再加以细分,特别是与扬州地方历史关系密切者,如政治方面,应将皇帝南巡作为专题单列出来;经济方面,应将盐务管理单列出来;文化方面,应将扬州地区的刻书印书业单列出来;交通方面,应将运河管理单列出来;法制方面,应将曹寅案件单列出来。依此类推,各大方面都应选择一些有代表性的问题单列出来,这样对从事相关专题问题研究的专家学者不啻于绝大帮助。特别需要一提的是,以往对于奏折档案,最重视的是奏折内容,而对皇帝的批复则较为忽略,这本来也实属正常,因为皇帝往往不做具体回复,仅红笔御批“知道了”,有时还没有批语,但是,也有相当一部分奏折后,皇帝会书写一些内容,这些内容在当时具有类似最高指示的法律意义,在今天则是研究最高统治者执政理念和心境好恶的绝佳材料,将有具体批复内容的档案奏折单列出来,自然具有重要的研究价值。

除了分类浏览,必不可少的是检索浏览。所谓检索浏览,就是使用者键入如何文字,都可以在档案题名的全文中进行搜索,并显示相关检索结果。最理想的检索,是全文检索,如大型本地检索软件,文渊阁四库全书全文检索单机版,就是在OCR文字识别处理海量文渊阁《四库全书》文字的基础上,制作成的全文数据库。如果未来有可能,把《清宫扬州御档》所有文件进行文字识别,并制作成全文数据库,那么其所蕴藏的价值,就能得以最为充分的挖掘和展示。然而,在目前的条件下,只能对档案题名进行单字和组合文字的检索。这一检索,同样具有重要的学术价值,因为读者通过题名文字检索,可以大体上寻找出感兴趣的档案题名,这也是重要的信息资源。

无论是分类浏览还是检索浏览,都只(下转第57页)(上接第72页)能看到档案题名,要想充分利用这批宝贵的奏折档案,相关部门必须投入相应的人力物力,制作一个扬州地方档案资源的数字化网站。这一网站应该具备这样的工作能力,即浏览者可以在主页上通过分类浏览和检索浏览,寻找自己感兴趣的相关档案题名,再找到相关档案之后,点击档案题名可以弹出,或是进入另一个浏览页面,服务器后台自动加载相关档案的数字图像,为了充分保障档案资源的利用效果,可以提供两种浏览模式,即普通浏览和高分辨率大图浏览,这一点可以借鉴国际敦煌数字化项目的做法。國际敦煌数字化项目,是中英法等敦煌残卷主要收藏国家和地区联合发起的一项国际合作计划,即将各地区馆藏敦煌残卷进行数字化,并将相关图像文件上传至统一服务器,浏览者只要输入敦煌残卷的国际通行编号,就可以随时调取相关残卷的图像资料,并且可以以快速浏览和大图浏览两种方式加载。清代扬州奏折档案数字化项目,完全可以借助这一模式,这样普通读者,不需要花费高昂的购书费用,就可以方便浏览扬州地方档案,这不是建设推广地方文化最好的方式和途径吗。不仅是《清宫扬州御档》的图像资料可以上传,供人随意浏览,扬州古代其他档案资源,近现代档案资源,只要符合相关档案法律法规,都可以准此上传。于此同时,还可以在该网站的相关区域开辟讨论板块,或是在相关档案文件的浏览页面下提供留言评论区域,这样对相关档案有所研究的浏览者就可以发表自己的阅读心得和体会,这也是数字化资源开发和利用的重要方面。

除了相关数字化网站的建设,考虑到现代移动终端设备的普及,还应该考虑开发在ISO和安卓系统下运行的扬州档案APP软件,更进一步还应拓展至微信公众号,这样普通民众也可以通过手机、平板等设备来访问,自然更加快捷方便。

【参考文献】

[1]扬州市档案馆中国第一历史档案馆等.清宫扬州御档[M].广陵书社,2010年版.

[2]吴建华.科技档案管理学[M].南京大学出版社,2002.

[3]冯慧玲.档案学概论[M].中国人民大学出版社,2006.

[4]沈固朝.信息检索[M].高等教育出版社,2015.endprint

猜你喜欢
档案数字化
档案数字化管理建设中存在的问题及对策
开展档案数字化建设的实践与思考