王成琴
一、导航式档案网上检索系统的基本内涵
当你因爱好、研究或其他应用需要查找某方面或某一类的档案信息时,但你却不知道这些档案的馆藏情况和馆藏地方,你可能就希望如果有一个像百度、谷歌那样的网站就好了。只要输入关键词,便可查询相关的信息。但是目前,虽然各地档案工作者已经做出了很大的努力,如很多档案馆建立了网上查询系统,公布了馆藏目录,发布了档案编研成果等,但是这些都是“单兵作战”,档案馆“各自为政”,功能比较少,水平比较低,还无法满足用户的上述要求。因此笔者建议建立一个导航式档案网上检索系统。
导航式档案网上检索系统就是一个基于广域网能够整合各个档案馆的资源,提供档案信息检索的服务系统。这一系统可以为各类档案利用者提供跨地域、跨行业、跨部门的档案信息,提供所需档案的数量、所在的地方、利用的方法、条件和联系方法以及其他档案等相关信息,发挥档案利用的索引导航作用,从而向多层次、广地域的公众档案利用者提供指引,让档案信息更加贴近普通公民,贴近需求者,实现档案信息资源的社会化。
导航式档案网上检索系统应该具备这样的功能:一要有一个关于档案信息的统一的网络检索界面,能让利用者方便的识别和利用这个系统;二要有一个强大的跨地区、跨部门、跨行业的档案信息资源数据库,保证能给公众提供大量的查询信息;三要能按一定标准提供检索结果,为利用者进一步利用提供指引。比方说某一利用者因研究徐悲鸿的需要,需查找有关徐悲鸿的档案资料,但又不知道该类档案资料在什么地方、在哪个档案馆有,如何去查询等。这时便可以利用这样的检索系统,通过输入“徐悲鸿”这一检索词,通过一个检索页面提供数据库中所有关于徐悲鸿的档案信息(包括收藏者链接和联系、查阅方法等),为进一步利用起到导航作用。
二、建立导航式档案网上检索系统是提升档案利用水平的必然
1、档案利用工作重点转变的需要。由国家档案局、中央档案馆于1997年2月颁发的《关于在全国档案系统加强社会主义精神文明的意见》要求各级档案馆充分发挥五个功能,即档案保管基地功能、档案利用中心功能、爱国主义教育基地功能、学术研究场所功能、文明服务窗口功能。然而这些功能的发挥都要通过档案的有效利用来实现,而先进的检索手段又是有效利用的必备条件。随着档案馆功能的拓展,档案利用群体也不再是以政府机关干部和学者为主体,作家、研究人员、创作编导、编史修志、政策制定甚至休闲欣赏等任何一个普通公众都有利用档案的可能性。这种利用者的“随意性”要求档案馆提供一种“通俗”、易操作的“傻瓜”式检索系统。
2、档案信息网络管理发展的需要。目前各档案部门为实现档案资源共享,正加大力度进行档案资源整合,加强数字化建设。全国大多数档案馆都建立了档案网站,提供了数量巨大的信息资源。要想利用这些资源,按目前状况需要到各个档案网站上去检索查询,这对于普通公众来说,存在两个问题。一是专业性的检索系统和各档案网站检索方式的多样性影响着档案信息的查准率和查询速度。二是档案信息“各自为政”存储在各个档案网站上,不能互相链接。作为完善的检索系统应该使公众尽可能直观、方便、准确的检索。因此信息网络管理工作不仅需要数字化的“虚拟档案馆”的内容,还需要以最简单的检索方式打开这所大门的钥匙,满足多样的检索利用需求。
3、档案利用范围扩大的需要。早在2002年9月召开的第十四届国际档案大会第三次全体报告会的议题是“档案馆在休闲利用社会中的作用”。英国著名档案学家迈克尔·库克指出整个社会应该把档案馆看作是一个文化机构,即使是贴上“文化娱乐”甚至“消遣”的标签也是无可厚非的。也就是说除公务需要外,档案开始和普通公民的生活兴趣、爱好、鉴赏等休闲活动联系到一起,人们有意无意地利用档案的随意性要求有一种宽范围的查询检索系统,能满足公众用户准确、快捷、方便地检索,找到所需的档案信息。
4、国内外档案网站已经出现了这样的雏形。笔者打开美国国家档案馆网页,发现不仅信息资源丰富,而且还拥有全国各种档案馆馆藏信息的联网数据库,实现全国档案信息资源集成化查询检索和利用,并通过目录式方法将有关档案部门链接起来。国内已经有部分网站或多或少地实现了或正在准备实现这样的一些功能。国内有一法律界人士建立的网站,与全国283个地市的律师合作,建立一个专业档案查询网,可以查询企业工商证照、房产、车辆设备资产及人员等方面的信息。浙江档案网在检索系统中提供国内外可检索的相关资源的链接,四川档案网则准备提供全省部分市、州的馆藏目录查询。这些网站提供这方面的服务已经体现了网上检索的方向,但基本还是区域性的、不完整的和初始的,实现真正的导航指引功能还有很长的路要走。
三、导航式档案网上检索系统建立的方法与要求
建立导航式档案网上检索系统需要对各档案馆的档案信息进行全面搜集、合理组织和有效利用。搜集各地档案馆的档案信息,整合成一个统一的检索资源数据库是一个关键环节和艰巨任务。那么,采取什么方法获取分散而又数量巨大的档案信息?这里可以借鉴和引进搜索引擎技术。
目前,搜索引擎基本分为两类:全文搜索和分类目录。全文搜索是利用“网络蜘蛛”软件,通过网络上的各种链接自动获取大量网页信息内容,并按规则分析整理形成数据库。分类目录是通过人工的方式收集整理资料,人工编辑审核后输入数据库,也叫目录搜索引擎。全文搜索引擎是一个自动过程,提供的查询结果量大、关联度低,而且通过网上自动抓取,前提是必须有足够量的网页内容。分类目录依靠人工收集整理,能提供更为准确的查询结果,但收集的内容有限。鉴于各地档案网络建设不平衡、提供利用的网页内容少,甚至没有可供利用的网页内容等情况,全文搜索引擎技术难以发挥应有的作用。再考虑到档案利用有开放与未开放的特殊性,不可能将卷宗内容全文在网页上反映出来,只能提供档案卷宗的基本信息,再加上对网站数据库建设的时间没有硬性要求。因此,笔者认为,建立导航式档案网上检索系统采用分类目录技术比较合适,同时考虑到各地档案网络的不断发展及网页内容的不断丰富,全文搜索技术可以作为补充。
建立导航式档案网上检索系统,从理论上讲可以由国家档案管理部门承担,也可以由社会机构承担,进行网络经营(就像谷歌、雅虎一样)。但目前各地档案网络建设水平较低,内容匮乏,不可能完全像谷歌那样依靠全文搜索技术获取大量可利用的档案信息,还需要各地档案机构密切配合,提供可供利用的档案信息来共同建设档案信息资源数据库。因此,就我国集中式管理体制而言,目前由国家档案管理部门牵头建设比较合适,有利于发挥职能作用、协调上下级关系、制定标准规范、发挥系统的最大效用。在具体运作上也可以采取市场化的方法。建立一个能充分发挥作用、运行有序的导航式档案网上检索系统还要做到以下几点:
1、要建立一个档案信息供给机制。由于各地档案网站利用方面内容不多,建立资源数据库目前除部分自动获取网页内容外,主要需各地档案馆提供可供利用的档案信息。我们可以同时采取行政管理手段和技术手段,建立起正常的档案信息供给渠道。同时,各地要加强档案信息资源建设,加快馆藏档案上网步伐,将馆藏档案目录信息全部上网,扩大检索范围,为实现全文检索(档案信息网上自动采集)创造条件。
2、要制定网上档案信息标准规范。在兼顾方便检索和档案自身特点的基础上,统一档案信息的格式,包括档案题名、档案号、主题词、形成时间、馆藏单位名称及链接、联系方法及阅档条件等信息内容,建立一个科学的资源数据库。
3、要有良好的检索功能。要支持自然语言、关键词、主题词三种检索语言;支持特征字段检索(如档案题名,档案机构名,档案号等);支持分类目录结构,按照特定属性进入相关类目,可以一层一层的查找,如艺术——美术——国画——画家——徐悲鸿。方便利用者准确、便利、快捷地查找所需的档案信息。
4、提供良好的服务。检索结果显示方式要多样化,增加保存、复制、打印、下载等功能,提供网上预约调卷、查阅服务、用户提问或反馈等互动平台,给用户一个友好的界面,提高服务质量,充分发挥导航式档案网上检索系统的功能。