□姚乐野 王阿陶 蔡娜
“5·12”汶川地震文献专题数据库建设相关问题探讨*
□姚乐野 王阿陶 蔡娜
建设“5·12”汶川地震文献专题数据库旨在保存人类历史记忆、传承民族精神,供学术参考和行政决策以及为其他专题文献数据库建设提供借鉴。数据库建设平台的规划与设计围绕系统管理、数据管理、用户共享、门户基本服务、文献检索与服务展开,其中文献量的增加、文献质量控制与及时更新,以及提供利用的开放性与公益性是该数据库建设的关键与难点。项目的创新之处在于新的数据库定位思路、文件数据库及开放资料收集平台的引入以及一批标准规范的制定,而该项目的最终研究成果表现为研究报告及数据库两大部分。
地震信息 专题文献 数据库 汶川地震
* 本文系四川省哲学社会科学“十一五”规划项目【2008】“‘5·12'汶川地震文献专题数据库建设研究”课题成果之一(项目批准号:SC08B06)。
“5.12”汶川地震是新中国成立以来最大的一次地震,其影响之深远前所未有。地震发生后,国内各级政府、企事业单位、社会组织、外国政府及国际公益组织纷纷通过各种方式支持抗震救灾及灾后重建,由此产生了大量文献。但是这些文献资料的分散性、格式的多样性和存储介质的不稳定性等因素,都使得这些文献的保存岌岌可危。因此对这些文献进行收集、整理、长久保存并提供利用不仅成为灾后重建精神家园的一部分,而且从保存人类重大历史事件的角度来看,也是当务之急。鉴于此种紧急之状况,“5.12”汶川地震文献专题数据库建设研究项目因此设立。
建设“5.12”汶川地震文献专题数据库的目的在于,通过现代化技术手段实现对分散、无序的有关“5.12”汶川地震的各类文献信息资源进行系统的收集、整理、输出,建立一个集全文、书目、图像、音视频等为一体的综合专题文献数据库,为用户提供有关汶川地震这一专题的全方位的、立体式的文献资料,并通过以后与其他相关数据库的信息共建促进本地区乃至全国的地震文献信息资源共享。
基于此种建库目的,项目组对“5.12”汶川地震文献专题数据库建设的各方面需求进行了分析:
“5.12”汶川地震是建国后震级最大的一次地震,使人民的生命财产遭受到极大损失,并且这种破坏力的影响还将在未来持续很久。作为人类社会发展进程中的一次重要历史事件,今人有义务将这一段历史保存并流传下去。但在今天的网络环境下,信息资源呈爆炸性增长,且信息的分布呈分散、无序的状态,给利用造成极大困难。要想让汶川地震相关文献有效地为用户所用,必须对它们进行有效的收集、组织、整合,使这一专题文献更为集中、条理、有序,使其可获得性得以保证和提高[1],从而使用户可以方便、快捷地查询。“5.12”汶川地震文献专题文献数据库建设的开展,可以使各种类型、格式、内容的汶川地震文献被加以甄选、著录、保存入库,使汶川地震这段人类集体记忆被翔实的数据保存和记录下来,并全面、真实和完整地揭示此次地震及其对人类产生的各方面影响,这既是对历史文献的保存,又是人类历史记忆的延续。
在此次汶川地震中,中国人民表现出了团结果敢、自强不息、勇往直前、前赴后继、舍生忘死的伟大民族精神。这些民族精神是我们中华民族五千年生生不息、发展壮大的强大精神动力,也是在未来岁月里薪火相传、继往开来的强大精神动力。而这些精神力量通过有关此次地震的各种文字、图片和音视频资料等展现无疑。通过这些文献,全国各族人民不仅可以体会到中华民族在灾难面前的伟大精神,感受到民族精神对于家园重建的支持力量,年轻一辈还可以从中汲取到中华民族在灾难面前众志成城、顽强拼搏、自强不息的伟大民族精神,可以从中感悟到自己作为未来民族脊梁的责任,并且激励他们树立团结、奉献、爱国、自强的民族气节。因此,“5.12”汶川地震文献专题文献数据库的建成对民族精神的传承和传播也有着非常积极的促进作用,同时又对年轻一代起到了爱国主义教育的作用。
“5.12”汶川地震文献专题文献数据库将全面收录关于此次地震的文件、图书、期刊、报纸和学位论文等各类文献,而且本数据库定位于及时更新、持续生长,一旦新的政府决策及研究成果出现就会在第一时间被收罗入库。因此,该数据库保存文献的权威性和价值毋容置疑,这些文献不但能反映国家对于地震灾区的政策趋向,反映学术研究等方面的动态和水平,还可以普及防震知识,适应不同科研机构对于文献在针对性、适用性上的需求,对于支持灾区重建并尽快恢复生产,为政府部门抗震救灾的决策提供信息支持,为地震监测、预防和科学研究机构提供最新的研究成果等各方面也都具有十分重要的意义。
“5.12”汶川地震文献专题数据库建设项目围绕数据库建设的总体需求特别制定了九个子数据库建设标准规范——《文件数据库建设标准规范》、《网络文献数据库建设标准规范》、《报纸文章数据库建设标准规范》、《期刊论文数据库建设标准规范》、《图书数据库建设标准规范》、《学位论文数据库建设标准规范》、《图片数据库建设标准规范》、《音视频数据库建设标准规范》、《导航数据库建设标准规范》。这些标准规范站在图书馆普通用户,更多的是社会用户的角度对著录对象进行选择,以用户方便快捷的利用文献为目标确定著录项目,并在此基础上规定了元数据元素描述方法和著录细则。这些标准规范既具有理论上的科学性、规范性,又具有实际操作的合理性、可行性,值得其他专题文献数据库参考借鉴。
“5.12”地震文献专题数据库平台规划与设计是指为完成系统目标而对系统功能做出规划和定义,并通过软件开发和集成的方式形成统一的系统平台。
“5.12”地震文献专题数据库平台的功能模块包括:系统管理、数据管理、用户共享、文献检索与服务、门户基本服务。“5.12”地震文献专题数据库建设平台的功能模块结构如图1所示:
图1 功能模块结构图
系统管理功能模块为“5.12”地震文献专题数据库系统管理人员提供系统管理设置功能,是其他模块正常运行的基本保障。该模块由用户管理、日志和统计模块、系统数据维护组成。
数据管理模块是提供“5.12”地震文献专题数据库数据的采集加工、著录入库、质量检查等业务流程的网络操作平台,是内容管理的重要模块。该模块由数据录入、数据审核、数据导入、数字对象数据加工、数据发布、数据操作日志、数据备份组成。
“5.12”地震文献专题数据库平台为用户提供了开放式内容建设平台,接收任何读者符合法律规范的和“5.12”地震相关,满足系统数据质量检查基本要求的文献。用户共享模块由共享数据接收、共享数据审核、共享数据入档组成。
患者主要在床上完成康复治疗,需要轻度活动、定时变换体位并且合理摆放肢体,这样可以让肢体处于功能位置,避免出现关节变形或者挛缩的问题,进而保证患肢的正常血液循环,奠定下一步康复治疗的基础。
“5.12”地震文献专题数据库平台门户的基本服务是对各类用户提供认证管理及服务功能。门户基本服务主要包括项目相关信息发布、项目社区服务、访问认证、网站导航。
文献检索与服务是“5.12”汶川地震文献专题数据库平台提供给用户的核心功能,用户需要通过文献检索与服务方便快捷准确地获取所需的“5.12”地震文献。文献检索与服务由文献浏览、文献导航、文献检索与文献整合服务四部分组成。
“5.12”汶川地震文献专题数据库建设中的关键问题在于文献量的增加、文献质量控制与及时更新。
由于时间、人员等方面的限制,目前本数据库收录的文献数量还较少,但项目组成员的增加及稳定性的保障可以使该数据库文献保持持续性增长的态势。另外,有关汶川地震的新文献也在不断产生,这也决定了本数据库的建设也是一项集长期性、持续性为一体的工作。此外,作为民间文献资料收集渠道的开放资料收集平台也是增加文献量的一个重要途径。该如何扩大宣传,吸引更多的民众将自己收集的有关汶川地震的文献资料上传到平台不仅是广泛收集文献的重要推动力,更是提高数据库的影响力、影响范围,实现其社会效益的确实举措。为此,项目组决定积极借助新闻媒体的力量开展各种形式的宣传、推广活动,实现文献收集与社会效益的双赢。
在文献量稳步增长的情况下,对文献质量进行控制是数据库整体质量得以保证的关键。因此,项目组在原有著录人员数量不变的基础上,增加若干硕士以上学历的具有一定标引实践经验的数据质量控制人员,首先以文献的全面性、准确性、实用性和针对性为原则[2],对文献的收集渠道、著录对象界定等源头方面进行把关,对文献的质量进行首次控制;其次对著录方法进行严格限制,对文献标引的词表选用、标引范围、标引类型、标引深度等都进行了明确规定,努力使各著录项目达到科学、准确;最后对已著录完成的文献进行抽查。三个环节的严格把关和控制极大地提高了数据库的文献质量,保证了文献的科学性、权威性。
由于有关汶川地震的文献在不断产生,因此文献的及时更新成了衡量数据库整体效能的标准之一。在对已有文献进行高效收集、著录的同时对新产生的文献进行及时的采集和挖掘,是实现数据库文献及时更新的保证。项目组最初采用人力采集网络文献的方法已显露出其速度慢、准确性低以及无法避免重复采集的弊端,因此项目组及时调整网络文献的收集方法,转而利用新的技术手段——RSS、WEB信息挖掘等方法解决了网络文献及时更新的问题。
“5.12”汶川地震文献专题数据库在建设之初就以开放性、公益性为其未来的发展方向。开放性是指该数据库系统正式投入使用后将采取向社会全面开放、不设置任何权限地提供文献资料,并且通过开放资料收集平台,任何人都可以将其符合要求的文献资料上传到数据库内,并以同样的方式为社会所用。公益性是指任何人利用数据库中的文献都不收取任何费用,数据库提供的所有服务也都是免费的。但提供利用的开放性面临的窘境是如何避免版权纠纷,公益性的困境是如何在公益性的前提下保证数据库的正常运行,毕竟该数据库的持续发展需要大量人力、物力、财力的投入。而这也是本数据库建设项目组下一阶段需进行深入研究、解决的问题。
“5.12”汶川地震文献专题数据库较之于一般的专题文献数据库,其主要的创新之处有如下方面:
一般高校图书馆的专题文献数据库大都服务于本校的教学、科研,因此其服务对象也以本校教师、学生为主,因此,在收集文献的种类方面具有一定的标准,以学术论文为主,辅以其他的科研成果[3]。而“5.12”汶川地震文献专题数据库突破了仅仅为一定范围内用户服务的局限,以保存人类集体记忆,传承民族精神为目标,将所有民众作为自己的用户。因此,该数据库在收集文献的种类方面,不再局限于科研成果,而是将所有有关此次地震的各类文献都纳入到收集范围,涉及文件、图书、报纸、期刊、学位论文、图片、音视频、网络文献、网站,涵盖了有关此次地震的所有文献种类。从某种意义上说,该数据库的建成为专题文献数据库的建设打开了一条新的思路,提供了一种视野更为宽广、服务对象更为庞大、记录更为全面的重大历史事件的记录、保存方法。
基于不同于一般专题文献数据库的定位,“5.12”汶川地震文献专题数据库中引入了文件数据库,这在国内尚属首次。而围绕专题文献数据库建设对文件数据库制定的《文件数据库建设标准规范》也是前所未有的。目前国内文件著录元数据是从电子文件管理人员的角度出发,以电子文件的产生、流转、保存为设计目标,以实现不同机构、不同系统之间文件及信息的互操作,为电子文件在不同时间、不同空间、不同应用软件中的再利用提供统一的元数据。而《文件数据库建设标准规范》是从普通民众的视角出发,以文件的信息内容提供为设计目标,因此,在著录对象的界定、著录项、著录对象元数据元素描述方法和著录细则等方面都与现有电子文件元数据标准规范有很大不同,例如,著录项主要围绕文件的快速检索、方便利用,而减少了对文件原始性方面的要求。因此,该文件数据库及其标准规范可以说是专题文献数据库建设中的一个创新,也可为其他同类型的专题文献数据库中文件数据库的建设提供参考借鉴。
形成的10余万字的《“5.12”汶川地震文献专题数据库建设研究报告》包括了《文件数据库建设标准规范》、《网络文献数据库建设标准规范》、《报纸文章数据库建设标准规范》、《期刊论文数据库建设标准规范》、《图书数据库建设标准规范》、《学位论文数据库建设标准规范》、《图片数据库建设标准规范》、《音视频数据库建设标准规范》、《导航数据库建设标准规范》共9个子数据库的标准规范。这些标准规范是基于对“5.12”汶川地震文献的特点、基于本数据库建设目标而制定的,具有极强的针对性和应用性。另外,这九个标准规范涉及文件、网络文献、报纸文章、期刊论文、图书、学位论文、图片、音视频、网站共9种文献类型,是对这9种文献的著录项、元数据元素及著录细则等方面进行深入研究的基础上做出的,既具有理论上的科学性、规范性,又具有实际操作的合理性、可行性,本身就具有一定的学术研究价值,不仅能补充和完善目前国内专题文献数据库标准化建设中多种类型文献数据库标准规范的缺失,还可供同类数据库的建设者参考、借鉴,可以说,这些标准规范是融学术价值和应用价值为一体的。
将开放资料收集平台引入图书馆专题文献数据库尚属首次。目前开放资料收集平台作为文献资料的收集方式之一,多在网站论坛出现,而将其引入“5.12”汶川地震文献专题数据库建设中,作为一种民间文献资料收集的有效方式可以使那些保存于个人手中的珍贵文献有了提交集中保存的途径,而各种载体、类型的文献经过收集、加工、整合后进入数据库,不仅其可获得性得以提高,而且也能进一步补充和完善数据库文献。另外,开放资料收集平台的开放性、互动性在一定程度上提高了人们对于汶川地震文献的关注度,是整个数据库建设中的亮点之一。
“5.12”汶川地震文献专题文献数据库建设研究项目的最终成果由两大部分组成:
首先对汶川地震文献的来源、类型、格式、主题等各方面进行充分调研,在此基础上确定将9个子数据库和一个开放资料收集平台作为该专题数据库建设的主要内容,并对数据库建设的可行性等进行论证,以确保项目的顺利进行;在确定了数据库的组织框架后,项目组共同制定了9个子数据库建设的标准规范,以确保所有类型的有价值的文献均能科学、规范地收罗入库。另外,为保证数据交互能力合乎相关技术规范要求,保障系统的稳定性、兼容性和持续维护能力,最终确定采用微软公司WEB开发工具软件组合WINDOWS 2003+SQL Server+Asp.net 2.0,以此为基础,对系统平台进行规划与设计,制定了平台功能模块结构图,对系统管理、数据管理、用户共享、文献检索与服务、门户基本服务5个模块的具体功能进行了划分与明确,为数据库建成后的开放、利用指明了方向。在权衡了资源、成本、管理三方面的因素后,项目组提出通过技术、标准、管理、安全4个总体策略以解决数据库文献的长期保存问题。最终,项目组将各方面的研究结果汇总为十余万字的《“5.12”汶川地震文献专题数据库建设研究报告》。
基于“5.12”汶川地震文献专题数据库建设的研究成果,围绕9个数据库建设标准规范中的各项规定,构建“5.12”汶川地震文献专题数据库系统平台是本项目的另一成果。通过对WEB服务器平台建设、SAN存储环境平台建设,“5.12”汶川地震文献采集加工平台、“5.12”汶川地震文献著录平台、“5.12”汶川地震文献发布平台的研发与集成,该数据库系统平台构建完成。在经过数次试运行、试著录的检测最终确定了的著录平台上,一批由硕士、博士组成的著录人员对分散保存在各类组织、个人、网络中的有关“5.12”汶川地震的具有代表性的、对国家和社会具有长久保存价值的文献资料进行收集、整理和著录标引。
“5.12”汶川地震文献专题数据库系统平台的构建为有关“5.12”汶川地震的具有典型性、代表性的各类文献提供了长期保存的平台,同时在针对重大历史事件建设专题数据库方面做出了重要的实践。
已建成的“5.12”汶川地震文献专题数据库是目前国内收集汶川地震文献种类最多、范围最广、数据量最大的数据库。该数据库收录了文件、网络文献、报纸、期刊、图书、学位论文、图片、音视频、网站共 9类文献。9个子库收录的文献内容涵盖了地震实况、抗震救灾、灾后重建、捐赠援助等各个方面。可以说,所提供的汶川地震文献的类型之多、内容之全面是前所未有的。到目前为止,该数据库共著录数据2万余条,其中全文文献占 30%。由于国内相关文献不断产生,因此数据库中的数据也将随之继续增加,从而形成一个动态的、可持续生长的有关汶川地震文献的大本营,并成为永久保存汶川地震这一重大历史事件记忆和向所有用户开放的公益性门户网站。
1 张久珍.论图书馆信息资源整合机制的建立.图书馆杂志,2005(1):10-14
2 金甦文,许征尼等.岩土工程专题数据库的规划与建设.图书馆工作与研究,2007(5):66-67
3 黄桂凤.高校图书馆特色数据库建设的若干对策.图书馆杂志,2005(12):45-47
Discussion on the Construction of“5.12” Wenchuan Earthquake Database
Yao Leye Wang Atao Cai Na
The purposes of the“5.12” Wenchuan earthquake database project are preserving the history,inheriting the national spirit,as so as providing reference to academic study and administrative decision.The construction of the database tackles with the system management,data management,user sharing,basic service of portal and literature retrieval.The major issues in the database construction include data collecting and quality control,real time update,and assurance of the openness and nonprofit.Innovations of this project lies in its new design of the database,implementation of the file database and open platform,and the adoption of a group of standard specifications.
Earthquake Information;Thematic Document;Database;Wenchuan Earthquake
姚乐野,四川大学公共管理学院;王阿陶,四川大学历史文化学院;蔡娜,四川大学图书馆;成都,610064
2009年6月18日