孙 瑾
(山东大学图书馆,山东 济南 250100)
高校图书馆特色数据库的建设,国内一般定义为高校依托馆藏信息资源,针对高校教育教学、科学研究的文献需求,对某些专业或某些领域有利用价值的信息进行收集、分析、评价、分类、整理与存储,并按照一定的标准和规范使之数字化,以满足用户个性化需求的过程[1]。我国高校图书馆特色数据库的建设起步于20世纪90年代中期,经过文献考证,最早关于特色数据库的研究成果发表于1996年6月,是广州图书馆的陈卓然在《图书馆论坛》中发表的文章《建设特色数据库 开发音像资料》[2]。特色数据库的建设如果从第一篇文献1996年算起,到2020年经过了二十四年,研究论文成果数量在一定程度上反映该领域的研究角度和热点。
图1是关于高校特色数据库十二年间(2008年-2020年)的发文趋势图,以中国知网数据库作为研究范围,2008年至2020年作为时间范围。以“特色数据库”作为主题词进行检索,通过检索数据库发现与特色数据库相关的内容一共发表文章2136篇。其中2009年到2014年每年发表文章数量均在200篇以上,六年时间特色数据库是研究热点,论文数量集中达到了研究的顶峰。2015年到2020年,文章数量低于200篇,呈现逐年下降的趋势。图1是对近十二年发文简单趋势图。
图1 2008年-2020年文章发表趋势图(引用CNKI网站)
纵观这十二年的研究成果,在研究内容上,研究热点时期(2000年到2014年),文章内容广泛,主要涉及如下几个方面:特色数据库的建设如:连环画数据库[3]、美术院校数据库[4],会计专业数据库[5]等;数据库内容总结和分析如:裴丽发表的《特色数据库建设的实践与启示》[6];特色数据库现状调查分析如:李辉发表的《地方高校图书馆特色数据库建设现状调查分析》[7];特色数据库体系构建,如:王智刚发表的《地方文化特色数据库语义检索模型构建》[8]等。
2014年至2020年,在相关研究成果的分析上,出现了一个明显的现象:即特色数据库研究的理论回归。尽管发文数量有明显减少,但是文章层次更深,分析角度更加多样化。更多偏向于理论思考,更多体现在数据库建设的综述类、反思以及发展策略。这说明特色数据库经过前期的建设后已经进入理论探讨时期,对下一步的建设工作需要进行深入研究,提出相应的对策和方法。笔者以近七年特色数据库的文章进行整理归纳,一些客观存在的问题集中出现在特色数据库建设过程中。
现阶段,特色数据库的建设已经进入平稳时期、思考与建设共同发展的阶段。笔者通过全国高校建设范围到局部地区的建设,进行数据分析。根据网络调研目前39所985高校中,特藏资源共建设了164个数据库,内容主要涉及博硕士论文库和专题库。
表1 各地区数据库建设一览表
除了上表中的部分985高校,笔者还详细调研了山东省内17所高校图书馆特色数据库的建设情况。
表2 山东省高校特色数据库建设一览表
山东农业大学 1 山东理工大学 主页无法打开 鲁东大学 6青岛大学 0 曲阜师范大学 0
山东省特色数据库数量较多是中国海洋大学。中国海洋大学由于专业的特殊性,围绕学校的重点学科,共建设和海洋相关的数据库7个,海洋文献、海洋文库、数字海洋博物馆等都具有鲜明的学科特色。
山东省的这17所高校图书馆共建设数据库40个,主题内容与表1的主题基本一致。通过对比表1和表2,在建设数量上,山东省内高校图书馆建设数据库的数量与全国985高校图书馆相比,存在一定差距。在建设主题上,笔者通过整理数据发现,大部分内容集中在本校的博硕士论文库和随书光盘数据库。有鲜明特色的数据库较少。同时数据库内容更新迟缓,有的数据库甚至从建成以后一直没有更新数据。
笔者以2014年至2020年期间关于特色数据库的文章作为研究范围,在中国知网中进行检索,当研究条件不限制来源期刊时,七年间年共发表文章1182篇,将期刊范围限制到核心期刊和CSSCI后,文章数量为139篇,将这139篇文章经过内容筛选,有96篇文章是与特色数据库密切相关。笔者选取核心期刊文章作为研究样本,经过分析这些文献可以看出,特色数据库在建设过程中,有如下一些共性的问题需要集思广益进行反思和总结。
高校图书馆对于特藏选题的理解和定位不同,决定了后期数据库的可持续发展性。经过文献调研,在96篇文献中共有38篇提到了特藏选题是目前存在的问题之一,占比38.3%,可见这是当前特色数据库的共性问题。
有的高校图书馆是在本馆馆藏信息资源基础上,进行加工整理建设数据库。最为典型同质化数据库就是随书光盘数据库和学位论文数据库。从宏观的角度上看,各个高校的学位论文数据库实质上性质相同,没有明显的特色性、唯一性,当商业数据库公司将各个高校的学位论文整合在同一个检索平台,特色性质已经泯然丧失。与各个高校单独建设数据库投入的成本与回报相比,不如直接购买商业数据库的性价比更高。这两种特色数据库的主题已经成为我国高校图书馆的一个鲜明特点。早期以其作为宣传和推广,现阶段学位论文数据库和随书光盘数据库已经逐渐淡出了特色数据库的行列。
有的高校图书馆在选择主题时,意识到了同质化问题,为了突出特藏,将本校的重点学科纳入其中,建设的数据内容与本校的重点学科进行联系。这种数据库目前大多只提供传统的目录篇次,能够提供全文检索的很少,在内容上无法做全面揭示,无法提供深层次的研究需要。
综上可见,主题重复性、重点不突出、无法深入建设是目前特色数据库选题中突出问题。定位清晰,选题严谨,紧扣地域及学校特色应该是今后特色数据库选题遵循的原则。
数据库内容包括数据库数据数量、数据类型和数据质量。数据库的内容直接涉及数据库的可用性。由于特色数据库受到建设成本的限制,检索功能和系统管理功能都无法持续地与商业数据库相媲美,只能在资金充裕的基础上,紧跟商业数据库的步伐,个性化的设置和功能,始终是无法超过商业数据库。目前的特色数据库通常只具有简单的检索功能。高级检索、分面检索、全文检索以及检索结果的筛选功能、检索结果的导出功能在一般特色数据库的建设中都无法全部实现,这些却恰恰是用户深入挖掘数据库最迫切需要的功能。其他的用户权限管理、特色数据统计分析功能、用户行为分析功能以及统一接口认证登录功能等也都需要高校图书馆提出用户需求后再进行定制开发。高级的检索功能和完备的系统管理功能的缺失,为特色数据库进一步深入挖掘数据、分析数据设置了障碍。而通常的商业数据库明显在这些细节功能上优于特色数据库。
资金保障的缺乏。目前很多高校图书馆特色数据库是以科研课题或者项目申报的形式建设,数据库建设经费一次性投入,随着科研项目的结题,缺乏持续性资金支持。硬件方面,数据库服务器缺少更新换代的经费来源。软件方面,数据库系统平台无法进行系统升级维护;数据库的数据失去了持续更新的软件基础和硬件基础。
专业人员保障的缺失。数据库的建设对图书馆工作人员提出了更高的专业素质要求,既要求有专业学科背景进行数据库数据的管理,又需要有熟悉计算机专业的技术人员进行系统管理。馆员的这些整体专业素质,制约了特色数据库的筛选、数据的深层次加工和系统的管理。数据直接影响到特藏数据库的数据质量和数据库质量。目前大部分高校图书馆馆员的计算机水平和专业学科水平,都有待于进一步提高。笔者在调研的特色数据库中,涉及到数据库建设缺少人力物力和财力的内容共有27篇文献提及并讨论,占比31.8%。显然这也是特色数据库一个共性存在的问题。
在数据库建设初期及建设过程中,经费、人员组织、设备配置等方面都得到大力支持和可靠的保证。但建成投入使用后,忽视了数据库后期的大量工作,对数据库中存在的数据问题,系统平台问题等都无法得到及时解决,更新工作严重滞后。在前述笔者抽查的39所985高校图书馆的165个特色数据库以及山东省17所高校图书馆的数据库时,近一半数据库信息超过一年以上的时间没有更新,有些数据库从建设初期数据就没有更新,更有极个别数据库甚至无法打开,严重影响了读者的使用。只有不断进行日常更新,才能保证数据库数据内容和系统平台的实时性和准确性,才能提高其利用率,延长生命周期,最大限度地发挥学术价值和社会价值。但是在实际投入使用后,由于对后期的这些工作内容没有进行正确的评估,造成大部分数据库只有一次性投入,没有后期的管理。在调研文献中,涉及到数据库维护更新的内容共有文献24篇,占比28.2%。数据库持续更新的动力和保证是特色数据库建设中不容忽视的问题。
通过网上调研的39所985高校图书馆的164个特色数据库访问方式可以看到,大多数数据库设置了Ip限制,一般仅限于本校的校园网Ip范围内才可以访问使用,有的数据库首页面都无法打开,有的数据库虽然可以进行查询和检索,但是需要获取更多全文信息时,又被进行了限制。可以打开首页面的数据库仅占有40%的比例。这种访问方式初衷是为了数据版权的保护,但是却限制了数据库的服务范围,降低了数据库的服务性和社会性。数据库数据版权的制约与数据库全面开放使用之间的矛盾,相互制约,限制了数据库的进一步利用。
在调研文献中,涉及到数据库版权的文献共有文献19篇,占比22.4%,这也说明特色数据库版权是数据库建设必须面临的问题。
建设数据库需要投入大量的人力、物力和财力。这并不是每所高校都能做到的。通过上述的调研数据可以看出,经费和人员充裕的高校,数据库建设的质量和数量都明显高于普通高校。各自为政,自建自用的建库和使用模式是目前特色数据库的主要趋势。这种自建自用模式限制了数据库的充分利用,造成投入成本高,利用率低。高校图书馆应该牵头管理、联合建设,实现数据的共建共享,发挥数据库的最大使用价值,这将是今后数据库建设的重要工作内容。在调研文献中,涉及到特色数据库用率低,共建共享机制不健全的文献共有文献23篇,占比27%。国内共建共享做得比较好的项目有CADAL(大学数字图书馆国际合作计划)。其中共建单位121所,共享单位673所。共享单位大于共建单位,体现了资源共享的目的。
潘煦在2017年的文章《高校图书馆特色数据库服务方式探索》[9]中提到要想提高本馆特色数据库的服务水平,最大限度满足用户个性化需求,必须打破条块分割的界限,积极参与不同地域、不同系统图书馆合作,签署一定协议,规定各馆之间的权利和义务,共享部分特色资源。
高校图书馆拥有独特的数据优势,进行特色文化资源建设具有得天独厚的条件。但是通过网站调研发现,特藏资源的宣传并没有在网站的醒目位置,大多数高校图书馆网站虽然设置了“特色资源”或者“特色馆藏”栏目,但只是简单地说明。如何利用,特藏资源的重要性以及特殊价值并没有突出说明,显然这种宣传与推广的意识和力度都不够。在调研文献中,涉及到特色数据库宣传推广欠缺的文献共有文献24篇,占比28.2%。
上述通过七个方面对特色数据库建设面临的问题进行了详细分析。为了更加清楚直观地了解目前数据库存在的问题,通过图2进行比较分析。
图2 存在问题比例分析图
国家教育部颁布的《普通高等学校图书馆评估指标》中,一级指标中的B类文献资源建设中的二级指标B25,专门提到了数据库建设,其中就包括自建数据的基本情况。数据库建设已经作为高等学校图书馆一项重要评估指标。随着网络信息技术的不断发展,高校图书馆经过二十多年的数字化建设,已经建设出了各种类型、各种主题的数据库。针对特藏资源的建设,选定主题,全局规划,重视数据库的建设和后期的规范化管理,重视知识产权问题的解决,汲取之前建设数据库的各种经验教训,随着不断实践和理论研究的深入,特色数据库必将会得到更全面的发展,展现出更好的应用价值。