王雄青
(中共江西省委党校图书馆,江西 南昌 330003)
所谓特色数据库,是指图书馆依托馆藏文献资源特色,对某一具体学科或专题的文献资源进行集中收集、数字化加工,并按照严格的操作规范和技术标准进行标引、著录和发布,以满足特定用户群体的信息资源需求。笔者所在的中共江西省委党校图书馆2012年参加了中央党校“三大文库”子项目建设,建立了“井冈山革命根据地·中央苏区数据库”。笔者尝试在网络及文献调研的基础上,总结建库实践,从特色数据库的生命周期角度,对其可持续发展问题做深入思考。
“三大文库”建设是中央党校校委于2010年作出的重大工作部署,重点建设“中国共产党历史文库”、“马克思主义理论文库”“中国国情与地方志文库”,旨在面向全党尤其是各级领导干部,打造一个供党员干部学习理论、增长知识、熟悉国情的平台。“三大文库”项目的建设对于群策群力、共建共享党校数字资源,共同推动党校信息化和图书馆事业具有重要指导意义。“井冈山革命根据地·中央苏区数据库”的建设有利于进一步推进党校图书馆信息化发展水平,加快全国党校数字资源共建共享步伐;有利于为党校教研人员围绕教学、科研开展专题研究提供专业系统的文献资源保障;有利于打造一个供广大领导干部进行党史学习和党史宣传的重要网络平台;有利于协调各方力量对纸本党史文献进行集中数字化收藏保存和共享利用。项目的具体实施由中央党校图书馆牵头,组织协调各省市地方党校图书馆共同建设。2011年11月本馆申报的“井冈山革命根据地·中央苏区数据库”建设项目,获中央党校“三大文库”子项目立项。两年来,我们对本数据库进行了系统、科学的合理规划并初步建成,现已面向党校学工人员正式开放。
“井冈山革命根据地·中央苏区数据库”建设是一项专业系统工程,在建设之初,本馆研究人员已围绕数据库建设的宏观定位、用户需求、资源组织、平台选择、人员组织、质量控制、框架构建等进行了可行性分析。
特色数据库的建设要想获得可持续的发展,建库伊始就需对数据库进行宏观定位,确定数据库的主要面向群体以及数据库收录内容的深度与宽度。综合考虑一般分为面向大众的以知识普及为主型和面向专业人员以科学研究为主型两种。“井冈山革命根据地·中央苏区数据库”定位为面向专业人员的以科学研究为主型数据库,因此数据库资源主要以历史文献和档案资料为主。但考虑到其兼备党史学习和党史宣传的作用,因此亦在其中适当加入了知识普及型的文献资源,同时考虑到符合学习宣传的特点,在文献类型上增加了图片、音频和视频,做到图文并茂、声像并茂。
在确定了特色数据库的主要面向群体后,还需进一步研究面向群体的信息需求特点,从而来进一步调整数据库资源的深度与宽度。也就是说特色数据库的建设要打破传统的以馆藏需求为导向的思路,采用以用户需求为导向的建库思路,真正实现数据库资源以用为主、以藏为辅的根本目的。“井冈山革命根据地·中央苏区数据库”面向的主要用户群体为党校学工人员,其信息需求目的明确,对信息的准确性和可靠性要求较高,网络信息获取技能整体水平较高;潜在的用户群体为党政机关领导干部,其信息需求目的不是很明确,往往只是关注与社会现实联系较为紧密的信息,网络信息获取技能水平也参差不齐,但这一群体往往都具备一定的党史基础知识,且对党史知识的重要性具有潜在意识,因此同等条件下较为容易激发其潜在信息需求,使读者了解特色数字资源,从而有效地利用特色资源。
任何一个网络平台都不可能满足所有人群的信息需求,但只要能有针对性地满足其主要及潜在用户群信息需求,其就有存在的价值及可持续发展的可能。因此,在确定了主要及潜在用户群信息需求特点后,最重要的就是如何组织好数据库中的信息资源。信息资源的组织就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的描述和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。“井冈山革命根据地·中央苏区数据库”首先是将数字化后的纸本文献按照数据库的框架结构进行主题分类,再按照《党校系统“三大文库”数字资源建设规范》进行标准化的元数据标引,最后按照数据库系统平台的操作规范要求进行内容发布。纸本文献的收集不局限于馆藏文献,且与省委党史研究室、省档案馆、省图书馆、井冈山革命博物馆及各地市党校图书馆和部分高校图书馆建立了资源共建共享机制,拓宽了资源收集渠道,保证了资源的系统性和专业性。
数据库管理系统是一种用于建立、使用和维护数据库的大型软件,它可以实现对数据库进行统一的管理和控制,以保证数据库的安全性和完整性。良好的数据库管理系统不仅可提高信息资源的组织、检索、获取效率,而且在系统的安全性及兼容性方面都有良好的保障。“井冈山革命根据地·中央苏区数据库”采用清华同方TPI数据库建设与管理系统,一方面由于TPI本身所具有的应用优势,如操作界面简洁、检索功能强大、系统性能稳定、支持多种管理模式及数据库协议等;另一方面也是为了方便未来中央党校采用TPI系统进行数据收割,从而更加有效地实现全国党校系统数字资源的共建共享。
具备一支专业结构合理的学科馆员人才队伍,是建设好特色数据库的重要保证。特色数据库的建设不仅需要懂计算机技术、信息管理知识的人员,而且还要有特色数据库主题学科的专业人员,只有这样才能使特色数据库既具备良好的系统性能和用户体验,又具备专业的学科结构体系,从而实现既好用又专业的建库目的。自“井冈山革命根据地·中央苏区数据库”项目申报成功之日起,即制定了《特色数据库项目管理实施办法》,抽调了计算机专业人员一名,信息管理专业人员一名,中共党史专业人员一名,图书馆专业人员一名,组成了“井冈山革命根据地·中央苏区数据库”建设项目组,具体负责制定和实施数据库的整体建设规划、资源收集方案、质量控制标准、内容发布方案和数据库系统的软硬件维护。
数据库的质量包含3个方面,一是数据库中数据的质量,即数据的准确性、完整性、有效性和规范性;二是数据库的框架结构,即数据库资源的分类体系的专业性、合理性;三是数据库的用户体验,即用户检索、获取数据的有效性和便捷性。数据库的质量控制是通过科学的方法,针对数据库质量的3个方面予以精度控制、专业控制和规范控制。数据库的质量得不到保证,即使规模再大,也体现不出数据库的真正价值。“井冈山革命根据地·中央苏区数据库”的元数据著录严格按照中央党校下发的《党校系统“三大文库”数字资源建设规范》执行,资源的标引施行标、校、审、发制度,保证发布的每一条资源的准确性与完整性;框架结构采用主题分类体系,力求按照主题全面反映井冈山革命根据地时期和中央苏区时期的基本史实;用户体验是一个不断优化的过程,通过不间断地收集用户的使用反馈,重点在资源检索、获取的有效性方面进行优化。
数据库的框架结构不仅可向用户直观显示数据库资源的类目结构,方便用户按照类目直接查找所需资源,而且还可提高数据库管理人员对数据进行批量管理的效率。数据库框架结构设计的合理与否,可以直接反映出数据库专业水平的高低和整个数据库建设工作能否顺利开展。数据库的建设是一项系统工程,一旦框架结构确立后,即会投入大量的人力、物力和财力,围绕数据库框架结构进行规模化建设,因此,框架结构若设计不当,不但浪费了资源,而且还会使整个数据库建设举步维艰。要避免上述后果的出现,在数据库建设之前就必须围绕数据库主题进行广泛而深入的调查研究和专家论证工作,结合实际情况,找准资源优势,确定收录范围,科学合理地制定出具有特色的数据库框架结构。
2.7.1 资源收录范围
“井冈山革命根据地·中央苏区数据库”旨在基于历史学和图书馆学、情报学与文献学理论,构筑与井冈山革命根据地和中央苏区研究相呼应的信息资源检索与利用平台。首先确定了馆藏及相关合作单位的文献资源所涉及的学科领域、内容主题、载体类型以及覆盖的语种与时间范围等,从而对文献的收录范围进行了界定。内容上包括与井冈山革命根据地和中央苏区相关及部分相关的文献、资料、专著;类型上包括图书、期刊论文、视频、音频、图片等,同时,对相关的原始档案文件也进行了抢救性数字化处理,并予以收录。
2.7.2 数据库框架结构
通过对井冈山革命根据地和中央苏区研究专家进行走访、座谈等形式,对井冈山革命根据地和中央苏区的学科体系和发展方向有了一定的认识,因此在确定数据库框架结构时便更有针对性。根据分析论证,确立了“井冈山革命根据地·中央苏区数据库”的框架结构采用基于文献类型交叉的主题分类法,主要包括历史纵览、武装斗争、党的建设、经济建设、社会建设、人物研究、史料集萃、老区新貌、历史再现、红色歌曲等主题。如图1所示。
图1
以用户的有效利用为根本目的的特色数据库建库理念已被大多数建库者所认同,那么如何使特色数据库能被用户有效利用呢?笔者认为,特色数据库是一种信息产品,应当有它的特定生命周期,只有正确认识和区分特色数据库生命周期不同阶段的特性,并针对这些特性进行有效的人工干预,延长其生命周期,实现以最低的成本为用户提供最大的价值,才能使特色数据库走上可持续发展之路。
特色数据库既然是一种信息产品,自然应具有信息和产品生命周期的基本属性。笔者认为,基于用户利用视角下的特色数据库生命周期包括5个阶段:加工制作、传播推广、获取利用、更新维护、收藏删除。这5个阶段的关系如图2所示。
图2
特色数据库生命周期中的加工制作阶段指数据库及其资源从无到有的起源。资源是数据库的核心,资源的规范性、准确性、完整性、系统性是建设特色数据库首要考虑的问题。特色数据库建设之初,首先应当制定规范统一的元数据著录标准和反映学科内在规律的框架结构,在资源加工过程中,务必做到规范统一,以便于用户检索和进行批处理操作。其次应广泛进行资源分布调研,确定收集范围和主题,注意保证资源的准确性和系统性,切勿单纯追求资源的数量。最后是采用功能性、稳定性、兼容性较好的数据库系统,以符合大多数用户浏览习惯的发布形式进行内容发布。总之在特色数据库生命周期中的加工制作阶段,要重点保证做到三有,即有标准规范、有文献资源、有管理系统。
特色数据库生命周期中的传播推广阶段是指数据库加工制作完成后,按照某种方式向特定用户进行传递并最终到达用户手中的过程。建设特色数据库的根本目的是利用,因此要改变坐等用户上门的传统思维,采用各种有效的形式,主动向用户推广营销。当前比较有效的推广方式有:开展讲座(座谈会)、发放宣传册、网络推广、媒体推广。同时,在传播推广的过程中要注意推广内容的取舍和轻重,重点推广特色数据库是什么、数据库里有什么、数据库怎么用、用户还想要什么、使用过程中遇到了问题怎么办等几个问题。
特色数据库生命周期中的获取利用阶段是指用户采用特定方式获取资源后,对资源进行的研究、分析、统计和决定是否以此为基础而进行思维决策。用户获取利用特色数据库资源的体验,可以有效地检验出数据库质量的高低,因此,此阶段的干预效果,将直接决定特色数据库生命周期的长短。资源的利用受用户自身知识水平和层次的影响较大,在保证了资源的质量后,很难做出有效干预。资源的获取效率是此阶段的干预重点所在,应着重进一步完善资源的标引著录规范、丰富数据库系统检索功能、在版权可控范围内尽量减少用户访问权限、加大与用户在线沟通互动力度和升级数据库系统硬件平台配置,从而减少因资源获取效率低下而流失的用户数量,为特色数据库的可持续发展提供基本保障。
特色数据库生命周期中的更新维护阶段是指对数据库系统及其资源的管理,这种管理包括数据加工、存储、传输、拷贝、备份及数据库系统性能优化。对数据库中的资源进行修正、维护、更新是保证数据库质量的必要且有效手段。在更新过程中,不仅要对用户反馈的错误信息进行及时、规范的更新,而且还要创新资源共建共享模式,加大新资源的收集力度,必要时可根据新资源的收集情况对数据库的框架结构做出微调。数据的备份是保障数据库系统安全的重要措施,要建立严格的备份制度,做到定期专人进行数据备份。同时对数据库系统硬件设备及相关软件系统要加强安全检查和防范,及时升级和更换影响用户获取效率的软硬件。
特色数据库生命周期中的收藏删除阶段是指用户对已经使用的特色数据库进行的最终处理。这种最终处理可能是存档资源,收藏数据库,继续使用;也有可能是删除资源,不再访问数据库。此阶段是用户对数据库质量评价结果的直接体现。用户的收藏、删除权利,任何人没有权利干预,但可以通过分析研究系统收集及相关调查情况的反馈数据,查找出用户做出收藏或删除的原因,为数据库系统的整体优化提供参考。
影响特色数据库可持续发展的因素是多方面的,笔者以特色数据库生命周期为研究视角,对图书馆特色数据库的建设展开论述。但作为一种全新的研究视角,谨期对特色数据库建设者们提供些许参考,希望能够更好地实现图书馆特色数字资源的共建共享,促进图书馆信息资源建设的可持续发展。
[1] 黄晓斌,蒲筱哥.我国图书馆特色数据库建设的现状、问题与对策[J].情报科学,2007(5):784-789.
[2] 黄敏,都平平.高校特色数据库建设及可持续发展问题研究[J].图书馆论坛,2012(9):83-86.
[3] 粟湘,郑建明,吴沛.信息生命周期管理研究[J].情报科学,2006(5):691-696.