靳光明
[摘 要]跨入信息时代以来,中国的数据库研究不断取得进步和发展,从20世纪90年代以来,中国逐渐形成了以CNKI、万方数据库、维普数据库为主的三大数据库。因此,文章首先简单介绍了数据库的内涵,以及CNKI、万方数据库、维普数据库这三大数据库的发展情况。而后对三大数据库的特点进行了对比分析。最后对中国数据建设现状做出了简单分析。
[关键词]CNKI;万方数据库;维普数据库;数据建设
[DOI]10.13939/j.cnki.zgsc.2017.15.299
1 数据库的内涵及CNKI、万方、维普数据库简述
1.1 数据库的内涵
数据库产生于20世纪五六十年代,到20世纪90年代后取得了较大的发展,功能从储存、管理数据,发展到了根据用户需要而进行各种数据管理的程度。所谓数据库,即能将数据以一定的方式存储起来,所有客户都可以共享这些数据资料。
在当下的社会之中,数据库的应用范围极其广泛,各单位都建有或简单或复杂的数据库。例如,学校会建立数据库以储存教师和学生的相应的信息,发布校方的官方新闻消息。与此同时,师生都可以通过他们自己的编号和密码进入数据库,搜索和下载自己需要的资源。并且,学校的数据库简单容易操作,资源也实现了共享,而且资源安全可靠,并有专人维护等。由此可见,人们在生活之中都会直接或者间接地与数据库接触,数据库广泛地存在于人们的生活之中。
从20世纪80年代以来,国内的电子期刊数据库迅速发展,逐渐形成了以CNKI、万方、维普数据库为主的三大数据库。这三大数据库各具特色。
1.2 CNKI、万方、维普数据库简述
CNKI、万方数据库、维普数据库是我国的三大数据库。它们在不同的时间发展起来,也各具特色。
“CNKI”是“China National Knowledge Infrastructure”的简称,即“中国知识基础设施工程”,也就是当下学术界使用范围非常广泛的中国知网。CNKI是由清华大学和清华同方共同发起并由清华大学直接领导的一项知识项目工程,CNKI在1995年正式立项,在1999年,CNKI所发行的学术期刊从光盘版本实现了网络化。CNKI收录期刊、报纸、优秀学位论文、会议文件等,所囊括的范围极其广泛。据资料统计,CNKI所收录的期刊和文献的完整率都高于99.9%。
万方数据库由万方数据公司所开发,也是和CNKI齐名的专业的学术数据库。数据库分为中文版本和英文版本,所收纳的期刊包括理科、工科、医学类和人文科学类的期刊全文,据资料统计,共包括70多个类目,4529种科技类的期刊。万方数据库以网络为主要平台,为其用户提供了丰富的数据资料,为中国学术收录工作做出了巨大的贡献。
维普数据库由重庆维普资讯公司所开发。从2000年建立以来,维普数据库综合整理了中国国内馆藏的外文期刊,以及互联网之上的外文期刊。维普数据库使得其用户在同一数据库之中就能找到中国馆藏和互联网之上的外文期刊,用户不用再耗费精力四处查找资料。既帮助用户节省了他们的时间,又为用户开拓了广泛的阅读空间。
CNKI、万方数据库、维普数据库分别以其先进的理念,跟随时代发展步伐。为广大用户提供了海量的学术资源,便利了用户的材料搜索渠道,拓宽了用户的学术资源视野。
2 CNKI、万方、维普数据库的特点对比分析
CNKI、万方数据库、维普数据库都具有非常强大的数据资料收录功能。但是,具体来说,各数据库既有相同之处,又都有自己的特点。
首先,CNKI、万方、维普数据库有许多相同之处。具体体现在三个方面。第一,在检索方式上,CNKI、万方数据库、维普数据库都可以按照“题名”“关键词”“摘要”“作者”“作者单位”的方式进行检索。第二,在收录内容方面,都收录了较为全面的中文期刊,为广大用户提供了丰富的学术资源。第三,在用户群体方面,三大数据库的主要用户一般都是高等院校的学生,以硕士研究生、博士研究生群體居多。
其次,CNKI、万方、维普数据库各有优势。也正因为如此,CNKI、万方、维普数据库也有许多的不同之处。可从收录范围、浏览清晰度,以及收录时间三方面进行比较。
从收录范围来看,CNKI的地位是不可动摇的。具体来说,CNKI的优势主要体现在以下四个方面。
第一,在检索方式上,虽然都可以按照用户的需求进行检索,但是CNKI有分类检索、初级检索、高级检索和专业检索这四种方式,并且每次检索以后,可以在其检索结果中进行二次检索,这个操作步骤可以进行无数遍,直至检索结果为零。
第二,在收费方式方面,CNKI的收费方式最为灵活,维普数据库的收费方式较为灵活,而万方数据库的收费方式相较于CNKI、维普数据库来说则欠缺灵活性,且万方数据库和维普数据库的收费相较于CNKI来说,相对较贵。
第三,在收录的学科范围方面,CNKI最为全面,而万方数据库次之,维普数据库的收录范围相较于CNKI、万方来说则相对不够全面。CNKI所包含的范围几乎是囊括了所有学科。维普数据库所收录的内容主要包括自然科学、农业科学、医药卫生、经济管理,以及教育科学和图书情报,但是,近几年以来,维普数据库所收录的医药卫生方面的内容几乎没有再更新了。而万方数据库所搜集的东西则主要包括理科、工科、医学、农学和人文类学科的内容。
第四,在期刊来源、引文数量以及更新速度方面,也使CNKI具有更强的优势。在期刊来源上,属于CNKI的来源最多,据资料统计,CNKI包括了6000多种期刊来源,而维普数据库只有5000多种,万方数据库则仅有3000多种。在引文数量方面,CNKI有790多万篇,而万方数据库只有490多万篇,维普数据库则仅有140多万篇。在更新速度上,CNKI的更新速度是最快的,CNKI基本上保持了每日更新的速度,而维普数据库是半个月才更新一次,万方数据库则是一个月才更新一次。
而从数据库的浏览清晰度比较,则属于万方数据库的浏览清晰度最高,其阅读模式主要采用PDF格式,上传的清晰度非常高,就像在阅览纸质版一样。而CNKI采用的是PDF、CAJ的浏览器,必须下载相关的浏览器才可以进行阅读,相对来说,清晰度没有万方数据库的高。而维普数据库文档的清晰度相对万方和CNKI来说,则较差。
从收录时间来看,则是维普的收录时间最早,它收录了从1990年开始以后的相关数据资料。CNKI所收录的内容是从1994年开始的,万方数据库则是从2001年开始。
由此综合来看,属于CNKI的使用范围更为广泛。无论是在收费方式,还是在期刊来源、引文数量、更新速度上,以及所囊括的学科范围上,CNKI都具有更多的优势。对学生群体来说,一般都是使用CNKI进行资料查询。
3 中国数据建设现状
首先,就数据建设成就来说,从20世纪90年代以来,我国的数据建设取得了丰硕的发展成果。据资料统计,2009年,我国的各类数据中心和机房总数量为519990个,在2012时,数量已经达到约540777个。并且在21世纪初,逐渐形成了以CNKI、万方和维普为主的三大专业的学术期刊收录数据库。在2016年,在贵州省建立了国家级别的大数据中心,是我国的数据建设事业大跨步发展的实践证明。
其次,数据建设的发展还存在三方面的阻碍因素:第一,数据建设的法律法规不完善;第二,数据共享观念的缺失;第三,数据平台建设存在重心偏移倾向。
总之,我国数据建设还处于发展阶段,有极大的开发空间。但在数据建设发展过程中,要注重解决当下存在的问题,例如,完善相关的法律法规,培养数据共享观念,平衡数据平台建设的重心等。只有充分利用当前数据建设的发展成果并解决了当下存在的问题,才能使我国数据建设迈上更高的台阶。
参考文献:
李金兰.CNKI、万方、维普资源比较分析[J].情报探索,2011(4).