学术类数据库的格局、争议及其发展
——以“中国知网”为例

2019-07-22 07:48文/李
传媒 2019年12期
关键词:学术期刊学术数据库

文/李 静

2019年2月,某获得博士学位的影视明星在直播中以一句“知网是什么”陷入舆论风波。受其牵连,作为当前我国学术期刊数据库领域的领军者,中国知网(以下简称“知网”)也随即引发舆论关注。有媒体及网民质疑知网的垄断地位及其所谓的霸王条款,还有其给知识传播及学术论文版权带来的损害。对于这起事件,我们不应只停留于质疑的表面,更要深入到整个行业去观察,探讨学术数据库领域当前面临的普遍性问题,并寻求合理的解决方案。

一、数据库的概念及其界定

尽管数据库已经不是新鲜事物,但从国内外法律法规以及规制来看,其概念尚无统一界定。1992年的伯尔尼公约备忘录里最早提及了数据库,并把数据定性为“信息(数据、事实等)的编纂物”,至于表现形式则“不论其是以印刷形式、计算机存贮单元形式还是其他形式存在”,这一描述并没有明确提及数据库的表现形式,只是一个大致的概念界定。

同年,欧共体委员会通过的《关于数据库版权指令草案》对数据有更加清晰的定义。这一草案把数据库定义为“一种作品、资料的集合,按电子形式组织、存贮、检索以及用于操作数据库所需的电子型资料”。显然,这一定义把数据库限于“电子型”,不再包含传统的印刷出版型数据库。而且,这一草案还明确提出了词表、索引、提供信息的系统等互联网数据库的基本形式,在互联网尚未高度发达的年代,做出这一定义十分难得。

我国相关法律对数据库以描述性文字为主。在著作权法中,与数据库有关的提法是:汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品,为汇编作品。如果以这条规定为依据,那么我国数据库的版权保护主要是作为一种“汇编作品”存在的,版权由汇编者享有,这一法律界定某种程度上对当下数据库的版权争议有着直接影响。

在学术上,我国有学者对数据库提出了各种不同的定义。总体来看,主要围绕集合、电子等关键词展开。所以,我国对数据库的理解符合当下数据库的普遍形式,即互联网建立的数据库。

二、我国学术数据库的基本格局

经过20多年的发展,我国学术数据库已经基本成熟,并形成了较为稳定的竞争格局。笔者认为,当前我国学术数据库处于“3+1”的竞争格局中:3是指知网、维普、万方,号称中国数据库“三驾马车”;1是指国家哲学社会科学学术期刊数据库,尽管是新兴的数据库,但其意义重大。

在“三驾马车”中,就收录范围来看,知网无论在期刊种类、引文数量、更新周期、用户规模等方面都占据着绝对的优势,目前已经建成世界上中文全文信息量最大的 CNKI数字图书馆、中国知识资源总库、CNKI网络资源共享平台,成为国内数据库行业的领军者。相比之下,万方数据库的优势在于全文数据国际戒规性好,而维普数据库的特点在于收录量大、范围最广、标引质量高。不过,总体来看,维普和万方的影响力较弱。

在较长一段时期内,知网、维普和万方领跑于学术型数据库,但随着数字化出版的发展以及知识、学术的公益性色彩,三者的产业化运营模式及垄断性弊病开始显现。在此背景下,由中国社会科学院调查与数据信息中心建设的国家哲学社会科学学术期刊数据库于2013年正式上线,如今已经建成为一个国家级、公益性、开放型的国家哲学社会科学数据库,这一数据库全部免费使用,公益色彩十分明显。

三、当前我国学术数据库面临的版权问题

数字化出版的大趋势下,未来的图书、学术期刊等必然会更加重视数据库平台,数据库建设也显得愈加重要。而当前我国在数据库建设领域,尽管已有几家发展得不错,但是在版权方面存在的问题已经成为舆论关注的焦点,并成为数据库发展的瓶颈。从当前形势来看,其过度商业化和垄断格局是我国学术数据库面临的两个主要问题。

1.公益事业商业化运作的费用之争。学术论文属于公共知识资源,具有公益性的特征。为了保障学术资源能够为公众所获取,真正服务公众,理当从市场行为角度对数据库进行一定的约束,避免数据化进入纯商业化运作。然而,目前几大数据库几乎都是商业化运作,在收费上引发舆论广泛质疑。

知网之所以能够建立庞大的数据库,主要原因在于它是国家知识基础设施,并借此以低价获取国内绝大多数期刊的学术资源。凭借着这些学术资源,知网进行全盘商业化操作,不仅数据库变现,而且还向其用户收取较高的阅读费用,甚至设定最低充值额度,获取利润。根据媒体公开报道,知网的涨价幅度每年都在10%以上,多年来毛利率高于50%。北京大学曾宣布知网即将停用,原因正是“数据库商涨价过高”。同时,知网收费模式也引发用户的不满。2018年,苏州一名大学生因知网最低充值额度的霸王条款,将中国知网诉诸法庭,可见这一矛盾已经逐渐进入白热化。

2.垄断格局之下作者的权益保护难。在当前我国的数据库格局中,知网无疑已经是规模最大、内容最全的学术数据库,占据了学术数据库的市场支配地位,处于实质性的市场垄断状态。在垄断格局之下,作者的权益几乎得不到保障。在知网在低价收购学术期刊资源后,期刊一般会在刊物上明确表示,作者同意在其刊物上发表文章,就意味着同意版权归属杂志社。对于作者来说,有的可能获得杂志社少量稿酬,有的甚至没有稿酬,但文章发表之后会统一上传知网,知网以阅读卡代替稿酬支付作者。整个过程中,作者始终处于被动局面。

知网的垄断地位及其做法,涉嫌以不公平的低价购买商品行为,引起了舆论质疑。事实上,知网垄断现象并非个案,如美国的lexis、荷兰的爱思唯尔,都具有一定的垄断地位。但之所以没有产生类似知网面临的争议,是因为上述国家均有一个公平竞争的数据库发展环境,有利于知识的传播和管理。所以,要保障作者的权益,维护消费者利益,就需要建立起一个公平竞争的环境,彰显学术数据库的公益性。

四、学术数据库的发展方向

随着数据库的发展和科研队伍的壮大,数据库所涉及的各种版权问题已经到了必须解决的时候。特别是在信息化和数字化出版的大趋势下,面对社会舆论的质疑和公众的期待,学术数据库应进一步强调学术数据库的公益属性,加快开放获取平台建设,加强对知识生产者权益的保障。这也将是学术数据库发展值得探索的发展方向。

1.在推动数据库发展之时,必须考虑到其公益属性。学术性数据库不同于其他数据库,具有强烈的公共服务属性,是学术研究和公众获取知识最为重要的信息来源基地。因此,在发展学术数据库时,必须要保障其公共属性,在这点上,国家哲学社会科学学术期刊数据库的运行是一个积极信号。

在未来的发展中,有必要考虑把学术数据库纳入到公共文化体系建设之中。尤其部分学术期刊是在财政资金支持下运行的,其成果应普惠于学术界和社会公众。学术数据库作为学术期刊的集散地,其盈利方式不能以这些资源为主,而应探索建立在学术期刊资源基础上的其他商业价值开发。

2.要加强对知识生产者的权益保护。当前学术界对数据库的研究,大多集中在对数据库运营方、制作者的版权保护上,而对数据库的数据来源,如学术期刊、学术论文作者的权益保护少有研究。事实上,相比于数据库自身的版权保护而言,其数据来源方的权益保护更处于弱势状态,需要相关政策法规予以一定程度的保护。

在具体做法上,首先是要打破垄断竞争格局,推进数据库的多元化、多样化发展。其次,在未被垄断的基础上,改变数据库与杂志社、数据库与作者、杂志社与作者之间的霸王条款,让杂志社、作者有更多的选择空间,而不是被动接受数据库提出的各种要求。

3.要加快推进开放获取平台(OA)建设。为了打破出版单位对科技知识的垄断,使其得到广泛传播,国际科技界于21世纪初提出了科技信息开放获取的理念。相比传统的学术出版,OA期刊强调开放传播,用户通过互联网可以免费阅读、下载、复制和传播作品。

这一理念有助于提升学术期刊的影响力和学术成果的传播,因此在世界范围内迅速推广,如今已有250多家机构加入,我国也建立起了“中国科技期刊开放获取平台”。在未来的学术数据库发展中,有必要在已有的三大数据库中推行“开放获取”理念,同时加快人文社会科学领域的开放获取平台建设,以此促使学术数据库真正服务于公众。当然,在这一过程中,也要注意其在国内面临的“水土不服”困境,从认知、经费、人员、平台、政策等方面不断进行完善。

总之,学术论文与学术数据库是公共知识资源。在发展学术数据库之时,不仅要考虑通过市场运作,推动数据库繁荣发展,更要牢记学术数据库的公益属性。作为学术数据库,要考虑自身商业法则,也要充分保障各方利益;而作为顶层设计,相关管理部门应不断完善政策法规,并探索建立开放获取的学术期刊数据库。

猜你喜欢
学术期刊学术数据库
我刊获评四川省社会科学优秀学术期刊
学术是公器,不是公地
学术动态
我刊获评四川省社会科学优秀学术期刊
学术动态
中国实践的学术在场
以学术期刊为桥梁促进科研与科普结合
数据库
数据库
数据库