涂佳琪,杨新涯,王彦力
数据库是数字图书馆的文献资源基础,数据库的历史就是另外一个角度的数字图书馆发展历史。CNKI(China National Knowledge Infrastructure,中国知识基础设施)工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,其服务网站——中国知网是全球最大的中文知识门户,由《中国学术期刊(光盘版)》电子杂志社有限公司、同方知网(北京)技术有限公司、同方知网数字出版技术股份有限公司等单位联合运营,是在《中国学术期刊(光盘版)》《中国期刊网》基础上发展起来的中外文大型知识资源总库,是我国数字图书馆建设的重要参与者和见证者,甚至有学者认为《中国学术期刊(光盘版)》的发布是我国进入数字图书馆时代的标志和里程碑①。
目前研究数字图书馆历史的文献主要集中在两方面:一是数字图书馆系统的历史演变,如莫少强总结1980-2012年广东省立中山图书馆自动化建设的6个时期[1];许天才等梳理重庆大学图书馆从自动化管理系统到智慧图书馆系统研发过程中的成功案例、困难与挑战[2]。二是图书馆发展历程中某项技术的应用史,如刘慧云等认为缩微技术是文献资源长期保存的重要技术和手段,并梳理缩微技术在图书馆的实践历程,指出数字缩微是缩微技术的发展方向[3]。
我国数据库建设始于20世纪80年代,90年代后期才逐渐商品化和产业化,因此研究数据库历史的文献较少,大多将数据库作为样本来源进行计量分析[4],或对比分析多个数据库的期刊重复率、更新速度、检索功能等内容[5],再或是研究数据库某一优势或特色[6-8]。对于CNKI的研究仅包括它对某一行业或领域的影响,如薛培荣等从CNKI的资源基础、服务领域、产业模式、国际竞争与合作等方面论述其对科技信息服务的影响[9],王青梳理了1996-2000年CNKI对图书馆带来的影响和变化[10]。有3篇文献着重研究CNKI发展历史,其中李柯回顾了1995-1999年CNKI的发展历程以及取得的社会经济效益[11];朱素兰等回顾1995-2004年CNKI的发展历程,总结其发展经验,展望了全文数据库检索系统的发展方向[12];赵蓉英等认为1995-2004年CNKI经历了光盘版、网络版和知识服务平台3个时代,梳理各时代重要事件和主要成就,指出CNKI对促进我国知识信息服务产业发展发挥着重要作用[13]。总之,对CNKI发展的研究主要集中在2006年之前,2006年后13年间鲜有学者研究其历史发展,而这一时期CNKI正处于高速发展阶段,值得关注和重点研究。
CNKI历经数字图书馆的兴起与繁荣,推动了我国图书馆事业发展,因此CNKI发展历史是我国数字图书馆史和图书馆技术史不可缺失的部分。为研究CNKI的发展历史,笔者2018年12月4日前往CNKI总部采访并参观多条生产线,详细了解CNKI产品、技术及其在出版模式上的创新等。同时,笔者就CNKI发展脉络、核心技术、自主研发产品和未来发展分别采访CNKI常务副总经理张宏伟,副总经理张振海、刘学东、张义民等亲历者。为保证资料的客观性,同时调研了长期接触数据库采购的馆员、使用且持续关注数据库发展的学者,了解其对CNKI等数据库商的发展和看法。在整个研究过程中,笔者深感CNKI在整个发展进程中,一直努力坚持自主创新,从底层数据库到全文搜索技术,从最初的光盘到完整的互联网服务体系,从单一的面向图书馆服务到产业链的整合,使自主创新成为CNKI发展的最大特色。2019年5月,美国商务部工业和安全局宣布把华为公司列入“实体名单”,包括安卓操作系统在内的多个核心技术受到封锁。我国只有且必须自主开发核心信息技术体系,这折射出知识服务领域的科技创新自主性的重要价值。在这样的背景下,研究并总结CNKI等以自主创新为特色的数据库商的发展过程与经验,就显得尤为重要。
截至2018年12月,CNKI累计整合国内外期刊文献总量达2亿多篇、题录3亿多条、统计数据2.6亿条、知识条目10亿条、图片5000万张,日更新数据达24万条,在全球53个国家和地区拥有2.7万多个机构用户、1.2亿个人用户,网站日访问量1600余万人次,年下载量23.3亿篇次,已成为最大的中文数据库服务商。
通过分析公开文献和访谈资料,笔者将CNKI的发展过程分为5个阶段:(1)创业期。《中国学术期刊(光盘版)》发布,开创中国数字出版先河,推动我国文献资源数字化和网络化进程,在我国数字图书馆发展过程中具有划时代意义。(2)战略形成与规模初具期。《中国期刊网》开通,推动学术期刊进入全文网络检索时代,推动图书馆资源数字化建设。(3)规模化与标准化建设期。《中国知识资源总库》问世,整合资源规模化,进一步丰富馆藏,制定数字化出版标准,推动国内数字资源标准化建设。(4)内容生产与规模多元化期。重视国际合作,实现知识信息资源的社会化共享与国际化传播。(5)总体架构实现期。推进知识管理与服务,实现移动知识服务,提升图书馆对终端读者的精准服务能力,推动了图书馆由数字化走向智慧化的进程。
图1 中国知网CNKI的发展脉络图
20世纪90年代初期,计算机和计算机技术普及,行业内开始尝试用光盘存储资源进行检索。1992年我国第一张CD多媒体光盘由北京金盘有限电子公司出版[14],CD光盘的出现为图书馆资料提供了新的存储介质,使信息资源数字集成、整合与传播成为可能。1993年中国科技情报研究所重庆分所实现文献题录检索[15]。尽管这些技术逐步发展,但是未解决一、二次文献资源的关联问题,学者使用光盘检索后仍需通过纸本资源获取一次文献。
1.1.1 灵感萌发,从题录摘要到全文
1995年初CNKI创始人、北京清华信息系统工程公司总经理王明亮通过分析《中国妇女》全文光盘的数据格式受到启发,提出“版面显示+全文检索技术,可形成供全文检索、原版浏览,且数据量小、便于CD存储和窄带传输,并可长期保存和二次开发的实用化电子文档数据库系统”,并凭借科研、教学、学习经验,以及对光盘、学术期刊出版、印刷等行业的了解,提出《中国学术期刊(光盘版)》(CAJ-CD)项目的经营方案,于1995年8月被列为清华大学科研和产业化开发项目[10]。
1.1.2 CAJ-CD诞生,开创数字出版先河
1996年1月,北京清华信息系统工程公司(以下简称“清华信息公司”)将光盘存储技术与现代信息检索技术结合,不仅维持收录纸本期刊的原貌,实现文献检索从题录摘要向期刊全文转变,而且基本实现与纸本期刊同步出版。经过与期刊界、学术界展开广泛合作,创办了“国内外首个大规模集成学术期刊并与其同步出版的电子期刊——CAJ-CD”。经新闻出版总署批准,1996年12月24日,CAJ-CD首次以电子书号方式正式出版我国自1994年以来2000多种学术期刊全文[10];1997年9月,CAJ-CD获准出版中国大陆首批8个连续型电子出版物,标志着我国第一个以电子期刊方式按月连续出版的大型集成化学术期刊现刊原版全文数据库诞生[16]。
CAJ-CD作为我国自主研发的“首个原版显示+全文检索的全文数据库管理系统”,从功能设计到技术方案均达到“国际领先水平”,得到中宣部出版局、新闻出版总署、教育部等的指导和支持,获得1998年教育部科技进步三等奖。
为了扩大CAJ-CD的影响,1997年3月31日至4月11日,清华信息公司先后在国内建立300多家检索咨询站[17],向国内外广大用户提供全文检索服务,迅速占领国内图书情报市场。1998年7月,在“1998年美国图书馆协会年会”上,CAJ-CD受到各国图书馆代表的强烈关注,迅速在海外著名公共图书馆、重点大学图书馆等设立中国学术期刊文献检索站[11],中国学术文献资源开始走向世界。
CAJ-CD解决了图书馆馆舍紧张的问题,满足了图情单位“以有限经费采集尽可能多的文献”的需求,丰富了馆藏资源,成为中国图书馆进入数字图书馆时代的重要标志。CAJ-CD作为中国第一个全文数据库,创办伊始即在国家版权局版权司的指导下,创建通过学术期刊编辑部解决文献著作权的使用授权模式,与每一个编辑部签订授权协议,这对我国数字出版产业与数字图书馆的发展具有重要意义和示范作用。
1995年我国互联网接入美国64K专线,开始向社会提供互联网接入服务,各单位亦纷纷组建局域网。随后网易、搜狐、新浪等门户网站相继成立[18],加速了互联网的普及与渗透,人们使用互联网的频率与日俱增,因此CNKI开始向互联网转型。
1.2.1 CJN开通,从光盘检索到网络检索
1999年6月18日,在整合CAJ-CD数字资源的基础上,CNKI开通“中国期刊网”(www.chinajournal.net.cn,简称CJN),以全文形式开展网络期刊资源服务,初步实现了全文检索从光盘到网络的转变,文献检索进入全文网络检索时代。此外,为方便检索,打破时间、网络出口带宽和上网通讯费的限制,CNKI将全国360多家单机、局域网光盘检索系统升级为镜像站点,便于保存数字馆藏,集中管理内网服务[19]。
CJN汇聚我国中英文学术期刊精华,向国内外广大用户提供检索咨询等信息网络服务,提高了图书馆阅览服务质量和参考咨询服务水平。
1.2.2 《中国知识资源总库》起步,逐步建设系列知识仓库
1999年CJN开通之际,即制定了全面打通知识生产、传播、扩散与利用全过程,建设中国知识基础设施的战略目标。2002年底,CNKI已经整合4000多种重要学术期刊,建成国内首个高质量学术期刊全文检索与评价数据库《中国期刊全文数据库》。以此为基础,建设了优秀博硕士学位论文、报纸、会议论文、科学文献、专利、图书等一系列数据库[12],其中的文献题录免费向全社会提供服务。CNKI还陆续建成医院、企业管理等多领域专业知识仓库,为《中国知识资源总库》的建设奠定了基础。
CNKI相当于一个专业文献的数字图书馆,图书馆引进CNKI不仅可以满足读者检索和阅览需求,还可以利用光盘或网络向单位内部和社会提供咨询等服务。CNKI通过检索咨询站和镜像站点,迅速在全国图书情报界建立起完善的知识服务网络,在一定程度上促进了这个时期图书馆电子阅览室的建设,也加快了图书馆资源数字化进程。
早在20世纪60年代,袁翰青便指出对文献中新发现的知识进行组织,可以深化到文献中的数据、公式、事实、结论等细粒度的“知识元”[20]。21世纪初期,图书馆界开始关注知识服务,而知识元是数字图书馆知识构建的基础。
1.3.1 CNKI问世,实现知识检索细粒度
CNKI一直致力于知识元的构建,2003年《中国期刊网》正式更名为中国知网(www.cnki.net),《中国知识资源总库》建设工程初具规模。CNKI依据严格的标准数字化加工流程,整合文献数据库、专业知识仓库、知识元库,并以知识元库和引文链接等方式组成知识网络系统。到2010年,CNKI建成“概念、原理、方法”“图形图像”“科学数据”“社会经济统计数据”“社会发展事件事实”等知识元数据库,以及涵盖各学科300万词条的概念关系词典,并以此为基础发布全球首个知识元搜索系统,实现了学术资源深度聚合和知识的细粒度检索。
1.3.2 深度整合,开发数据库系列产品
2004年CNKI开始整合百科全书、词典和专科辞典等资源,出版了我国首个《工具书数据库》,并将其中的概念、图片、数字和图表等进行详细标引,为读者提供增值服务[21]。2006年10月,CNKI又根据读者层次和产品用途将《中国期刊全文数据库》分为学术、高教等9种期刊数据库产品,并以网络出版方式经营。除收录学术期刊外,CNKI还收录了党建期刊、政报公报等8种非学术期刊文献,并建立对应数据库。2008年CNKI首次发布能源电力、党政、法律等20多个企业知识仓库。
1.3.3 建成中国学术期刊的权威性文献检索工具和网络出版平台
2006年《中国知识资源总库》被确定为学术期刊的权威性文献检索工具。这不仅标志着CNKI进入规模化发展阶段,也意味着我国学术期刊数字化、网络化建设的目标基本实现,具有自主知识产权的文献检索、知识挖掘、文献评价研究等系统和数字化学习与研究平台达到领先水平[22]。
1.3.4 网络出版物产品进入标准化时代
随着出版社数字化意识的觉醒,大量数字出版产品问世[7]。为实现资源开发系统化、标准化,规范数字产品的出版,CNKI于1998年7月启动中国学术电子期刊标准化数据库系统工程[23],并在2005年参照相关技术标准和传统出版物的产品标准,制定了国际国内首部公开发表的连续型电子与网络出版物产品标准——《CNKI系列数据库产品与技术服务标准》,从全文数据库基本属性、产品用途、内容、结构、功能与性能6个方面规范出版产品、确保产品质量[24],体现了文献数据的规范化和标准化,为图书馆数字资源建设质量保驾护航,为知识信息的传播和利用打下良好基础,象征着网络出版物产品进入标准化时代。
计算机和互联网的普及、国际交流增强,使得读者对于国外资源的使用需求逐步提升。读者开始质疑图书馆参考咨询服务的内容和形式,图书馆亦开始重新审视自身在数字环境中的价值和地位,并重视国外学术资源的采购,通过大规模应用新技术和新理念以满足读者诉求。
1.4.1 重视信息服务国际合作
CNKI不仅注重国内信息资源开发,也重视与国外大型出版商建立联系。根据国内用户需要筛选和统一引进海外文献资源,利用自身平台和服务体系在网上代理发行国外数据库。2008年CNKI与德国Springer出版集团合作,将双方数据库整合并在CNKI知识服务平台发布,开启国际合作新纪元[25]。随后英国Taylor&Francis出版社、剑桥大学出版社,美国大英百科全书出版集团、ProQuest信息公司等国外出版机构纷纷与CNKI签约,整合双方资源。CNKI此举方便了我国广大用户以最低的成本和便捷的方式利用国外数据库。与此同时,CNKI积极响应政府“走出去”战略,注重学术期刊、产品市场推广国际化。2010年,CNKI开始建设中国学术文献全球营销网络平台,在美国、德国等地建成8个境外镜像网站[26],我国学术成果、产品开始逐步走向境外知名大学、研究机构、政府等单位。一系列国际合作表明,CNKI数字资源整合出版与服务模式受到了国际同行的认同,而CNKI遍及世界各地的用户也意味着我国知识信息资源实现了互联网条件下的国际化传播。
1.4.2 开拓科技信息服务新领域
2008年苹果公司推出iPhone后,智能手机、移动终端层出不穷,社会进入移动互联网时代。移动互联网带来的时间碎片利用是社会和图书馆界共同思考的问题。为提高服务的针对性和个性化,精准把握读者诉求,CNKI面向用户开展各种增值知识服务,如科技查新、参考咨询、定题服务、知识比较与评价、知识推送。
在大数据时代,海量数据的产生、采集、存储、智能化、可视化呈现以及大数据技术的广泛应用,给数据库行业、图书馆界带来巨大的发展机遇和挑战,双方开始意识到知识服务的重要性,推出相应的知识获取、知识管理等服务。
1.5.1 借助优势,推进知识管理与服务
2013年CNKI重构工程技术与产业体系,突破复杂数据自动加工、大数据分析、隐性知识显性化等重要环节关键技术,打造了120多个行业平台,确立了数字出版、知识管理、知识服务、信息化教育四大主营产业方向,大力推进面向创新和创新人才培养的精准知识服务。凭借其在知识管理和知识服务领域多年的研究和实践,针对用户科研创新和技术创新过程,2015年CNKI推出基于大数据研究范式的机构知识管理系统(Organization Knowledge Manage System,OKMS),该系统融合机构内外大数据知识资源,提供集知识管理、大数据分析、协同研究、协同创新、项目管理、人才体系构建、科研评价与成果转化于一体的知识创新服务支撑平台。2016年,CNKI基于XML碎片化、增强出版、知识重组、知识网络构建等技术,推出CNKI研究型协同学习平台(简称“研学平台”),提供“阅读、思考、表达、写作”四位一体的深度阅读学习平台,服务于个人探究式学习平台、知识体系构建,以及创新人才培养。
1.5.2 面向需求,实现移动知识服务
2014年CNKI打造了移动知识服务平台《全球学术快报》,收录了中国90%以上的知识资源、2亿多篇外文文献,具备一站式中英文检索、个性化定制、精准推送、热点追踪和流式阅读等功能,为用户创造了一个移动的科研创新环境,使其成为真正的“口袋图书馆”“口袋研学系统”。这个时期,CNKI一方面把各领域事实信息整合起来,使内容资源日益完备,另一方面用人工智能对文献内容与形式属性进行精确的多维度标引,使文献检索结果尽可能精准和完整,情报分析尽可能全面和系统。知识管理平台、移动服务平台与协同服务平台,分别对应知识获取、知识组织与知识创新3个层次的服务,提升了图书馆对终端读者的精准服务能力。
从CAJ-CD立项开始,CNKI就一直坚持自主研发的战略,这成为CNKI发展进程的一大特点。由于多年来坚持不懈地加强技术研发投入,实现多项技术突破,取得大量的技术成果,仅2009-2018年间,CNKI获得专利达200多项。
1995年CNKI自主研究中文信息处理,并成功自主研发中文全文检索技术、中英文混合全文检索技术,解决用户对文献信息和知识获取全面性和准确性的需求。
2002年开始,CNKI尝试把散落的知识通过微观水平上的联系组建“知识网络”,并把关联的知识网络节点称为知网节。CNKI在此基础上自主研发出其核心检索技术——知网节技术,构建了文献知识网络,揭示文献之间的多种逻辑关系;同时为用户提供了集文献信息加工、标引、分类发布于一体的文献自动化管理TPI系统。
2004年,CNKI研发了以自然语言分析技术为核心的技术体系,并发布我国第一套医学专业主题词、分类号一体化标引和智能检索系统。
2006年,基于CNKI知识元抽取和挖掘技术,发布CNKI概念、术语、方法、数值、公式、图形、表格等知识元搜索工具及翻译助手。
2008年,CNKI研制成功基于语义的自适应多阶数字指纹特征检测技术,并发布“学术不端文献检测系统”。
2009年,CNKI研制成功基于读者学习需求驱动的智能推荐技术,并发布“研究型个人数字图书馆”和面向创新的“数字化学习和研究平台”。
2010年,CNKI制定资源国家化战略,提出“深化整合中外资源,服务高端科技创新”,研发了外文本体词库、相关文献关联技术、内容深度挖掘系统等。自主开发NXD(Native XML Database)数据库,全面开展资源的XML化加工,为知识元的动态重组出版提供资源和技术支持。
2011年,CNKI启动知识服务战略,提出决策知识结构5W2H(What、Why、When、Who、Where、How、How About),开发文献碎片化、数据XML化、NXD数据库与动态重组、文献与段落主题标引、5W2H标引、智能问答技术等,为用户提供知识服务和移动化服务。
2012年,CNKI研制成功云出版技术,发布书报刊全流程数字化“腾云数字出版平台”,推出增强出版、数据出版等多种新型出版形态,打通了知识生产、传播全流程。
2015年,CNKI研制成功基于XML的融媒体协同编撰技术,并推出基于大数据研究范式的机构知识管理与协同创新平台。
2017年,CNKI突破检索领域“检全率”和“检准率”不能兼顾、“时间排序”和“主题排序”无法二维兼容的技术难题,实现主题相关条件下按时间排序。
2018年,CNKI研制成功基于世界知识大数据的知识图谱智能构建技术,发布“政产学研大数据融合应用平台”。
综上所述,CNKI核心技术按照技术类型可分为7类,具体见表1。这些核心技术中以智能标引与文献检索技术、知识元自动抽取技术、XML碎片化技术、基于深度学习的超大字符OCR技术和语义相似性检测技术为重中之重。
表1 中国知网CNKI核心技术一览
XML碎片化技术能把文献中具有独立意义的段落分解出来,除独立检索外,还可通过“知网节”关联构成碎片化内容的知识网络,形成比“文献知网节”内容更深、使用更为方便的探究式学习工具。知识元自动抽取技术则是在XML碎片化的基础上,从海量文章中抽取概念、原理、公式和图形等知识元,加以清洗、规范和组织,分类建成各种专业知识库。CNKI在这两种技术基础上构建了XML碎片化加工系统,缩短了资源的结构化加工时间,可以同时标引整刊数据和篇名、作者、关键词、摘要等篇源数据,也能从全文中一次性提取章节、段落以及表格公式,工作人员只需对标引结果进行校对即可。经测试,一本期刊只需20多秒即可完成内容提取,自动标引正确率达到96.5%。该系统在第六届中国数字出版博览会上获得“数字出版创新技术奖”,目前《图片知识数据库》《统计年鉴数据库》都是基于此技术开发。此外,CNKI进一步开发了知识图谱智能构建技术,该技术获得2019年中国国际大数据产业博览会领先科技成果“优秀项目奖”,已应用于贵州省“一云一网一平台”。
基于深度学习的超大字符集OCR技术采用深度学习等人工智能技术,针对包括中文简体、繁体、古籍中大量的异体字、少数民族文字在内的超大字符集,实现高精度的智能OCR,汉字识别准确率可以达到99.95%。采用此技术识别后,其内容无需再进行编改,利用率大幅提高。
语义相似性检测技术是通过计算机自动查找相似文档,发现剽窃行为。其原理是通过计算可疑文档与参照文档之间的相似程度来判断可疑文档是否存在抄袭,通过构建语义网络,在语义空间里计算语义距离来衡量相似度,以判断论文是否重复。
多年来,CNKI依托文献加工自动化技术和中文全文检索技术等核心技术,形成了完整的技术体系和研发体系,不仅为公司产品和服务提供支持,还为包括科研领域在内的各行业提供了信息化的技术、产品和服务,为图书馆知识基础设施提供了强有力的技术支持,加快了图书馆信息化的进程,提升了文献信息化和知识化水平,促使图书馆从传统以藏书为主的信息机构转变为适应社会发展需要的知识服务机构。
2007年前后,国际许多著名期刊几乎消灭了出版时滞[15]。尽管我国互联网期刊出版产业发展增速较快,但大部分仍停留在纸刊数字化后再上网的模式,增加了出版时滞,大大影响了科研成果的首创价值和利用价值,降低了科研人员、期刊的创新竞争力、影响力和国际竞争力。
CNKI一直致力于期刊出版模式革新。1998年6月创办我国第一个电子期刊出版机构——《中国学术期刊(光盘版)》电子杂志社[10],创立了学术期刊全文数字出版运营模式,成为世界上第一个与纸本期刊同步出版的数据库电子期刊。1999年CNKI自主研发了第一代网络出版技术KNS系统,发布了学术期刊“采编发网络平台”1.0、学术研究平台1.0,利用网络打通了我国知识生产、传播、扩散、利用的各个环节。
为缩短并最终消灭出版时滞,提高我国科研成果的首创价值,推动学术期刊出版数字化转型,CNKI建成“学术期刊、会议论文优先数字出版平台”(2008年)、“中国知网学术期刊优先数字化出版平台”(2010年)、“腾云期刊协同采编系统”(2012年)、“腾云期刊数字复合出版系统”(2012年)、“腾云全媒体数字复合系统”(2012 年)。
鉴于学术不端现象愈演愈烈,2006年9月14日,科学技术部审议通过《国家科技计划实施中科研不端行为处理办法(试行)》[27]。2008年,CNKI启动“科技期刊学术不端文献检测系统(AMLC)”和“社科期刊学术不端文献检测系统(SMLC)”的研发。2008年12月,学术不端监测系统正式上线,达到大规模实用化的成熟程度,系统采用自适应多阶段数字指纹特征对PDF、CAJ、DOC、TXT等格式文件及其压缩包进行检测,以《中国知识资源总库》和Springer、Taylor&Francis期刊数据库、互联网资源、优先出版文献库、互联网文档等资源作为对比库,依托文献和图表相似性开展重复率表征和检测,具备文献检测、黑名单管理、问题文献管理、检测报告自动生成、原文在线检测比对等多项功能,仅需几秒钟就可以完成一篇学术论文的检测工作。
期刊编辑部使用学术不端检测系统可快速检测编辑部来稿和已发表的论文是否存在学术不端问题。不仅如此,学术不端检测系统还在学位论文管理、科研项目立项验收、职称评审等方面充当重要角色,能有效提高学术出版的文献质量和科研队伍的基本素质,促进学风建设。
2017年10月16日,CNKI联合436家学术期刊编辑部发布“学术论文录用定稿网络首发联合公告”,启动网络首发模式,将已经同行评议审定、编辑部录用的文章先在学术期刊平台上第一次发表,再进行纸版印刷,进一步提高了我国学术科研成果的发表时效。2017年7月11日,《中国学术期刊(网络版)》出版传播平台(CAJ-NP)发布,打通了编辑出版、作者服务、网络传播、读者应用的全流程,实现了知识生产、管理、传播、扩散、利用的各环节与过程全覆盖。网络首发能加速科研成果的生产力转化;对于保障作者首发和原创权益,提高科技期刊的品牌价值和学术影响力具有重要意义[27]。这一系列平台和系统,不仅打通了期刊出版的上下游,优化数字化出版流程,提高了期刊出版的时效性和影响力,而且意味着我国初步实现期刊由传统印刷模式向数字化模式转型,对于推动我国数字图书馆进程具有重要作用。
4.1.1 坚持自主研发核心技术,符合国家战略
CNKI始终坚持自主研发核心技术,一方面能确保技术的可控性,及时提升技术能力和水平,更快、更好地满足用户迅速增长的功能、性能需求,提高产品服务质量和用户满意度,保证公司长远发展;另一方面能保持我国数字出版与信息服务产业的独立性和国际先进性,符合国家发展战略。
4.1.2 对图书馆资源数字化贡献巨大,推动图书馆地位变化
CNKI不断提升对读者的精准服务能力,促进图书馆从知识获取、知识组织与知识创新三个层次为读者提供服务。早期CNKI顺应了文献资源数字化的发展趋势,不仅丰富了馆藏资源,解决了馆舍紧张的问题,提高了图书馆服务质量和参考咨询服务水平,而且其期刊统计评价功能为图书馆采购印本期刊提供了依据,使有限的购书经费发挥最大作用。后期CNKI通过出版平台与图书馆的深度融合,把图书馆从传统角色定位发展成适应社会发展需要的知识服务机构,不断推动图书馆地位的变化。
4.1.3 革新数字出版模式,加速科研成果传播
CNKI关注期刊出版模式的变革与技术进步,打通了期刊出版“采编发”全流程,推动我国期刊由传统印刷模式向数字化模式转型;注重学风建设,研发学术不端检测系统,确保学术成果质量。率先提出优先出版、网络首发等出版方式,不仅加速科研成果向现实生产力的转化,而且有利于保障作者首发和原创的权益,提高期刊的品牌价值和学术影响力。
4.1.4 推动知识生产与传播的上下游产业链融合发展
从服务科研、服务读者、服务创新的意义上讲,出版与图书馆的目标是一致的,利益是相关的,是唇齿相依、生死与共的关系。CNKI努力破解数字出版产业化发展难题,积极探索符合我国国情的数字出版与数字图书馆融合发展产业运营模式,为从根本上解决数字出版与传统出版、数字出版与数字图书馆在生与死、价值与价格等方面的矛盾开辟了新的发展途径。
4.1.5 坚持依法合理解决版权问题,构建健康的产业发展生态
从1995年创办伊始,CNKI即以高度负责的态度认真解决版权问题,不惜成本与全国数以万计的各类机构和组织签订合作协议,并通过这些机构取得作者授权,每年结算和支付著作权使用费,并免费提供个人使用的检索卡。这在当时环境下十分难能可贵。此后20多年CNKI始终坚持此项版权策略,对构建我国数字出版与数字图书馆的良好产业生态、保证上下游健康可持续共同发展起到了极为重要的作用。
文献数据库作为新生事物给图书情报界带来众多便利的同时,其发展和服务模式也存在一些弊端。CNKI作为文献数据库行业中的翘楚,在发展过程中也需要不断完善,解决存在的问题。必须指出的是,科学合理的定价、上下游利益的平衡、对作者的良好服务、著作权使用行为的规范与法规等是整个数据库产业链各环节都需要从根本上解决的问题,也是政府需要高度重视和尽快出台相关政策法规的全局性大事。
4.2.1 完善价格体系,方便图书馆精准选购
CNKI拥有丰富的学术资源,其检索、排序、知识关联等研究学习功能优于同类产品,因此深受读者的喜爱。经调研,其在国内外知识资源的深度挖掘、广度整合、高度凝聚以及知识管理与服务系统研发、运维方面持续不断的高投入,是造成其比国内同类数据库价格更高的主要原因。2016年3月北京大学图书馆宣布即将停用CNKI,称“由于数据库上涨价过高,图书馆目前正在全力与对方进行2016年的续订判断”;2016年4月有报道称“CNKI学术期刊数据库价格涨幅每年都在10%以上……”[28]。同方知网副总经理单清龙对笔者表示,经核实CNKI学术期刊数据库2012-2016年价格平均增幅为6.8%,媒体报道提及的用户是误将购买新产品的费用,计算到续订数据库价格之内。虽然个别报道缺乏深入调查或以一概全,有些用户单纯以文献量衡量价格等,但其价格的确给一些图书馆造成较大负担,一直受到图书馆诟病。因此,如何结合图书馆当前情况、地域差别等,制定科学的价格体系是CNKI必须解决的问题,比如以单刊选购的模式使图书馆选购更精准,或区分文献量、适当考虑GDP上涨等因素制定价格等。
4.2.2 上下游利益和各自发展要求还不够平衡
CNKI作为出版产业与图书情报业的桥梁和纽带,应合理平衡上下游利益和各自发展要求,致力于打通知识生产、传播、应用全过程。毋庸置疑,纸质出版的大幅下滑源于数字出版的发展。抛开功能不说,数据库的价格远远低于相应纸质出版物的总价,这是我国学术期刊数据库与期刊出版产业经营相脱离、图书馆纸刊与期刊数据库采购预算机制相脱离造成的消极后果,使整个产业链存在不可持续发展风险。CNKI作为供需两侧的纽带,应积极推动出版传播供给侧、图书情报需求侧的结构化调整,科学建立平衡上下游的商业模式与运营模式,保证我国知识传播服务业的健康稳定发展。
4.2.3 在兼顾各方效益的同时加强对作者的服务
在知识资源采集方面,CNKI通过销售收入分成、保底分成、约定稿酬等著作权使用费制度收录知识资源,通过出版单位、学位授予单位等取得作者授权和支付作者稿酬。这种模式始于CNKI创办的1995年,是解决海量数据库和建设国家战略性知识资源体系的可行与合法之策。目前CNKI每年支付的著作权使用费已超过总收入的30%,但相对于出版者提供的海量文献而言,数字出版给予原出版者的版权回报显然不足以支持出版者以市场主体地位生存和发展,各编辑部在实际履约过程中也存在各种问题和困难。尽管CNKI做了各种努力,包括为期刊免费提供文献服务;为作者提供检索卡;投入大量研发力量开发采编发系统,为期刊转型升级、提高出版质量和作者创作投稿提供服务等,绝大多数以传播科研成果、提升学术影响力为目的的学术文献作者对此给予了理解和认可,但少数作者与CNKI就稿酬问题仍存在争议。近10年来,就这个问题被作者起诉的案件有10余起[29]。尤其是2019年2月翟天临学术不端事件成为舆论焦点后,CNKI也成为社会热点,一些人借此机会讨论CNKI支付给著作权人的稿酬问题[30]。笔者认为,虽然CNKI与期刊编辑部制定了由编辑部向作者支付稿酬的制度,但应对执行情况进行严格监督,彻底规范期刊的作者稿酬制度,消除由此造成的不良影响,并进一步加强对作者的相关服务,更全面地支持作者学术创新国际竞争能力的提高。
CNKI自1995年成立以来始终秉承“为提升我国创新能力与文化软实力服务”的宗旨,致力于国内外优质出版知识资源的开发利用与传播,坚持大数据与互联网条件下的知识生产、传播与利用模式创新,致力于海内外期刊、博硕论文、报纸、会议论文、图书、年鉴、统计数据等文化、教育文献资源的集成化数字出版、传播与内容增值服务及相关软件技术开发。多年来,研发了基于内容的智能碎片化、XML智能标引、协同技术、语义分析、图像处理及检索、数据挖掘、人工智能等自主知识产权核心技术,逐步发展成为我国数字出版、知识服务、信息化教育服务领域的领军企业,以实际行动逐步推动我国数字图书馆事业进程。面对激烈的国际竞争,CNKI自主研发的核心技术对于推动我国自主的科技创新具有重要意义,特别是网络首发模式对于加快创新科技成果转化作用凸显,将有效提高我国的科技竞争力和国际地位。尽管中国知网在发展过程中出现了各种历史遗留或新形势催生的问题,但其对图书馆、出版行业的积极影响却不可磨灭。未来在服务创新和学习创新的目标下,学术文献出版、传播与利用各方共同努力、协同运行,一定能构建更科学、更具活力的合作共赢机制,更好地推动我国图书馆事业的发展。
注释
①2017年12月12日,重庆大学图书馆馆长杨新涯在西南大学举行的“川渝情报研究会”上所作题为《大学图书馆新趋势》的报告中指出,《中国学术期刊(光盘版)》的发布是我国进入数字图书馆时代的标志和里程碑。