叶继元 刘凤仪
(南京大学信息管理学院,南京 210023)
笔者于2018年撰文讨论“如何推动跨系统跨部门的图书馆信息资源共建共享”问题,认为“国家已对信息资源宏观建设与微观管理做出部署,目前最重要的是组织落实”[1]。下面笔者就围绕数字资源,谈谈保障体系重构的管理体制和机制问题的一些看法。
文献资源的共建共知共享问题,在业界已经讨论多年,并在实践方面取得了许多进展。对于近20年日益兴起的数字资源的共建共知共享(以下简称“三共”)问题,目前仍是研究的热点,相关文献不少。例如,有的研究通过调研国内外图书馆文献资源(含数字资源)共建共享现状,“针对数字资源海量化、多样化、内容服务智慧化、获取去中心化、技术智能化、传播泛在化、保存战略化等新特征,分析文献资源实现共建共享在资源数量、规范、存储和服务等方面的挑战和机遇,从政策和资金、资源和技术、理念和信任、机制和沟通等方面提出了开展共建共享工作的相关建议”[2]。有的则提出“进入智慧图书馆发展阶段,图书馆资源建设将突破行业内集成共享的格局,进一步实现对互联网环境下网络原生资源、科学数据、开放存取资源、个人创作资源等多源知识内容的统一加工揭示、自动语义关联和集成管理服务,形成覆盖全网的立体化知识资源体系。同时进一步加强面向互联网阵地的高品质知识资源,特别是中文原生数字学术资源的有效供给,推进知识内容生产、传播、利用环节的融合创新,加快培育集成化、一站式知识协同共享环境”[3]。有的认为“由于数字版权保护的原因,资源可能会按次付费。但是,如果数字资源的规模太小,资源不易管理、维护,也不便提供服务,因此,数字资源大多以大型数据库的形式存在,这就需要有新的共享机制来摊薄资源管理、服务、利用的成本。数字资源的共享是传统图书馆共享机制的延续与发展”[4]。有的认为“面对当前图书馆对其信息服务系统的发展几乎无话语权、系统与数据开发商对数据库和系统垄断,与高校图书馆发展目标和革新信息服务系统的强烈需求严重脱节的局面,高校图书馆需要组成更广泛的、更有效的新型高校图书馆联盟,探索新形势下高等教育文献保障体系建设运营新机制,自主研发信息服务系统,加大自主权和议价权,从根本上改变图书馆,尤其是信息服务系统的发展现状”[5]。有的则提出了“关于国家采购数字资源并免费开放社会利用的建议”,并建议建立4项机制:国家采购数字资源保障机制;国家采购数字资源遴选机制;国家采购数字资源运行机制;国家采购数字资源长期保存机制[6]。引人注目的是,此文作者陈建华并非图书情报学专业人士,原为广州市人大常委会主任,现为全国人大代表。从上可知,数字资源由于其重要性和利用的便捷性,同时其采集、揭示、保存的复杂性、风险性、高费用性,以及网络资源的易逝性和不可再生性等特点,已引起图书情报专业人员和政府管理人员的高度重视,同时可看到,从国家层面成立管理部门,跨系统、跨部门、跨学科解决数字资源“三共”问题已刻不容缓。
2019年出版的由全国科学技术名词审定委员会公布的《图书馆·情报与文献学名词》(以下简称“《名词》”)一书中有以下定义:“数字资源是指以数字形式存取、发布和利用的各种文献、数据等资源的总称”[7]。数字资源不仅是指数字化的公开正式出版的图书、报刊,也是指重要机构自己产生出的尚未公开出版的科学数据、方案、报告以及活动、利用这些资源所产生的资源等。各行各业均产生数据或数字资源,包括各种数据库、机构库、开放获取(Open Access,OA)资源等。
电子资源这一术语未被《名词》收录,仅出现“电子出版物”。但电子资源一词被经常使用。实际上,电子资源的内涵更加宽泛,不仅包括数字资源,还包括视听资料,如早期的电子书和电子刊等。相对来说,数字资源的概念较新,而电子资源(电子出版物)的概念在早期计算机应用时就已存在。数字技术出现后,提及数字资源的比较多。据笔者团队对公共图书馆、大学图书馆网站中这两个术语使用情况的统计发现,公共图书馆使用数字资源这一概念较多,而大学图书馆通常使用电子资源。当在同一文本中数字资源和电子资源两者同时出现时,二者内涵上需要加以辨析;若非同时出现,两者在界定上不会有太大差别,通常可以互用。
文献信息资源、文献信息或文献资源包含印本资源和数字资源。如《中华人民共和国公共图书馆法》中规定,文献信息包括图书报刊、音像制品、缩微制品和数字资源等。又如“中国高等教育文献(资源)保障系统”,这里的“文献(资源)”既包含印本资源,也涉及数字资源。
信息与数据是图书情报学、信息科学、计算机科学等学科的两个基本术语,是构成学科的核心概念或范畴;信息与数据的本质,近年来除图书情报学外,法学、信息哲学等学科的一些学者也在积极探讨。在近期刚颁布的《数据安全法》中,数据是指任何以电子或者其他方式对信息的记录。数据是记录信息的,还有其他非电子等方式记录信息的。国家颁布的《个人信息保护法》中指出,个人信息是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息。但近期出台的《深圳经济特区数据暂行条例(草案)》,使用“个人数据”,而未用“个人信息”的概念,说明在立法部门,对信息与数据关系的理解尚未取得共识。
笔者于2017年曾发文讨论信息与数据的逻辑关系和DIKW概念链模式的局限性问题,对概念链提出了修正方案[8]。笔者认为,信息是所有事物的存在方式和运动状态的反映,即本体论信息,它无处不在,无时不在,有的已被人类所认识,有的则尚未认识。已被认识的信息是认识论信息。数据是通过声音、语言、体态、符号、文字、信号、图形、视频反映的认识论信息。它仅是认识论信息中一种类型,包括“有意义、有价值、有关联”的数据(狭义的信息)和暂时没有意义、价值、关联的数据。数据是信息的子集,更准确地说是认识论信息的子集。在DIKW概念链中的“信息”却是数据的子集,实际上,这里的“信息”非广义的本体论或认识论信息,而是狭义的信息,即有意义、可用的数据。修正的概念链可为“本体论信息-认识论信息-数据-狭义信息-知识-智慧”。当文本中出现“信息”一词时,结合上下文(语境),分析其是广义还是狭义的含义,对正确理解信息与数据的关系至为重要。
进一步追问,可能还存在一些问题。如信息与数据、信息与文献一般认为它们都是从属关系(如信息资源包括文献资源),但仔细考虑似乎交叉关系更为恰当,因为文献是载体,数据是记录在载体上的部分信息。从图书情报学科来看,文献是记录以知识或者准知识的信息为主的一切载体。近年来ISO有关文献的各种标准中,题名都修改成“信息与文献”,这里的信息,应理解成非知识或准知识的信息,才说得通。
“保障体系”不仅是储备体系,而且是开发、利用体系。文献覆盖与文献总量相关,而文献保障不仅与覆盖相关,而且与用户需求相联系。“重构”指在原有基础上根据新情况重新设计,不是凭空构建,而是“有中生新”的创新。数字资源的内容无变化,变化的是载体形式和技术手段,从这个意义上说,重构不是颠覆性的,主要是技术层面的应用和改进。如果认为新技术不仅是“工具理性”,而且是“本体理性”“认识理性”,那么将“重构”理解成颠覆性的构建,从这一点上说,也是可以理解的。“管理体制”是指组织构架、组成方式、手段、办法等,是一个有机系统,其核心是管理机构设置。“机制”则是指体系内各要素间的相互作用、运作方式等。
我国一直以来对数字资源在内的信息资源保障非常重视,陆续组织和建立了“三大系统”的保障体系,如文化部的国家数字图书馆工程、数字图书馆推广工程,目前又提出了建立“全国智慧图书馆体系”的设想。“2019年4月,国家图书馆启动了互联网信息战略保存项目,在新浪建立了首个试点基地,对新浪全平台内容进行系统保存”[9]。
科技部联合财政部等六部门牵头组建的国家科技图书文献中心(National Science and Technology Library,NSTL),21年来,逐步在全国建立了40个服务站,30个面向高校的用户管理平台,40个面向集团用户的嵌入接口。每年订购印本外文期刊17 000余种,其中国内独家超过6 000种,订购外文会议录等文献8 000余种。开通各类数据库127种,涵盖网络版外文现刊2万种以上,回溯期刊3 000余种。每年NSTL订购的外文电子资源使用量超过6 000万篇,按我国研发人员350万人全时当量计算,每年为科研人员提供外文文献人均17篇。每年基于印本文献提供原文服务120多万篇,形成了覆盖全国的科技文献服务体系[10]。
教育部的中国高等教育文献保障系统(China Academic Library & Information System,CALIS)以及下属的中国高校人文社会科学文献中心(China Academic Humanities and Social Sciences Library,CASHL)、大学数字图书馆国际合作计划(China Academic Digital Associative Library,CADAL)、高校图书馆数字资源采购联盟(Digital Resource Acquisition Alliance of Chinese Academic Libraries,DRAA)等,22年来,这些系统平台已建立印本资源和数字资源的共建共享系统,1 300多家成员馆从中获益。“CALIS还开创和建立数字资源集团采购模式,并通过年度数据库培训周规范和指导高校图书馆的外文数字资源深化利用”[5]。
总体看,各大体系在印本和数字资源建设方面均有十分突出的成绩,在各自系统内均取得了重大进展,作出了重要贡献,在数字资源保障和满足人们数字资源需求方面正在探索新的发展路径,推出新的方案,进行积极的改革。
(1)数字资源定价越来越高,种类和数量逐年增加,图书馆采购经费相对不足。2020年《政府工作报告》强调“各级政府必须真正过紧日子”,图书馆需开源节流,贯彻落实“过紧日子”部署,很多图书馆面临经费缩减的问题。图书馆采购经费的增长赶不上数字资源上涨的幅度。
(2)数字资源的覆盖面不清,较大规模的全国性用户需求调查长期未做。数字资源覆盖面、保障率的顶层设计很薄弱,仅在宏观层面有所考虑,但跟实际业务相关的还不够。
(3)数字资源的揭示不深、不准、不快、不统一,各馆对数字资源的统计及其数据质量控制这一非常重要的基础工作做得不够好。缺乏全国性数字文献利用统计平台和动态更新数据库等。数字资源的利用数据统计不全,直接影响了采购决策的制订。此外,《国家信息化发展战略纲要》中提及我国信息资源开发利用不足与无序滥用的现象并存,这在数字资源保障中也是个重要问题。
(4)数字资源合作长期保存尽管已开始布置,与国外出版商也签订了一些长期使用协议,但从总体看,还没有从战略的高度对数字资源长期保存进行规划和设计,经费投入不够,措施不得力,高校数字资源长期保存仅占比60%。全国性数字资源战略储备库尚未建立。
(5)各类公共性、基础性数字资源开放总目录尚未编制,存量的开放全国联合目录报道不及时。各类型数据库的总目录及其子目、数字资源在内的信息资源每年增量的协调目录、纸电数资源统一目录、重要数字资源目录等尚未编制或连续报道,“家底”不清。
(6)组织保障薄弱,缺少一个强有力的全国性跨系统、跨部门、跨学科、跨地区的常设领导班子。以往国家成立过跨部门的图书情报协调委员会,如全国部际图书情报工作协调委员会文献资源专业组,尽管召开过会议对相关议题进行探讨,但因成员变动等因素,且近年来似乎没有活动,效果不大,不了了之。全国性跨系统、跨部门、跨学科、跨地区统一的图书馆数字资源共建共享的协调薄弱,且进展不大。尽管NSTL与CALIS有文献传递协议,二者与国家图书馆、上海图书馆也有一些合作,但开展的实质性协作并不多,成效不明显。
国家对信息资源建设已有总体设想:“要加强顶层设计和系统规划,完善制度体系”“加强信息资源规划、建设和管理。推动重点信息资源国家统筹规划和分类管理,增强关键信息资源掌控能力。完善基础信息资源动态更新和共享应用机制”“建立公共信息资源开放目录,构建统一规范、互联互通、安全可控的国家数据开放体系,积极稳妥推进公共信息资源开放共享”“加强采集管理和标准制定,提高信息资源准确性、可靠性和可用性”[11]。目前亟需贯彻落实国家层面的信息资源建设总体设想,增强各单位的责任感、使命感和紧迫感,加强各区域、各单位、各部门之间的密切联系和统筹协作,切实解决信息资源建设过程中的“难点”和“痛点”,能拿出应对方案,积极推动各项信息化政策的执行与落实。
早在1957年就有《全国图书协调方案》,在国务院科学发展委员会下设立“图书小组”,进行统一管理。北京图书馆(中国国家图书馆前身)和上海图书馆为第一、第二中心图书馆在协调中发挥了很大作用。一些知名的图书馆学专家积极参加。主要负责采集资源分工、资源调拨,如北京图书馆侧重外语文献、一般科技文献的收集,而中国科学院等则收集专门的科技文献;北京图书馆负责编制各类型书刊的联合目录,制定标准、规范,开展馆际互借、培训干部等,掀起图书馆事业发展的一个高潮[12]。
20世纪90年代,笔者与同行组织全国高校外文期刊订购协调网,除高校图书馆参加外,北京图书馆、上海图书馆等公共图书馆,中国科学技术情报研究所(中国科学技术信息研究所前身)、中国科学院文献情报中心等都主动、自愿参加高校的协调会议。相关工作为外刊采购节省了大量经费,经济效益明显;同时培养了一批资源共建共享的专业人才,社会效益也非常显著[13]。这说明各个系统的图书馆对跨系统的协调、协作是非常愿意的。目前新技术的发展为跨系统、跨部门共建共享的管理工作提供了良好的条件,馆员素质也有很大提高,理应能做得更好,关键是要有精心的组织和管理。
因此,数字资源保障体系重构,目前最重要的是要组织、落实管理体制改革,设立管理机构。建立跨系统、跨部门、跨学科、跨地区的全国统一的“信息资源管理协调机构”(常设机构);或在中央国家安全领导机构下设立专门机构,或在国家网信部门基础上扩大权限,不论什么名称,关键是要常设机构或建立联合协调机制。除行政领导外,专家委员会至关重要,要有专家委员会(学者、图书情报专家、技术专家)和具体办事机构。学会、大馆(中心图书馆)可发挥更大作用;下设各系统的联盟、地区中心和基层单位,应统一规划,联合保障,分工、分类、分级保障。
(1)国家统一摸清数字资源现状。长期以来,我国信息资源开发利用不足与无序滥用的现象并存。我国幅员辽阔,各区域信息保障体系发展不平衡,资源配置失衡,调查能力参差不齐,不利于资源调查工作的展开。避免因工作能力和特点的差异造成的波动,要求从国家层面出发摸清现有数字资源,并统一规划开放的各类联合目录、分级目录等的编制等工作,以便后续各个体系联手展开工作,提高总体效益。
(2)每年定期召开全国数字资源订购协调会议,扩大资源种类,减少不必要的重复。现存数字资源数量多、种类杂,各领域、各学科对于范围内资源重要性的判定莫衷一是。各单位应联合专家,对数字资源进行分类。公共性、综合性、基础性数字资源,即三大系统或面向全国的读者的一些资源,应由国家统一评选、采购,实行“国家许可”制度,以最大限度的节省经费和利用面。而非公共性资源,各系统、各部门、各图书情报机构所需要的个性资源仍然需要采集。要明确资源建设不仅是本单位的事情,更关乎国家战略的发展。针对各单位某些特色资源,也要落实分工负责的原则。
(3)加快制定数字资源揭示的各类标准、规范。对于数字资源建设而言,统一标准、规范的缺失是亟需解决的问题。尽管基层单位不断出台各类规范文档,但工作量大,效率、质量得不到保障。我国信息资源建设人才济济,关键要分工负责、合理规划、确定目标、选好或制定各类标准,从而让各馆、各体系快速找准自己的位置、规范工作流程、发挥整体优势。
(4)采集统一的数字资源利用数据。数据不仅关系到第二年的采购决策,也关系到科技文献、学者、期刊乃至大学的评价等。采集、清洗和规范统一的利用数据,在目前高校已有数据基础上扩展到科研和文化等系统。
(5)统筹使用数字资源经费。随着数字资源发展的日益成熟,使用量不断提高。数字资源建设要求长期可靠的持续服务,网络使用权模式时刻威胁着数字资源使用的可持续性。因此,国家要统筹划拨经费,将OA论文发表经费与订购经费合理预算,统筹使用数字资源经费,统一实施对公共性、综合性、基础性数字资源的长期保存和利用。专业性、地区性、特色性的数字资源仍由各单位长期保存。要明确长期保存的责任,促进流程推进和技术完善,提高长期保存率。
(6)建立统一数据安全应急预警、处理机制等。重构数字资源保障系统,必须把数据安全放在突出位置,制定对敏感的数字资源和利用数据的信息的保护办法,定期发布“掠夺性数字期刊”“伪劣数字期刊”或网站、数据库的预警目录,对重大数据安全事件及时调查处理,健全相关法律法规,不断提升数据安全意识和能力。
后疫情时代、逆全球化情势、其他信息机构的发展等都对图书情报机构提出了挑战,但国家科教兴国、建立创新型国家、大力发展数字经济等战略,人脑机、万物互联等新技术的发展,又给我们带来了机遇,我们一定要及时紧紧抓住机会,主动迎接,团结一致,群策群力,加快重构我国包括数字资源在内的文献信息资源保障体系,为我国的伟大复兴和人类福祉贡献图书情报人的一份力量。