李宗俊 陈文杰
(1.四川大学公共管理学院,四川成都 610064;2.中国科学院成都文献情报中心,四川成都 610041)
在《科技平台标准化工作指南》[1]中,科技资源被定义为用于科技活动的人力、物力、财力以及组织、管理、信息等要素的总称。目前在科技平台标准化工作中,科技资源主要指研究实验基地和大型科学仪器设备、自然科技资源、科学数据、科技文献、科技成果、网络科技资源以及科普资源等。科技资源对科技产业和区域经济发展起到支撑性的作用。从面向科技创新活动的服务支撑角度看,科技平台上的科技资源可统称为科技服务资源。随着信息经济和知识经济的快速发展,具有人才智力密集、科技含量高、产业附加值大、辐射带动作用强等特征的科技服务业日益受到重视,这对我国推动科技创新和科技成果转化、实现科技创新引领产业升级、深入实施创新驱动发展战略等方面具有重要意义[2]。科技服务开展过程中所需要的科技资源呈现日益增长的发展态势,但是科技服务资源分散、集成化不高、服务效率较低的问题也日渐突出。科技服务资源需要进一步的互通与集成,更加高效地服务于科技创新。
在一定区域内推动科技服务资源开放共享是目前加强资源利用的主要趋势,为了提高科技服务资源利用率和降低获取成本,全国部分地区相关部门出台了科技资源开放共享的政策和方针。在共享政策的指导下建立了“长三角科技资源共享服务平台”[3]“京津冀科技资源创新服务平台”[4]和“重庆科技资源共享平台”[5]“成渝城市群综合科技服务平台”[6]等区域性科技资源共享平台,在一定程度上实现了科技服务资源的共建共享。但是综合科技服务平台集成的各类科技服务资源主题与种类差异较大,缺乏相对统一的资源描述机制,互通方面仍存在不同程度的阻碍,科技服务资源的关联化程度还有待深化。
本文面向区域综合科技服务平台建设的需求,针对科技服务资源池中包含的科技资源和数据,讨论科技服务资源集成的互通和关联问题,为提升科技资源利用率和科技服务智配提出对策和建议。
以检验检测和研发设计为主要代表的科技服务已经发展到一定规模,针对科技区域服务平台的科技资源发展规模和共享模式现状进行调研,进一步分析区域科技服务平台上的科技服务资源在互通集成方面的需求和遇到的阻碍。
为进一步提高科技资源服务行业的产值和效能,国家高度重视科技服务资源共享平台的建设和管理,科技部和财政部于2018年2月印发了《国家科技资源共享服务平台管理办法》,其目的是深入实施创新驱动发展战略,规范管理科技资源共享服务平台,推进科技资源向社会开放共享,提高资源利用效率[7]。根据该办法,科研设施和科研仪器等科技资源,按照《国务院关于国家重大科研基础设施和大型科研仪器向社会开放的意见》和《国家重大科研基础设施和大型科研仪器开放共享管理办法》进行管理。我国部分区域已建设了科技服务信息共享平台,且围绕区域建设的科技信息共享服务平台的研究较多,如祝林等[8]研究了我国仪器设备共享的发展历程和现有成果,王洪波等[9]分析了武汉科技信息共享服务平台等。
但是,建成的科技服务信息共享平台还不能满足科技服务资源池建设的需求,实现资源的互通集成仍有阻碍。如每个地区的科技服务类型不尽相同,地区之间的科技服务业规模与水平存在差距,由于资源类型的差异,不同地区的重点领域不同,而在同一个科技服务资源平台中,同一类资源存在不同的分类和描述方法,缺乏统一的描述规范,且科技服务资源种类繁多,涉及不同种类、特征的资源实体,缺乏相对一致的资源描述基础,缺乏关联性和整体化形态。
面对科技服务资源在互通集成上存在的问题,本文引入了计算机科学的资源池概念。资源池是一种资源共享和复用的技术,可视为虚拟化容器,将各类科技服务资源引入逻辑上集中化的资源池中,随需调用、随取随用,目的是降低资源获取成本,提高科技服务资源利用率等。在区域科技服务平台已有基础上,打造科技服务资源池可以实现区域内的科技服务资源合理再分配,降低科技服务资源获取的成本和难度。构建以科技资源为核心的面向综合科技服务的资源池,将区域内的科技服务资源纳入资源池中,并在资源之间建立有机的联系和互通,可以降低区域内科技服务资源获取的难度,促进区域内科技服务资源的共建共享和合理配置。通过对已有科技服务资源池的调查,科技服务资源主要分成5 个组成部分,如图1 所示。
在目前已经建成的各类区域科技服务平台上,科技服务资源大致涵盖5 个部分,分别是技术服务、知识产品、实验器具、科研仪器和科技资讯。技术服务是组织和个人提供的科技服务,涵盖不同的服务类型和方式,同时包括专家智慧和管理经验;知识产品是科技服务依托的信息资源,包括科技论文、数据库、资料库、标准规范和实验报告等;实验器具是开展实验所必须的试剂、耗材、动物等实验中的消耗物资;科研仪器包括实验室环境在内的大型科研仪器设备;科技资讯包括政策法规、科研进展和行业资讯等。这些资源构成了科技服务资源池的主体,在资源集成的基础上实现关联,面向区域建设的科研服务需求单位提供科技服务,能够有效实现资源合理配置,提高资源的利用效率。
科技服务资源池能够发挥其资源互通集成作用的基础是资源池内统一的集成规范。设计资源池集成规范,主要目的是为区域内科技服务资源提供统一的描述标准,为资源池中的资源互通集成提供共通的数据基础架构。
科技服务资源池需要数据规范保障,数据规范在科技资源的互通、集成、共享方面具有重要的作用。资源池集成规范的作用主要有资源描述作用、资源管理作用和资源整合作用。
(1)资源描述作用:集成规范的首要目的即对资源池中的各类科技服务资源制定一个统一的描述标准,通过规范化的标准元素描述,使得每一类资源数据做到规范化、一致化,保障数据结构与格式的准确性,以此为基础进一步管理和整合资源池的资源数据。
(2)资源管理作用:集成规范的制定有助于实现区域内资源池数据的统一、协调和统筹。通过数据规范的描述,可以对资源池内的资源状况进行及时的监管和更新,便于科技资源的重新配置,避免资源闲置和浪费。
(3)资源整合作用:在使用集成规范对资源进行统一描述的基础上,通过数据规范的语义互联实现科技服务资源的有效整合,可以对资源池内的各类科技资源建立联系,真正做到科技资源的互通集成共享,使科技资源与科学研究高效匹配和结合。
图1 科技服务资源的集成与关联图示
科技服务资源池中的资源类型众多,各类资源实体的特征和属性存在较大差异,因此在资源池集成规范设计过程中,为使集成规范发挥最大的效用,应当遵循通用性、标准性、完备性和可扩展性的原则。通用性是指将各类科技服务资源中的共有特点进行揭示和描述,使得资源池集成规范应用范围更广;标准性是指集成规范设计过程中使用一致的标准,包括集成规范的描述词汇、语法、定义等,同时参照和复用已有的数据标准,体现资源池集成规范的标准性;完备性是指集成规范应该对资源实体的各个方面、各种类型尽可能地展开全面地揭示和描述;可扩展性是指资源池的集成规范应该能够适应科技服务资源的发展和变化,依据新兴的服务和资源不断更新自身的描述词汇,保持一定的可扩展能力。
参照元数据基本类型划分[10],可以将科技服务集成规范划分为3 种主要元数据:管理元数据、服务元数据和技术元数据。管理元数据是对区域内科技服务资源的管理,包括科技服务资源池的规模、增长速度、服务现状等情况。通过对科技服务资源情况的掌握,可以起到支持区域科技创新和发展决策的功能。服务元数据是通过该类元数据实现科研需求与科技资源的精准匹配,发挥科技服务资源的使用效率。技术元数据使得检验检测和研发设计服务中的技术得到准确的描述,实现了科技服务资源之间的交换和共享。
在科技服务资源池中进行科技服务资源的集成与关联优化,大致划分为4 个步骤,分别是科技服务资源的实体/属性识别、开放的数据建模、核心元素设计和已有标准映射(关联实现),具体流程如图2 所示。
图2 资源池集成规范设计流程
实体和属性的识别是科技服务资源集成规范设计的第一步,由于科技服务资源池的资源类型多样,如果要对资源进行规范描述,首先需要对科技服务资源池展开调查,熟悉科技服务的主体和业务流程,识别资源池中的实体和属性,按照“实体—属性—关系”的方式对资源进行揭示。实体/属性识别可以通过现状调查、数据获取、实体归纳、属性描述和关系呈现的步骤实现。
在科技服务资源的实体和属性识别完成后,需要对实体和属性之间的关系用数据模型表示。通过数据模型的构建,可以保障数据结构的有效性和规范性,使得科技服务资源池中科技服务资源的逻辑结构清晰、关联关系明确,为科技服务资源适配和调用打下基础。
在数据建模的阶段有多种数据模型可供选择。一是关系型数据库中的逻辑模型E-R图,E-R图是用来表示实体、属性和关系的概念模型。二是面向对象的数据模型UML类图,类是指具有相似结构、行为和关系的一组对象,通过对类及其属性和操作与类之间关系的揭示,可以更加全面的描述资源数据。三是RDF模型,RDF是以资源描述为基本单元的数据模型,每一条科技服务资源描述由资源、属性、属性值三元组构成。使用RDF对科技服务资源展开描述的优势在于灵活可扩展性,在RDF三元组任意位置上进行连接扩展与关联,对科技服务资源的表征进行标准化与统一化。
科技服务资源池集成规范设计的第三步是核心元素设计,将科技服务资源池的开放数据模型中的实体和属性转化成数据规范的核心元素,同时按照元数据元素的特点和功能,将核心元素划分为管理元数据、服务元数据和技术元数据,在此基础之上发挥集成规范的互通集成功能。
为了增强科技服务资源池集成规范的标准性、开放性和可扩展性,推荐使用XML/RDF语法进行描述。用RDFS将数据模型中实体、属性和关系转化为RDF中的类和属性来进行规范。通过RDF框架描述数据,便于向其他数据格式进行转化,进一步提供不同格式的数据获取服务,实现科技服务资源池中数据层面的打通,提高数据的流动性。使用RDF模型设计元数据核心元素提升了数据传播、分享和使用的便捷性和开放性,降低了数据的获取成本,是科技服务资源池资源数据集成共享的重要保障。
在科技服务资源池中,借由各类科技元数据标准的映射与互操作实现科技服务资源的关联。对已有标准的映射可以在科技服务资源池集成规范和已经成熟、使用广泛的数据标准之间建立明确的对应关系,未来可以实现不同资源池、不同系统之间的跨库检索和获取,为用户提供更加便捷的一站式科技服务。在科技服务资源池中,向已有元数据标准的映射主要有以下几种:对于组织机构和个人的描述元素可以向FOAF元数据进行映射;对于网络资源和文献资源的描述可以向DC元数据进行映射;专有科技资源可以经由通用BIBO元数据标准进行基础映射。
根据ISO/IEC 11179 标准所提供的框架可实现元数据标准的语义化映射。映射主要分为3 个阶段:识别元数据标准、数据元素分组和语义映射[11]。结合框架中注册元数据模型与基本属性标准, 对元数据标准语义化描述进行规范化处理, 是实现元数据标准语义化映射的前提条件。本文中有关元数据语义化映射的过程就是依据ISO/IEC 11179 标准, 创建公用数据元素概念,进而实现不同元数据标准间的语义化映射。与此同时,通过语义网、关联数据等技术方法,外融和内引相结合,将科技服务资源向开放数据生态靠拢,形成区域内资源池、跨区域资源圈网的内外联通式综合科技服务资源生态。
在科技服务资源池中,科技服务资源的规范化、集成化与关联化是科技服务资源组织与服务的核心要素,需在区域科技服务平台建设中予以重视和加强。
本文针对区域科技服务资源提升和区域创新发展需要,讨论了科技服务资源共建共享的集成关联问题,提出了建设科技服务资源池。以科技服务资源的元数据规范为基础切入点,以科技服务资源的集成化与关联化作为深化导向,提出了科技服务资源池建设中的科技服务资源集成与关联优化策略,为区域科技服务平台升级改造和提高科技服务资源利用效率提出参考建议。