我国科学数据网络管理平台建设现状研究

2020-05-07 05:39原顺梅
科技和产业 2020年4期
关键词:网络管理陕西省数据中心

原顺梅, 赵 贤, 乔 振

(山东省科学技术情报研究院, 济南 250001)

科学数据是当今时代开发利用潜力巨大的基础性战略资源,是推动国家科技创新发展和经济社会发展的重要驱动力。对他人数据的重新使用可以推动新的研究问题和产品,并激发新的科学发现[1]。对科学数据进行有效的管理可以在使用数据时更好地发现和理解数据,避免不必要的重复,带来更多的协作和研究进展[2]。国务院于2018年出台《科学数据管理办法》[3],明确提出了科学数据各级管理部门的工作职责以及科学数据的采集、汇交、保存,共享与利用,保密与安全等内容。办法提到,国务院科学技术行政部门主要职责之一是负责国家科学数据网络管理平台建设和数据维护。并在第十条规定:科学数据中心是促进科学数据开放共享的重要载体,由主管部门委托有条件的法人单位建立。笔者认为,建立地方科学数据网络管理平台是各地方开展科学数据中心建设的重要方面和实现科学数据共享的必要途径。本文对我国和地方科学数据网络管理平台的建设情况进行了初步调研,并对各省科学数据平台的建设提出了几点建议。

1 国家层面科学数据网络管理平台建设情况

从中央层面看,自2004年起,科技部、财政部先后在基础科学、农业、林业、海洋、气象、地震、地球系统科学、人口与健康等领域支持建成了国家科技资源共享服务平台,这些平台持续进行了科学数据的汇交[4](平台具体名称详见表1)。

此外,在科技部与财政部的共同推动下,国家科技资源共享服务工程技术研究中心负责建设并维护中国科技资源网,该网站是国家科技基础条件平台的门户网站,于2009年9月开通。网站划分9个板块,分别为仪器设备、自然资源、科学数据、科技成果、科技文献、实验基地、科普资源、检测资源、实验动物。其中,科学数据板块又分为地球系统科学数据、人口健康科学数据、林业、农业、气象、地震、交通、海洋、先进制造与自动化9大类别。点击各个类别均可看到若干数据库及其关键字、描述与服务单位等标识。随后点击各数据库名称后均可出现资源类型、服务单位、通讯地址、联系方式、资源描述等简介,用户可在登录网站后购买或申请资源。目前科学数据总量为13 975条。

2018年3月,国务院办公厅印发《科学数据管理办法》,提到由国务院科学技术行政部门“负责国家科学数据网络管理平台建设和数据维护”。

表1 国家层面科学数据网络管理平台名称列表

2 省级层面科学数据网络管理平台建设情况

从网络调研情况来看,在省级层面,建设科学数据网络管理平台时间最早的省份是陕西省。而自国务院办公厅2018年印发《科学数据管理办法》以来,最早布局科学数据建设的省份是贵州。江苏、重庆、广东和吉林在科学数据网络管理平台的建设方面均有所部署或进展。

2.1 陕西省建设情况

在科学数据建设方面,陕西省自2005年即建设有1个门户网站(陕西省科学数据共享服务系统)、2个数据中心(陕西省科技管理数据中心和陕西省地矿数据中心)以及3个专业数据库(分别为金相图谱数据库、X射线衍射单晶指标数据库、省微生物菌种数据库)。后对门户网站进行升级,进一步完善了目录查询、数据检索、功能服务三大模块的功能,新增若干数据中心和专业数据库。网址为http://www.snsd.gov.cn/Portal,新门户网站的全称为“陕西省科学数据共享服务平台”。栏目设置为综合新闻、数据搜索、数据汇交、国际资源、热点专题、科普资源。

数据库资源包括科技管理数据、生态环境数据两个领域的至少15个专题数据库集,以及包含石油钻井、微生物菌种资源等在内的14个专题数据库集。各个数据库按学科分成10个大类,分别为:生物学、农学、基础医学、中医学与中药学、工程与技术科学基础学科、自然科学相关工程与技术、矿山工程技术、纺织科学技术、交通运输工程、管理学。数据库多数都能提供关键词、摘要、目的、数据库格式、质量说明、时间范围等简介内容以及数据集联系方式(联系人姓名、邮箱、单位、电话、传真、地址、邮编)。用户可根据访问权限享受在线浏览下载或离线服务等。

其中,科技管理数据集包括陕西省科研机构库、科技成果库、项目库、科技人才(科技专家)库、科技产品库、科技法规库、科技服务机构库、科技指标、科技进步考核指标等,具体收录范围见表2。科技计划项目数据库主要分为省科技研发计划、科技统筹创新工程计划(2014)、重大科技创新专项资金计划项目(2004—2014)、承担的国家科技计划(2011—2014)。

表2 陕西省科技管理专题数据库集收录范围列表

续表2

类别收录范围科技成果数据库以陕西省科技成果审查登记管理办公室的历年科技成果统计数据为基础,收录了2000—2012年全省通过省市部委鉴定、科技计划项目验收、行业准入、新产品认定等相关技术评价,被认定为省级科技成果的相关信息。科技奖励项目数据库以《国家科学技术奖励公报》和《陕西省科学技术奖励公报》为依据,收录了1987—2013年陕西省获得国家科学技术奖励及陕西省科技进步奖励的成果。科技人才数据库在陕两院院士及部分研发机构、高校和企业的国家级勘察设计大师、享受国务院津贴人员、国家级有突出贡献中青年专家、省级有突出贡献的专家和“新世纪三五人才工程”选拔的第一、二层次人员等高层次人才的相关信息。高新技术企业数据库以陕西省高新技术企业认定统计结果为基础数据,收录了2005年以来,从事高技术、新技术成果的研究与开发、高技术产品的生产经营、独立核算或相对独立核算,科、技、工、贸一体化,经过省科技厅认定的陕西省高新技术企业信息。科技法规数据库2000年至2013年全国人大、国务院和科技部、其他相关部门以及我省发布的与科技相关法律、法规、政府规章、政策性文件、规范性文件。科技进步考核数据库2001—2010年陕西省下辖县(市、区)基本情况、科技进步工作领导与管理、科技促进经济社会协调发展、科技发展等4类指标。科技统计分析数据库2004年—2013年基于陕西省科技统计分析工作的各类分析报告,涉及科技研发投入、科研产出、科技环境、科技进步监测等领域。

近日,经向陕西省科技情报研究院有关人员电话调研,得知该“陕西省科学数据共享服务平台”的数据库内容已于2017年全部移交至陕西省科技云平台(全称是陕西省科技管理服务一体化云平台),科学数据成为科技资源栏目下设的一个板块(其它板块分别是科研仪器、科技企业、科技人才、科技成果、检验检测能力、园区基地、科技文献等)。目前,该板块主要由25个数据库组成,详见表3。继2018年国务院出台《科学数据管理办法》之后,该省出台了《科学数据管理实施细则》,但科技厅尚未就下一步的工作提出明确部署和分工。

2.2 贵州省建设情况

从网络调研情况来看,在省级层面,自国务院办公厅印发《科学数据管理办法》以来,最早布局科学数据建设的省份是贵州。该省不仅把科学数据中心建设写入2018年省政府工作报告,而且将其作为本届政府的九方面工作之一。更重要的是,贵州省科学数据中心不只是一个网络平台,还有线下的实体。在线下实体建设方面,据有关报道,贵州省科学数据中心建设已进入规划设计讨论阶段,该项目由贵州省科技信息中心、省规划设计院建筑一所负责,将设有超算中心、生物医学大数据中心、SKA数据中心、遥感数据中心、科技文献数据中心等。目前具体的投资金额和建设周期尚未找到公开资料。在网络平台建设方面,据相关报道,2018年4月,贵州省科技厅与华为技术有限公司就贵州科学数据中心建设工作中存在的技术难点问题进行商讨。

表3 陕西省科技云平台科学数据板块数据库列表

2.3 江苏省建设情况

2019年初,江苏省委书记、省委全面深化改革委员会主任娄勤俭主持召开省委全面深化改革委员会第五次会议。会议审议省委深改委2018年工作总结、2019年工作要点和3个改革方案。其中提到要“加快推进省科学数据中心建设”。这是江苏省委、省政府首次公开提出建设省一级的科学数据中心。但并未明确提出是建设线下实体还是网络平台。

2.4 重庆市建设情况

除贵州和江苏以外,重庆也明确提出建设科学数据中心。2019年1月28日《重庆日报》报道[5],重庆市科技局相关负责人表示,将建设科学数据中心平台门户系统,用于科学数据信息发布和网络管理,实行市科学数据中心、行业主管部门科学数据分中心、有关单位科学数据库等多级管理,按照统一的数据规范和管理标准,推进各行业科学数据资源共享。

2.5 广东省建设情况

广东省于2018年11月创建科技数据开放应用平台,集中发布科技项目和创新机构方面的数据信息。网站划分为四个板块:科技项目、创新机构、数据统计和数据解读。其中,科技项目和创新机构板块的字段名、时间跨度及目前数量等收录信息详见表4。数据统计板块暂无实质内容。数据解读板块无自建内容,点击“数据解读”后直接链接到广东省科技厅网站政务公开栏目的“数据解读”子项,内容的时间跨度为2018年8月至12月。

表4 广东省科技厅科技数据开放应用平台收录信息列表

2.6 吉林省建设情况

吉林省科学技术信息研究所分别于2018年9月、2019年3月发布吉林省科学数据平台建设项目公开招标公告,预算金额分别为225万元[6]和175万元[7]。2018年10月中标公告显示,中标公司为长春某科技公司,中标金额为222.8万元[8]。

总之,从以上网络和电话调研情况来看,各省科学数据平台建设程度不一,多数省份尚未开始建立科学数据网络管理平台,贵州、江苏、重庆和吉林处于初建状态,仅陕西和广东在科学数据平台的建设方面已具备一定的规模。另从国家和陕西、广东相关平台对科学数据的分类板块可以看出,对科学数据涵盖面的认识也不尽相同。

3 问题分析及对策建议

3.1 问题分析

3.1.1 科学数据涉及面广,数据源的确定与分类难度较大

国家层面对省级科学数据平台的建设尚无统一规划,大多数省份需要自已摸索,可借鉴的经验较少。科学数据涉及面广,体量大,数据源的确定、数据分类、平台功能等均需要经过全面深入的考虑与筹划,难度较大。

3.1.2 标准体系不易建立,制约了省级平台建设工作的开展

科学数据管理须建立一定的标准体系,包括指导标准、通用标准和专用标准,每一类标准都包含了丰富的内容。而科学数据涉及领域较多,每一个领域均要制定领域标准规范,对于已有国家标准的如林业、气象、地震等领域的可按国家标准执行,而对于没有国家标准的,则需要各省根据实际,分领域制定科学数据的标准规范。标准规范体系不易建立,在一定程度上制约了省级平台建设工作的深入开展。

3.2 对策建议

科学数据网络管理平台的建设涉及到方方面面,包括开发或采用有效访问和存储大量科学数据集的技术和工具等等[9]。首先要做好数据源及数据分类的确定工作,其次要综合考虑平台具体要实现哪些功能,此外还要制定元数据标准等。

3.2.1 数据源

在平台网站开发之前,首先应做好顶层设计,明确数据源。除了要明确科学数据包含哪些方面的数据,还要考虑哪些数据可以在科学数据平台上共享。鉴于从中央到地方,多个行业如农业、地震、医药卫生等等领域已经有建好的科学数据共享平台,暂时可以考虑在各省科学数据网络管理平台上提供接口进行链接访问。因此重点要考虑各省科研领域的科学数据情况。大致来说,一般应包括省级科技计划项目、科技人才、科技奖励、科研档案、高新技术企业、主要科技统计指标、科技成果及转化、科技政策与法规、科技文献、其它科技基础资源(包括大型仪器、种质资源、实验动物等)等方面的相关数据信息。

3.2.2 数据分类

数据分类既可按照《科学数据管理办法》中相关描述,将科学数据分为基础研究数据、应用研究数据、试验开发数据、观测监测数据、考察调查数据、检验检测数据等;也可依据《科学数据共享工程技术标准》之《科学数据共享工程数据分类编码方案》,将科学数据划分为基础科学、资源环境科学、农业科学、工程技术科学、人口健康科学和区域与综合领域六个门类;此外还可以依据《中华人民共和国学科分类与代码国家标准》(GB/T 13745—2009),分为自然科学类、农业科学类、医药科学类、工程与技术科学类、人文与社会科学类五个门类。

3.2.3 平台功能

科学数据网络管理平台主要包括用户管理、数据管理、数据服务三大功能[10]。用户管理功能除用户注册、用户登录功能外,还要进行用户权限管理(即为用户设置不同的操作权限与访问权限),如哪些用户可以提交数据、哪些用户可以下载数据、哪些用户可以浏览等等。数据管理功能主要包括科学数据的汇交、审核、发布、共享等功能。数据服务功能包括目录查询、简单检索与高级检索、浏览与下载等。此外,为给用户提供更好的服务,应考虑提供数据定制、数据挖掘、可视化分析等增值服务。由于科学数据网络管理平台除科研领域科学数据以外,还为气象、人口与健康、地震、林业等行业领域科学数据提供接口,因此,要考虑统一检索问题,实现跨库检索。

3.2.4 元数据标准

元数据按类型可分为描述元数据、结构元数据、管理元数据和技术元数据[11],考虑到对科学数据的可检索性要求,无数据标准的元素选择以描述型居多,如科学数据的名称、作者、提交或发表时间、所属数据库等;其次是管理元数据(如是否免费获取、用户权限等)、技术元数据(包括元数据保存格式和软硬件需求等)。至于元数据等标准的制定时间,由于平台研发过程需要遵照此类标准,因此标准最好在研发平台开发前确定。如果所开发的平台定制性较好,也可同步进行,在平台上线的时候按元数据的标准进行初始化。

猜你喜欢
网络管理陕西省数据中心
数控机床DNC网络管理平台在智能制造中的应用
浅析数据中心空调节能发展趋势
“翻转课堂”教学模式在《Windows网络管理》课程中的应用
关于建立“格萨尔文献数据中心”的初步构想
基于OpenStack虚拟化网络管理平台的设计与实现
陕西省抓党建促脱贫攻坚的实践与思考
聚焦两会
陕西省青年书法家协会
2017第十届中国数据中心大会榜单
陕西省阅读文化节