刘晋元 张贵红 王 茜
(1.上海市研发公共服务平台管理中心,上海 200235;2.复旦大学马克思主义学院,上海 200433)
科技人才指实际从事或有潜力从事系统性科学和技术知识的产生、 促进、 传播和应用活动的人。而高层次科技人才,是指有较高的基本素质、具有较强技术研发和经营管理能力、勇于创新的人才[1],其核心素质包括学术能力、创新实践能力、资源掌控能力与人际关系能力等[2]。在高层次科技人才中,顶尖科学家是核心构成。然而在聚集顶尖科学家方面,根据对全球5000 名科学家的统计数据表明,有1200 名科学家的成果被引率最高,这些高被引科学家基本分布在北美和西欧、日本、韩国[4]。笔者以科睿唯安“高被引科学家”作为顶尖科学家,以2014年至2016年的全球“高被引科学家”名单为样本,通过比较入选各国科学家数量可知,美国入选科学家占比最大,达47.1%~50.1%,约占总量一半,英国次之。中国科学家自2014年入围182 人次后,2015年入围205 人次,2016年达到241 人次,已占总数的7.4%。其中,上海入围科学家由2014年的18 人次增至2015年的21 人次和2016年的24 人次,年均增长率15.5%。在这3年中,上海“高被引科学家”每年入围的人次占全国比例约10%,占全球的比例从0.56%上升到0.74%。2014—2016年,我国曾入选“高被引科学家”共有287 人,其中上海有23 人入选,位列第四,占全国入选科学家总位数的8.0%。
在上海入选的23 人中,其分布在高等院校、科研院所和企业的比例为18:5:0。从入选科学家的研究领域看,全部21 项学科领域中,上海“高被引科学家”主要集中在材料科学、化学、工程学、数学、生物学、植物学与动物学、药理学与病理学等7 个领域,其中材料和化学入选人次分别占上海总入选人次的28%和24%。可见,上海顶尖科学家相对比较集中,在所属机构的多元性、研究领域的覆盖面、来源的国际化等方面还存在短板。可见,高层次科技人才,尤其是顶尖科学家分布是不均衡的。
上海在集聚高层次科技人才方面推出了多项政策,2015年以来,上海先后发布了《关于加快建设具有全球影响力的科技创新中心的意见》《关于深化人才工作体制机制改革促进人才创新创业的实施意见》和《关于进一步深化人才发展体制机制改革加快推进具有全球影响力的科技创新中心建设的实施意见》[3]。上海要实施创新驱动战略,加快建设全球具有影响力的科技创新中心,就需要集聚更多的高层次科技人才,特别是引进和培养世界级的顶尖科学家,形成“人才高峰”。然而,当前需要解决的关键问题是“高层次科技人才在哪里”“什么样的专家才算是高层次科技人才”,这不仅仅需要列出人才名单、基本情况、研究成果,还需要对人才进行特色描述与能力评价。目前国内科技人才数据库,主要用于咨询专家和项目评审专家遴选,为科技人才引进、开发和学术评估等提供全面信息支撑服务的功能较少,尚难以进行统计比对,还不能满足高层次人才开发、利用和管理决策等需求。针对这些难题,上海探索构建了“全球高层次科技专家信息平台”,为政府机构、高校院所和企业提供人才引进、开发、评估与咨询等服务,为上海建设人才高峰提供数据平台支撑。本文拟对上海构建的“全球高层次科技专家信息平台”(以下简称“专家平台”)进行初步分析。
2017年6月28日,由上海市研发公共服务平台管理中心(上海市人才发展中心)开发建设的“专家平台”(http://ges.sstir.cn)正式开通上线。专家平台总体架构包含基础数据层、平台层、应用层3 个层次。基础数据层是以研究论文、国内外专利、项目成果、资讯信息等各类数据为基础,通过打通数据间关联,挖掘聚合专家人才数据,从而建成平台层——全球高层次科技专家信息平台。应用层从专家人才评估评价功能出发,引入专家人才评价指标,建设如智能专家评价系统、人才报告生成系统等服务应用。专家平台主要功能定位是:面向全球范围内的高层次科技专家人才,建立包含专家学者研究论文、专利产出、项目成果、任职机构、合作网络、研究指纹等信息在内的大数据平台,实现信息查询、专家匹配、人才比对和统计分析等功能,为各类机构在人才引进、人才评估、专家评审、数据统计、趋势研究、科技合作等方面提供信息支撑服务。
构建的数据库主要具有以下特点:一是收录的专家国际化。立足国际,在全球高质量的科研成果中进行挖掘,建立了客观的信息数据库。目前收录的海外专家15 万多名,其中海外华人达4万多人,包括所有专家发表在国际期刊上的学术论文,还包括专利申请以及参加国际会议等信息。二是合作机构国际化。在数据库建设过程中,充分调动国内外顶尖专业机构的力量,在数据来源、数据加工、分析预测方面发挥集聚整合、协同创新的作用。三是评价指标国际化,在对收录专家的评价,采用了国际通行的H指数、被引数、高被引1%等评价指标,而对潜在人才的挖掘上采用了FWCI归一化影响因子,对外文期刊的评价综合采用了SCI影响因子和CiteScore评价系统。四是挖掘技术国际领先。采用机器学习、自然语言处理、数据可视化应用等先进技术,收集、整合各类高层次科技人才创新能力的数据、信息,建立了大数据分析平台,开展了多平台数据融合交叉研究,并构建了专家与专家、专家与机构、专家与学科等多维度多层次知识图谱体系。
该平台建立了包括11 万名国际专家、4.2 万名华裔专家、4.7 万名国内专家和近5 万名上海专家在内的共24 万名全球高层次科技专家数据库,覆盖自然科学、生命科学、医学与社会科学等共333 个学科领域。主要收录了国际顶级奖项如诺贝尔奖、沃尔夫奖、图灵奖等获奖者,发达国家科学院、工程院等院士,国际顶级学会会士以及我国重要人才计划、国家学协会理事等专家,包含了专家人才涉及的研究论文、出版专著、任职机构、研究领域、合作网络和特征标签等信息,并对每位专家的总发文数、总被引数、H指数、FWCI指数、1%高被引、10%高被引、专利数量、专利强度等指标进行评价。
专家平台正式上线以来,实现了在全球近3000 万名专业人才中快速、全面、准确地了解掌握高层次科技人才的基本情况、学术成果和动态信息,实现专家匹配、学术评估等,服务科技创新的作用逐渐凸显。一是为社会各界提供全球的高层次科技人才在线信息查询和搜索。目前该平台的新增注册用户达10 万个,点击率超过300 万次。二是为政府、高校、科研院所和企业以及社会各界提供了近万名专家的信息,制作了近30 份高层次科技人才学术能力评估报告。三是提供了人才引进、人才评估、专家评审、数据统计等专业化综合数据服务。例如针对某科研院所招聘9个方向首席科学家、学术带头人、青年学术骨干等三类海外人才需求,在专家平台中挖掘筛选了44 名国内外高层次人才候选名单。四是开展了深入研究,发布了多篇人才分析和预测报告,如高被引科学家分析报告、新增院士分析报告、上海与重要科创中心城市间人才流动报告等,为政府和各单位在人才引进分析方面提供了数据参考。
(1)缺乏专家人才信息管理规范以及综合型平台整体建设规划。一方面缺少针对专家人才数据信息管理规范,这就使得科技人才信息的整理、共享、公开、使用缺乏基础的数据保障,专家人才筛选与评价等具有一定的被动性和主观性。在专家平台建设中,只有对数据字段、数据安全、信息服务等进行规范,才能保障专家平台良性发展。另一方面缺少对专家平台跨系统整合的总体规划,各系统数据没有建立统一的标准和实现数据共享,因此专家平台建设尚处于摸索阶段,边建设边思考,缺乏全局性的建设规划,以及根据目标所指定的各阶段的主要建设内容,这就使得专家平台建设的可持续性不足。因此,人才的政策措施要根据发展来制订,人才工作的成效要用发展来检验,真正把人才作为第一资源[6]。
(2)缺少深入的高层次科技专家信息平台的数据分析。专家平台数据分析主要是指平台的信息处理能力,包括数据加工、数据汇交、信息计算和运行服务的数据规范与分析等。而当前的分析功能相对静态,主要是科技人才信息查询、统计分析、专业信息汇集等,缺少对深层次的科技人才分布、流动状况、人才评价、引进分析等研究。
(3)高层次科技专家信息平台的服务质量还有待进一步提升。当前的服务主要集中在科技人才信息查询、顶尖人才分析、学术成果分析等方面,专家平台人才数据量、数据维度还未达到预期的目标,还不能提供全球高层次科技人才信息的动态数据、精准引才等方面的服务,不能为高层次专家人才提供特定服务。
为了更好地打造上海科技创新人才高峰,为建设全球影响力的科技创新中心提供重要的人才保障。从长远看,要完善人才平台建设,就要从规划、环境、服务等层面进行考虑,以促进专家平台的不断完善,具体包括以下几个方面的措施与建议。
(1)制定人才数据信息管理规范和专家平台建设长期规划。以需求为导向,研究制定人才信息数字化和专家平台信息共享利用的管理规范,提升信息化程度,保障数据安全性,预防数据滥用,提高数据服务的质量。同时制定与专家平台建设和服务应用相适应的长远规划,完善高层次科技人才评价体系,把人才在学科领域的活跃度和影响力、在重要学术组织或期刊任职情况、发表研发成果原创性、成果转化效益、科技服务满意度等作为重要评价指标。因此,建设专家平台,在数据来源上不能仅仅依靠论文数据挖掘,还需要拓展更多的数据采集渠道,把国内外基金数据、期刊编委数据、国际顶级学会和协会数据、全球重大国际会议数据、国际顶级奖项数据、舆情数据等作为数据拓展和挖掘的方向,丰富高层次科技人才的数据结构,以更加全面地对人才进行分析。
(2)进一步提升科技人才数据的研究分析能力。通过深化专家数据的挖掘和研究,研究制定通过专利挖掘不同领域应用型人才的数据分析模型,研究制定高层次科技人才及高峰人才的评价方法,并据此形成若干数据分析报告。通过建立数据开放共享指数评估指标体系,构建指标体系中各指标的权重和指数计算规则,形成综合的开放共享指数。在数据分析中,适当引入大数据分析工具。建立符合创新驱动导向的高层次科技人才评价体系[7]。开发人才引进咨询、评审专家匹配和企业需求匹配子系统,建立上海领先于全国的科技人才生态圈,进而向政府决策部门提供有数据分析支撑的建议,更好地开发和利用大数据,挖掘科研领域的合作点,做好科技人才统筹[8]。加强对各级政府机构的数据支撑服务能力,形成成熟的数据服务产品。为上海市各类用人单位提供专家评估、分析报告、人才引进、专家推荐等数据服务,并面向决策层定期发布全球高峰人才动态内参,精准推送高层次科技人才的动态资讯。
(3)提升专家平台的服务功能。应从以下4个方面重点强化。一是全面准确掌握全球高层次科技人才信息与状况。从全球的视野,全面、准确地掌握全球高层次科技人才的基本情况、学术成果和动态信息。二是聚焦全球顶尖科学家,服务上海人才高峰建设。聚焦全球顶尖科技人才的现状与发展趋势,研究建设上海人才高峰的目标、方向与建议等问题。三是完善高层次科技人才学术成果的大数据分析平台,帮助科研人员进行当前学术发展趋势分析,引导科学研究方向。四是拓展全球精准引才和高端科技咨询服务。只有准确了解科技人才,才能实现精准引才,实现精准服务。通过进一步致力于探索协同合作与平台应用的新模式、新方法,为政府、高校、科研院所和科技企业在人才引进、人才评估、专家评审、数据统计、趋势研究、科技合作等方面提供更加全面精准的信息支撑服务[9]。
从上文分析可见,上海在构建专家平台的过程中,通过构造科技人才评价指标体系形成了对科技人才的评价方法和体系,通过汇聚科技人才信息形成高层次科技专家数据库,以满足社会对专家信息的需求,并通过多样化的数据分析技术对专家信息进行深度分析,为政府和社会提供专家分析参考。今后专家平台应从信息集聚、数据分析、机制探索、评价服务等方面进一步完善高层次科技专家信息平台,从顶层设计、评价反馈和信息公开等方面提高人才信息的统筹性[10]。当前,专家平台正将大数据技术应用到平台数据分析中,以期为社会的创新需求提供更加丰富的服务。