赵龙文,黄 娟
(华南理工大学经济与贸易学院,广东广州 510006)
科技创新能力是指科学研究与技术创新对经济发展与社会环境影响的能力。它包含以下几方面内容:一是科技活动在一定时间和空间条件下其人、财、物的投入程度;二是科技成果产出规模和水平的提高;三是科技与经济社会发展的结合程度,以及科技对经济社会环境的改善等,后者与其他要素结合在一起,共同推进整个经济与社会的发展[1]147-148,[2]。党的十九大报告进一步明确了创新在引领经济社会发展中的重要地位,并将科技创新作为实施创新驱动发展战略、加快建设创新型国家的具体措施之一。科技创新能力是衡量科技实力的重要尺度,也是决定经济增长的关键因素,客观、准确地评价科技创新能力,对于发展战略的制定、发展目标的确定和竞争优势的培育与提升具有特别重要的意义[1]147-148,[2]。
从现有文献来看,已有不少学者对科技创新能力评价进行研究,例如,Chen等[3]通过专家问卷调查,利用层次分析法(AHP)确定高新技术产业落户园区的7 个评价指标,以便为台湾当局针对有限的科技工业园区发展何种高科技产业提供决策支持;章熙春等[4]在研究德国国家创新系统评价时指出,科技创新能力是多维度的复杂议题,从定量分析的角度来说,它无法直接调查或测量,只能通过多项指标来进行考察;李柏洲等[5]针对区域科技创新能力评价中存在主观性强、信息重叠大等问题,利用粗糙集法对区域科技创新能力的评价指标进行属性约简,得出优化后的区域科技创新能力评价体系,使评价指标更加科学、合理,从而使评价结论更能反映出各地区科技创新能力的实际水平;田志康等[6]因“欧洲创新记分牌”评价指标体系下的指标权重难以获得、权重确定缺乏理论依据,提出基于BP 网络的科技创新能力综合评价方法,模拟专家对科技创新能力进行综合评价,避免评价过程中的人为失误,并通过相关统计年鉴数据对科技创新能力指数进行测算;祝新等[7]指出模糊综合评价法的权重确定标准具有较强主观性,因子分析、主成分分析方法等对数据样本的需求量大,且需要符合某种典型特征分布,从而提出对样本数据要求不苛刻、具有较强灵活性,同时还可用于赋权评价和决策参考的灰色关联度法,利用相关统计年鉴数据对广西科技创新能力进行全面评价;薛汉莉等[8]利用相关统计年鉴数据评价我国7 个跨省份经济区的科技创新能力,揭示了各经济区科技创新能力差异的原因并提出了改进措施;黄建榕等[9]的研究说明定量分析是美国科技创新能力评价的鲜明特征,同时该方法保证了评价报告的客观性。
综上所述,学术界在科技创新能力评价方面已经做了大量的探索,但大部分研究是基于相关统计年鉴数据进行评价指标体系优化或评价方法改善,达到衡量科技创新能力的目的[10-15]。本文认为,科技创新能力评价的关键,一是评价指标体系和评价方法,二是可量化和可获取的数据支撑。当前,大数据的迅猛发展,使科技大数据得到积累,同时随着政府数据开放的推进,为科技创新能力评价提供了更丰富多样的数据支持。本文研究科技大数据发展和政府数据开放给科技创新能力评价带来的影响和机遇,探讨大数据背景下科技创新能力评价的新思路,以科技创新能力评价中二级指标之一的知识产权指标和广东省科技开放数据为例,对比一般评价方法,说明新思路的特点和优势,以期为政府科技数据的进一步开放和利用提供指导依据。
科技创新能力评价可分成4 个阶段:确定评价目标、构建评价指标体系、选择评价模型和方法、评价与结果分析。
统计数据是经过加工处理后的数据,目标和来源较为单一,粒度大,对科技能力真实情况和细节的反映能力有限,分析潜力相对较弱。相比之下,政府科技开放数据来自政府科技活动过程和业务管理系统,是详细的原始记录和一手数据,可以比较客观、及时和全方位、多维度地反映科技环境、创新主体、科技活动等各种状态和变化,可挖掘和利用潜力巨大。在大数据发展以及政府数据开放的推进下,政府各部门开放的丰富多样、客观及时、准确精细的科技大数据,为科技创新能力评价提供了更为优质、权威和详细的数据资源,同时对评价过程产生巨大影响,具体的影响和变革如图1 所示。
图 1 政府数据开放背景下科技创新能力评价新思路
(1)确定评价目标。评价目标包括3 个层次:创新能力衡量;差异原因探究;发展决策支持。基于科技创新能力评价结果为决策提供支持依据是我们追求的理想目标。传统评价方法也能为决策提供一定支持,但由于该方法本身存在数据可获得性弱、粗粒度、稀疏性等局限,使得决策缺少微观层面的可行性,即具体决策行动方案。如在开展科技创新成果评价时,相关统计年鉴的专利申请与授权量无法满足深入分析要求,此时通过政府开放的专利获奖人、获奖单位以及专利类型等数据则更有利于进一步探究。科技创新能力本身是一个复杂的系统,其具体状态是由各创新主体与投入要素在科技环境下进行创新活动相互作用的结果,因此评价过程中所利用的数据是来自科技环境。在大数据发展与政府数据开放趋势下,科技环境得到改善有助于进一步分解和细化评价目标,有利于对感兴趣的目标深入探索和追踪,进而为政府开放数据提供决策支持。
(2)构建指标体系。遵循科学性、可操作性、可比性和数据可获得的原则,根据科技创新能力要素或参考现有评价指标体系,同时兼顾区域或国家的实际情况与特点构建评价指标体系。评价指标体系为评价结果提供分析框架,更细化和丰富的评价指标体系将提高评价结果的解释力度。传统统计年鉴数据区域特征不明显,尽管可以通过粗糙集法等评价方法对指标体系优化,但却忽视了地区差异性,如内地相关统计年鉴根据统一格式上报的数据进行编制,香港和澳门地区则独立统计,因而香港统计公报中有科技专栏数据、澳门有专门博彩数据。在大数据背景下,科技评价数据除了相关统计年鉴、问卷调查等数据,还包括科技环境、科技主题、科技资源和科技活动等特征、状态、行为的数据,更加丰富、精细、多样。基于政府开放数据构建评价指标体系,使体系更加系统化、科学化、客观化。
(3)选择模型与方法。借助模型与方法处理数据,呈现出数据之间的关联性、因果性等特征,使评价结果更为客观、科学。政府科技开放数据相比于科技统计年鉴的数据更接近原始数据,数据描述更加全面、可靠性更强。基于政府开放数据和科技大数据进行的评价具有大规模的数据优势,随着大数据技术水平的不断上升,可选择的分析方法也不断增多、增强,如数据挖掘、交互分析、可视化分析、机器学习等;此外,技术使得动态数据获取成为可能,为进一步动态监测评价提供了更有效的途径。总的来说,开放数据可带动分析方法的应用与优化,同时技术方法能多维度、更智能地丰富数据。
(4)评价与结果分析。我国目前70%的数据集中在政府部门[16],政府科技数据的开放共享为科技创新能力评价与结果分析提供了丰富多样的数据支持。来源于真实科技环境的评价数据,能更为客观、准确、及时地反映环境的状态、特征和变化,为解释、优化、改善科技环境提供指导依据;相比之下,传统基于相关年鉴数据的评价方法获得的评价结果可能因其数据局限性存在片面、主观等不足,进而引起一定程度上的决策偏差。
政府数据开放以网站为依托,释放科技数据资源。根据2018 年《中国地方政府数据开放平台报告》,截至2018 年4 月中旬,我国已上线的政府数据开放平台有46 个,其中广东省一共有12 个,包括省级、副省级、市级。各级政府数据开放平台的建立,意味着政府在保障国家、商业秘密和个人隐私的前提下将逐渐开放更多科技数据,让社会进行充分融合和利用。广东省政府科技数据主要聚集在“开放广东”政府数据统一开放平台(www.gddata.gov.cn)、广东省科技资源共享网(http://www.gdkjzy.net)、广东省科学技术厅科技数据开放应用平台(http://app.gdstc.gov.cn/app/sjkf/index.jsp)和广东省科学技术厅及各地级市科技管理部门网站,这些网站的科技数据开放使科技创新能力评价不再局限于相关统计年鉴数据。姜文仙[17]利用《广东统计年鉴》《广东科技年鉴》《中国统计年鉴》等数据(2000—2013 年),通过灰色关联度分析法对广东省区域科技创新能力进行综合评价,其构建的广东省区域科技创新能力评价综合指标体系包括3 个等级的评价指标,其中知识创造能力一级指标包含研究与发展投入、知识产权、科技成果等3 个二级指标。为了分析数据对评价过程的影响,本文将姜文仙[17]学者的研究作为对比案例,以知识产权为例进行评价研究。
(1)广东省知识产权开放数据。案例中衡量广东省知识产权的指标只有3 个,即专利申请量、专利申请量年增长率以及专利授权量。根据《2017 年世界知识产权指标》,我国专利申请和专利授权量均居全球首位,但存在知识产权质量参差不齐、海外知识产权布局少的问题。衡量知识创造的知识产权不仅应该包括数量,更应该涵盖质量。“开放广东”汇集了广东省各市专利申请、授权情况和专利行政执法案件量统计等知识产权开放数据,这些都是面向全社会无条件开放的,支持浏览、下载以及可视化展示。原省知识产权局以及广东省科技厅也开放了相关数据。数据的丰富程度会影响指标的选取,进而影响评价目标的实现程度,为了研究开放数据对评价过程的影响,首先丰富知识产权创造数量方面的数据,其次增加知识产权创造质量方面的数据。
知识产权创造数量方面,本文从广东科技统计网站上选取了2000—2016 年17 年间按类型构成(A1)的专利申请与授权量,以及按申请人构成(A2)的专利申请与授权,限于篇幅,本文中只列出2001、2005、2010 和2016 年的指标值(如表1、表2)。新思路下按类型构成的知识产权指标有9 个,按申请人构成的指标有15 个。指标的增多使评价结果能够衡量的维度也增加。
表1 按类型构成的广东省知识产权创造数量评价指标体系
表2 按申请人构成的广东省知识产权创造数量评价指标体系
知识产权创造质量方面,从原广东省知识产权局网站选取了2006—2016 年11 年间的数据,与创造数量一起衡量广东省知识产权创造水平。知识产权创造水平指标体系由创造数量与创造质量两个二级指标7 个三级指标构成(如表3)。
表 3 广东省知识产权评价指标体系
(2)案例评价结果对比分析。丰富的数据进一步细化了评价指标体系,本文以科技创新能力中知识产权为例进行分析时,为了保持与案例模型一致性去探究数据对评价结果的影响,所以仍然选择灰色关联度分析方法进行评价[1]147-148,[2]。灰色关联分析的基本思想是,根据序列曲线几何形状的相似程度来判断不同序列之间的联系是否紧密,折线几何形状越接近,相应序列之间的关联度就越大,反之就越小。其主要优点是:对样本量多少和样本有无明显规律都同样适用,而且计算量不大,十分方便,通常不会出现量化结果与定性分析结果不符的情况;通过在被比较对象中选取最优指标组成参考序列,采用灰色关联度理论去评价被比较对象与最优参考序列的关联度,可以得出被比较对象的年度增长变化。主要步骤为:首先,通过均值变换化法(用年度总平均去除每个指标数据)对原始数据进行无量纲化处理;其次,确定参考数列,由于知识产权细化指标体系中均为正向指标,可选取每个指标年度最大值作为参考数列;然后,求差数列,逐一计算参考数列与每个年份各指标数值的绝对差;最后,求关联度,先利用灰色关联系数公式求关联系数矩阵,再对每年度关联系数求平均值,得出指标的年度关联度[18-22]。
参考上述步骤,求得新思路下2001—2016 年间广东省知识产权创造数量的关联度系数,按类型构成与按申请人构成的评价结果非常接近,都呈现出稳步上升(2001—2005 年)—逐渐下降(2005—2008 年)—回稳上升(2008—2014 年)—迅速上升(2014—2016 年)的阶段性特征。案例中专利申请与授权量数据是按类型构成的汇总,知识产权评价结果实则为对创造数量的描述,2008—2013 年案例评价结果与新思路(按类型构成)评价结果出现较大差异(如表2)。从数据丰富度来看,案例中获取的是2000—2013 年共14 年的数据,相比之下,少了2014、2015、2016 年3 年的数据。可发现当只存在数据这一个变量时,数据的丰富程度不仅影响评价结果的增长幅度,同时可能改变其变化趋势。
图2 2001—2016 年广东省知识产权创造数量评价结果对比
(3)基于开放数据评价的优势。科技创新能力评价新思路因丰富、细化、多样的评价数据,可进一步得出知识产权创造数量方面的专利申请量与授权量的关联系数,为评价结果的深入分析和解释提供了支撑。如表4 所示,从类型构成来看,16 年间广东省专利申请关联系数上升了约36 个百分点,专利授权关联系数上升了约62 个百分点,专利授权比专利申请关联系数上升多约26 个百分点,说明广东省专利授权比专利申请对知识产权贡献大;2008、2010、2012 年专利申请与专利授权灰色关联度最接近,2012 年开始专利授权开始超过专利申请,并一直维持领先状态。
表4 2001—2016 年广东省知识产权创造数量评价细化指标关联系数
政府开放的科技数据使得知识产权创造水平的衡量不仅仅局限于创造数量方面,新思路在案例创造数量指标的基础上增加了创造质量的指标,得出知识产权关联度如表5 所示。
表5 2006—2016 年广东省知识产权评价指标的灰色关联系数
从图3 评价结果对比情况可知,新思路下2006—2016 年广东省知识产权变化情况为:不断下滑(2006—2008 年)—逐渐回稳(2009—2011 年)—轻微波动(2012 年)—稳步上升(2013—2016 年)。案例中2009—2013 年知识产权的关联度持续上升仅仅是对知识产权创造数量的描述,忽略了创造质量这一重要变量所带来的影响。
图 3 2006—2016 年广东省知识产权评价结果对比
政府数据开放不仅积累了多样、细化的科技数据,并为新思路提供了丰富的年度数据,在此基础上可以进一步完善科技创新能力指标体系,得出更加客观、科学的评价结果。数据的增加与堆积使得处理更为复杂,给一般评价带来了挑战,但大数据的技术与处理方法却能使实时、动态、多维度的分析与评价结果多角度、多形式地展示成为可能。总而言之,新思路使评价结果准确、客观地衡量科技创新能力,并能深入探究科技创新能力发展原因与动力,为政府数据开放相关决策提供支持,有效提高科技创新能力,促进经济、社会发展。
政府数据开放积累了科技大数据,对科技创新能力评价产生重要影响,推动探索和实践、促进创新和变革,在此背景下提出科技创新能力评价新思路,一定程度上反映了对科技大数据与开放数据的需求与期望。丰富多样的高质量科技数据是科技创新能力评价的重要保证,目前可供社会获取、利用的科技数据还存在很大差距,应采取措施,有效推进科技数据的开放共享,为科技创新能力评价和科技政策决策提供强有力的支持。大数据趋势下,为进一步开放政府科技数据,推动科技创新能力评价的创新和变革,本文提出以下点建议:
(1)推动科技数据开放共享,提高科技开放数据的质量。一般科技创新能力评价以相关统计年鉴数据为主,统计年鉴通常按照统一的口径整合、分析各部门上报的统计数据,其真实可靠性以及客观科学性有待校验;政府开放数据包括统计年鉴,但更强调的是未经加工的原始数据,考虑到安全性,一般会依托于政府各部门网站有选择地开放。相关统计年鉴数据获取简单、涵盖基本面广,成为学者首选;相对而言,原始的、细粒度的政府开放数据应用较少,更多的原因是开放数据的数量和种类不够丰富、可用性和价值性不够高。新思路下广东省知识产权创造水平评价,利用政府科技开放数据进行解读后展现出更具体、详细的结果,但科技创新能力的综合评价却因现有开放数据质量参差不齐受限。在大数据发展趋势下,应提高政府部门对于数据的重视,协调合作推动科技数据开放共享,共同提高开放数据质量,使其为社会、公众理解带来更多便利性。
(2)数据开放以需求为导向,积极建立政府反馈机制。基于数据细化并完善指标体系,应以需求为导向,推动政府数据开放,进而为科技创新能力评价提供可靠的数据保障。目前已开放的数据利用程度不高,公众所需数据无法得到满足,主要矛盾在于数据提供与需求不匹配。以“开放广东”为例,数据开放的类型有3 种:无条件开放、依申请开放、有条件开放。依申请开放要求社会公众通过填写数据申请表,向数据提供方申请开放所需数据,经审核后开放数据资源;数据申请表里调查了需求者的职业、获取政务数据的途径,以及希望政府开放的数据领域、数据内容、数据用途、开放方式和数据格式。此方式汇集了公众需求,但在数据提供方即政府方面缺乏一定的反馈机制,可能影响公众与政府之间的交流与互动,以及数据需求方与数据提供方合理、有效地匹配。通过完善政府反馈机制,加强与公众的联系,将提高开放数据的利用价值,能够进一步支持并促进科技创新能力评价的创新。
(3)促进科技环境各因素协同发展,提升科技创新水平。国务院印发的《促进大数据发展行动纲要》明确指出,2018 年年底前建成国家政府数据统一开放平台,意味着将释放更多且丰富多样的科技开放数据,这为科技环境改善进一步提供了数据支持。与政府信息公开不同,政府数据开放更加强调的是公众参与,利用与挖掘数据的潜在价值,如本文中进行的科技创新能力评价便是科技开放数据利用的一方面。除此之外,还可利用科技开放数据进行可视化处理,制作知识图谱,提高公众对于数据的理解。在科技创新能力评价的过程中,评价数据是来源于科技环境的,只有科技环境的创新主体、科技资源、科技活动等各因素相互作用、协同发展,才能够提供粒度细的原数据来支撑系统化指标的构建,从而更加准确、全面地衡量科技创新能力,真实可靠地支持具体的科技决策,实现评价的理想目的,而有效的科技战略、决策将激发社会各成员的创造力,促进科技创新水平的提升,增强国家竞争力。
本文在政府数据开放背景下提出科技创新能力评价新思路,以知识产权为例,通过灰色关联度分析法对广东省知识产权进行评价,并与姜文仙[17]研究中采用传统相关统计年鉴数据的评价结果进行对比,在评价过程中数据作为唯一变量。对比分析的结果为:一是相关统计年鉴评价结果由于数据有限,只能描述知识产权创造数量方面的情况,无法通过细化指标进一步解释评价结果;二是基于开放数据增加了知识产权创造质量方面的数据,可以使得评价结果更为客观,即数据的丰富度会影响评价结果的可靠性。
科技创新能力评价主要从科技资源投入、科技成果产出、科技活动与经济社会的结合程度3 个方面衡量,力图实现决策支持的科技创新能力评价对数据的要求会更高,知识产权只是科技创新能力的一部分,当进行整体、综合评价时,会因目前政府数据开放水平有限以及开放数据的质量参差不齐而存在一定困难。但在国家政策的支持下,随着科技环境的改善,政府数据开放和科技大数据发展的不断推进,政府开放数据将在科技能力评价中发挥越来越重要的作用,科技大数据将对科技创新能力评价产生巨大而深远的影响,推动评价方法和机制的创新和变革。