中国科技创新政策的发展阶段与重点变迁研究
——基于1999—2022年的政策文本分析

2023-09-24 03:02:00郄海拓张志娟
全球科技经济瞭望 2023年5期
关键词:高频词阶段样本

郄海拓,张志娟,何 潇

(中国科学技术信息研究所,北京 100038)

1 研究背景

科技创新(science technology and innovation,STI)政策的制定能够为科技创新发展提供法律和制度层面的保障[1]。陈强等[2]提出科技创新政策包含与科技创新活动相关的公共政策,是国家和地区为实现一定时期的科技、经济与社会发展目标而制定和推行的有关引导、激励和支持创新活动及其成果应用的行动准则和公共措施[3]。此后又有学者对于其适用范围进行了进一步明确,认为科技创新政策是政府部门为了实现经济社会发展目标、提升竞争能力,对创新活动过程、创新主体行为以及创新生态环境等进行支持和规范的一系列公共政策总和,包括科学政策、技术政策和创新政策[4-5]。众多学者也持相近观点,如王欣[4]、梁正等[5]、Amankwah-Amoah[6]和周华东[7],本文也采取此界定方式,将科技创新政策聚焦于科学、技术和创新领域。

科技创新和经济社会发展都需要政策的支持和引导,而对政策清晰有效地进行分析和评价,则有助于深刻地理解政策意图,为下级政府、产业企业等政策受众的各种决策提供依据。但政策以文本形式对外发布,是一种非结构的数据,其背后的关系和重点隐藏在文本当中。因此,为了更好地理解和解读政策,可以采用文本分析法。文本分析作为一种主要方法出现在政策量化分析中,可将文本转化为易读的结构性数据和关系,并以多种可视化的形式予以展示,使政策文本变得清晰和明确。有助于政策受众更好地理解政策意图进而做出更优的决策。而结合文本挖掘方法,在更广的“时间窗口”内研究政策重点的变迁情况,能够实现对政策全方位的理解和解读,预测政策趋势,从而为政策受众更长久的战略决策提供支持。

2 中国科技创新政策的发展阶段

2.1 阶段划分依据

为实现更加客观合理的阶段划分,本文综合考虑了3 种划分依据,一是较为重大的政策发布时间点,二是相关文献中对中国科技创新政策发展阶段的划分,三是以本文所选择的政策样本的分布情况予以佐证。

2.1.1 重大的政策发布时间点

2006年国务院发布了《国家中长期科学和技术发展规划纲要(2006—2020年)》,提出要经过15年努力,到2020年使中国进入创新型国家行列。建设创新型国家,要把增强自主创新能力作为国家战略,贯穿于现代化建设各个方面[8]。同年,科技部发布了《国家“十一五”科学技术发展规划》[9],基于对“十一五”期间的科技与经济社会需求的深入研究,确定了中国科技发展的总体思路,将提升能源和关键技术等5 方面自主创新能力作为“十一五”期间中国科技发展的重点。

2012年7月党中央、国务院召开全国科技创新大会并提出了创新驱动发展战略[10],同年11月,党的十八大召开,明确提出实施创新驱动发展战略,强调科技创新是提高社会生产力和综合国力的战略支撑,必须摆在国家发展全局的核心位置[11]。2012年9月,中共中央、国务院印发《关于深化科技体制改革加快国家创新体系建设的意见》,就深化科技体制改革、加快国家创新体系建设提出了具体要求[12]。

综上所述,2006年和2012年都是较为重要的时间节点,因此根据这两个时间节点将样本时间划分为1999—2005年、2006—2011年和2012—2022年3 个阶段。

2.1.2 相关文献

张宝建等[13]将中国1995—2017年间的科技创新政策以1995年、2006年和2012年为时间节点,划分为科技创新制度夯实阶段、科技创新功能重塑阶段和科技创新源头强化阶段,以研究政策主题与演化过程。钟振清[14]将中国少数民族自治区科技政策划分为5 个阶段,分别是1978—1984年的科技政策恢复期、1985—1994年的科技政策探索期、1995—2005年的科技政策改革期、2006—2011年的科技政策拓展期和2012年以后的科技政策深化期,其中1985年、1995年、2006年和2012年均为重要的时间节点。白旭云等[15]则将改革开放以来中国科技创新政策划分为1978—1994年的科学技术发展规划调整阶段、1995—2003年的中国科普事业新春天、2004—2011年资助创新谋求新发展和2012年以后的创新驱动建设科技强国共4 个阶段,以1995年、2004年和2012年为时间节点划分政策阶段。

2.1.3 政策样本分布

由于本文将重点聚焦于同时关注科技和创新的国家级政策,因此在样本选择上更加倾向于采取王欣[4]和Amankwah-Amoah[6]的观点将政策样本聚焦在科技创新领域,结合北大法宝数据库和部分公开政策,本文认定的科技创新政策的具体范围包括科技各类法律、行政法规、部门规章、科技规划、工作方案和实施细则等。为更客观合理地进行政策阶段划分,在研究之初就设定详细的样本筛选条件,以观测样本分布的总体情况,科技创新政策首次出现在1999年,因此选择1999年为样本起点时间,1999—2022年中国科技创新政策样本数量如图1 所示。

图1 1999—2022年中国科技创新政策样本数量分布

1999—2005年科技创新政策数量较少,且数量没有明显增长趋势,2006—2011年则呈现了震荡上升的态势,2012年后呈现了稳定增长的趋势,因此初步拟按上述3 个阶段划分中国科技创新政策。

2.2 划分阶段

本文综合考虑了重大的政策发布时间点、相关文献和政策样本的分布情况对中国科技创新政策进行阶段划分,选择2006年和2012年作为两个时间节点,最终将1999—2005年设定为改革发展期,2006—2011年为自主创新探索期,2012—2022年为创新驱动期。

2.2.1 第一阶段:改革发展期(1999—2005年)

第一阶段命名为改革发展期,时间为1999—2005年。1995年国务院颁布《关于加速科学技术进步的决定》,明确提出国家科学技术委员会作为主管全国科技工作的综合职能部门,要进一步加强对全国科技工作的宏观管理和综合协调[16]。2002年,中共中央办公厅、国务院办公厅印发《2002—2005年全国人才队伍建设规划纲要》,对党政人才、企业经营管理人才、专业技术人才等的队伍管理提出了规划,并提出继续深化干部人事制度和人才管理体制改革等内容[17]。在这样的环境背景下,1999—2005年改革发展的特点明显,此时有序管理尤为重要。需要说明的是,由于满足筛选条件的政策样本首次出现在1999年,且本文是基于政策文本本身的研究,所以为忠于原样本以保证研究的客观性,本文将1999年作为研究起始年,此处提到1995年的政策只用作为1999年的政策环境提供基础支撑。

2.2.2 第二阶段:自主创新探索期(2006—2011年)

第二阶段命名为自主创新探索期,时间为2006—2011年。2006年国务院发布了《关于实施科技规划纲要增强自主创新能力的决定》,提出努力建设创新型国家,坚持自主创新,全面提升国家竞争力;创新体制机制,走中国特色自主创新道路;制定配套政策,激励自主创新等[18]。该政策将自主创新放在了极为重要的位置上。与此同时,从政策数量来看,本阶段样本数量并不多,因此自主创新尚处于探索阶段。但在本阶段,创新得到了足够的重视,创新活力呈现逐渐增强的趋势。

2.2.3 第三阶段:创新驱动期(2012—2022年)

第三阶段命名为创新驱动期,时间为2012年以后,为保证自然年内政策的完整性,政策样本时间截至2022年。继2012年党的十八大提出“实施创新驱动发展战略”和2012年中共中央、国务院印发的《关于深化科技体制改革加快国家创新体系建设的意见》对加快国家创新体系建设提出了具体要求之后,中国又出台了一系列的科技创新政策以促进创新发展。2015年3月出台《关于深化体制机制改革加快实施创新驱动发展战略的若干意见》[19],2016年中共中央、国务院印发《国家创新驱动发展战略纲要》[20],2020年国务院办公厅印发《关于提升大众创业万众创新示范基地带动作用进一步促改革稳就业强动能的实施意见》[21],创新驱动的重要性越来越凸显,围绕创新驱动发展的各方面配套政策逐渐完善[15]。

3 各阶段文本挖掘结果及分析

3.1 研究对象与数据来源

本研究共选取了1999—2022年共计24年间的中国国家科技创新政策样本,并将研究重点聚焦于同时关注科技和创新的国家级政策。政策样本主要来源于北大法宝数据库,将搜索范围设定为“中央法规”,选择“高级检索”,筛选范围设定为标题包含“科技”和“创新”,公布时间不设起点,搜索时间截至2022年12月31日。共搜索到764 项政策。剔除已失效以及内容与科技创新事业相关性较低或较偏领域的政策,优先保留包括人才、企业、产业、创新平台载体、成果转化、科技金融和创新生态等主题在内的与中国科技创新事业高度相关的政策,筛选后北大法宝数据库共保留190 项科技创新政策。同时为了尽量使政策样本更加完备,本文又通过中国科技部官网和中央人民政府官网对政策予以逐项筛选和补充,取消了标题中必须同时包含“科技”并且“创新”的条件,同样剔除已失效以及内容与科技创新事业相关性较低或较偏领域的政策样本,最终得到发布于1999—2022年的254 项政策。由这些政策组成本研究使用的政策数据库,分布如图1所示。

3.2 研究方法与研究框架

本研究基于254 项国家级科技创新政策样本,采用文本挖掘方法分析中国科技创新政策在3 个阶段的重点变迁。基于文本本身的研究能够降低研究人员的主观偏差对研究结果的影响,以文本为基础客观地展现政策不同阶段的具体特点,有助于更加深入地解读政策,并对不同阶段政策重点的变迁进行更为客观的理解和观测。

本研究主要分为以下6 个步骤,如图2 所示。

图2 研究框架

第一步是对样本进行收集和筛选,形成政策数据库。

第二步是进行阶段划分,将数据库中的样本按照不同阶段汇总,并转化为文本挖掘软件可读的TXT 文本文档格式,然后对形成的文本进行简单清洗,即删除无意义的空白表格等内容。

第三步是将不同阶段的政策样本导入ROST CM软件,进行分词处理、高频词统计,并生成共词矩阵。

第四步是将矩阵导入Ucinet 软件完成可视化等分析,如生成语义网络图、计算点度中心度和网络中心势等,并进行小团体分析。

第五步是根据不同阶段的结果对政策重点进行总结,分析3 个阶段政策重点的变迁情况。

第六步是总结研究的创新点和局限性,并对研究进行展望。

3.3 研究结果与分析

文本挖掘的结果包括高频词、语义网络图、点度中心度、网络中心势和小团体分析等。

高频词是文本中出现频次较高的词。高频词不能完全反映该词在政策文本中的重要性,因为不是每个词都有极强的实际意义,或与其他词存在有意义的关联,因此需要进行筛选。本文在实际操作中剔除了没有实际意义的词,如“应当”或程度副词等,另剔除在文中与其他词连接较少的词,然后保留筛选后的前20 个高频词及其词频数。

语义网络图表示的是文本背后各个节点(高频词)之间的分布与联系情况,实现了将政策文本转化为可视化的图像,有助于将文本背后隐藏的关系直观地展示出来。节点之间的连线代表的是两个节点同时出现在语义网络中;与其他节点连接越多的节点,在一定程度上代表了其在语义网络中越重要。

点度中心度的数值代表的是该节点与其他节点相连的次数,量化了语义网络图中某一特定节点与其他节点关联的紧密程度,因此更加直观地量化了该节点在网络中的重要程度,点度中心度取值越高,代表该节点在网络中越重要[22]。

网络中心势代表的是特定网络中各节点的集中程度,取值介于0 和1 之间。通常以[0, 100%]百分数表示,越靠近0 代表网络越分散,越靠近100%则代表网络越集中,一般经验取值10%以上的网络就具有一定的集中度。网络中心势只是反映网络实际状态的一个客观指标,数值并不能直接判断网络的优劣情况。

小团体分析则可以识别文本中有几个相对集中的重点领域,并将文本背后的重点领域识别出来。

3.3.1 不同阶段高频词比较

为了突出重点内容,在每个阶段选取20 个高频词,按上述标准进行筛选,最后得到的重要高频词汇总如表1 所示。

表1 不同阶段高频词汇总

3 个阶段居首位的高频词均为科技,这是因为样本选择的是中国科技创新政策,政策样本都与中国的科技事业高度相关,因此科技成为3 个阶段词频最高的高频词符合直观判断。第一阶段的前几个高频词都与项目、管理、计划等相关,且创新排名第6 位,词频远低于项目、技术和管理。说明该阶段的科技创新政策整体偏重计划和有序的管理,创新并未排在很重要的位置。第二阶段的主要特点是创新一跃成为排名第2 位的高频词,而且自主也出现在了高频词中。另外,企业作为新出现的高频词排名第3 位,且高频词中也出现了基地、机构、科研和人才等创新所必需的要素,说明围绕科技、创新和企业的要素聚集趋势开始显现。第三阶段科技、创新、技术和企业都非常重要,同时服务也出现在高频词中,排名第8 位,研究、研发和科研同时出现在高频词中。

3.3.2 不同阶段语义网络图与点度中心度比较

(1)第一阶段语义网络图与点度中心度

第一阶段语义网络图如图3 所示,这个阶段中国科技创新政策中的3 个重点是科技、项目和管理。规范的管理更为重要,并且从与项目和管理相连的几个主要节点(即部门、科技部和计划)可以看出,此阶段更注重在部门的领导下实现有序的管理,完成科技工作。且此时创新和技术的重要性还未得到体现,企业也未得到重视。

图3 第一阶段(1999—2005年)语义网络图

第一阶段点度中心度汇总如表2 所示,点度中心度的排序与高频词代码排序不一致,说明并非词频越高的节点就一定在网络中更为重要,重要性代表的是该节点与其他节点相连的紧密程度。在第一阶段中,创新与其他节点连接的紧密程度仅为0.074,点度中心度仅有614 个节点与之相连,不足科技的一半,说明创新尚未得到足够的重视。因此这一阶段的特征符合本文对于文献的初步判断,即此时中国的科技创新政策处于改革发展期,对创新的认知和追求略显不足。

表2 1999—2005年中国科技创新政策文本点度中心度汇总

(2)第二阶段语义网络图与点度中心度

如图4 所示,第二阶段的语义网络图与第一阶段出现了明显差别,网络中最重要的3 个词变成了科技、创新和企业。结合点度中心度的数据(见表2、表3)可得,第一阶段与第二阶段创新的重要程度从0.074 跃升到了0.208,科技在网络中的重要程度从0.196 提高到了0.243,技术从0.059 提升到了0.061,企业首次在网络中出现,且重要程度为0.099。同时,在第一阶段中重要性以0.090 排名第三位的管理在第二阶段下降到0.044,说明管理不再是网络中的重点,且管理更多地围绕着创新和科技,为科技创新提供服务。另外,从企业周围的节点名称可以看出,围绕企业的服务得到了重视,自主创新虽然已经存在,但在网络中的重要程度还不高,仍然处于调整和探索阶段。但与之相关的人才和体系等已经出现了向科技、创新和企业集聚的态势,自主创新势头良好,与2006年的重大政策相呼应[18]。

表3 2006—2011年中国科技创新政策文本点度中心度汇总

图4 第二阶段(2006—2011年)语义网络图

第二阶段点度中心度汇总如表3 所示,该阶段的重点是科技、创新和企业,较之第一阶段最大的变化是创新获得了应有的重视,其在网络中的重要程度仅略低于科技,而且企业也成为网络中第三重要的节点,说明在此阶段不仅创新的重要性得到了充分的认识,对企业作为创新主体的定位也有了明确清晰的认知。但此阶段仍处于自主创新的探索期,因此资源向科技、创新和企业的聚集,有序性不足,但总体势头向好。

(3)第三阶段语义网络图与点度中心度

第三阶段语义网络图如图5 所示,相对于第二阶段,重点已转变为科技、创新、技术和企业。结合表3 和表4 的数据可知,科技和创新的重要程度变化较小,技术则由0.061 上涨到0.107,说明技术得到了更多的重视。此外,整个网络的紧密程度有所提升(即连接节点的线增加),特别是企业与科技、创新、技术之间的关联进一步紧密,而且服务与这四者之间的关联也更加密切。另外,研究和科研不仅同时出现,重要性也有所提升,而且第三阶段还出现了研发这个节点。第一阶段的研究、第二阶段的科研,都重在“研”,而第三阶段首次出现的研发一词,除了“研究”以外还增加了“开发”的意思,这说明第三阶段重视创新的应用,因此可以称为创新驱动阶段,与2012年发布的重大政策[11-12]和相关文献研究[15]相呼应。

表4 2012—2022年中国科技创新政策文本点度中心度汇总

图5 第三阶段(2016—2022年)语义网络图

第三阶段点度中心度汇总如表4 所示,该阶段的重点是科技、创新、技术和企业(发展节点的重要性较企业略强,但其实际意义较弱,且更多地体现在对本阶段重点的支持上,因此不将发展作为重点之一)。第三阶段最大的特征就是由科技、创新、技术和企业形成的创新重点更加稳固(点度中心度和节点连接紧密程度都较高),且资源目标明确地向三者有序聚集,形成了强大的创新驱动力。

3.3.3 不同阶段的网络中心势比较

不同阶段的网络中心势汇总如表5 所示。

表5 不同阶段的网络中心势汇总

3 个阶段的网络中心势取值分别是42.61%、33.99%和33.77%,均高于经验取值,说明3 个阶段的网络都具备一定的集中程度。

3.3.4 不同阶段的小团体分析比较

将图6~图8 的小团体图所反映的信息进行汇总,并将各阶段不同小团体根据所含高频词进行命名,如表6 所示,用以分析各阶段小团体的变化情况。

表6 3 个阶段小团体分析情况汇总

图6 1999—2005年中国科技创新政策文本小团体图

图7 2006—2011年中国科技创新政策文本小团体图

图8 2012—2022年中国科技创新政策文本小团体图

从表6 可知,小团体分析的结果与网络性和中心性分析相一致。第一阶段以改革发展为主,组织、机构、项目和管理较为重要。第二阶段以自主创新的探索为主,企业的重要性得到重视,资源向企业、科技和创新有聚集但有序性不足,仍有很强的探索性特征。第三阶段以创新驱动为主,资源有序向本阶段重点聚集,且围绕科技、创新、技术和企业的服务不断完善。

4 各阶段政策重点与变迁

文本分析的结果显示第一阶段的重点是项目、科技和管理。总体偏重计划和有序的管理,创新还未受到重视,创新、技术并未摆在很重要的位置,企业更是未出现在前20 个高频词中(如图1 和表2 所示)。第二阶段的重点是科技、创新和企业。本阶段企业和创新都得到了重视,且企业在创新中的重要性得到了肯定,围绕企业的服务受到重视,自主创新重要性突显,但仍处于调整探索期,管理不再是本阶段的重点,更多地体现为围绕着创新和科技,为科技创新提供服务。同时,资源开始出现向政策重点聚集的势头(如图4 和表3 所示),创新活力增强,自主创新势头向好。第三阶段重点转变为科技、创新、技术和企业。由四者形成的创新重点关系稳固,且资源目标明确地向其有序聚集,形成了强大的创新驱动力。在此阶段创新的重要性较强,如表1 所示,研究、研发和科研同时出现在高频词中,且如图5 所示,资源明显向重点聚集。

总体而言,3 个阶段的重点变迁体现了中国科技创新政策从管理为重转变为创新为重,且创新过程实现了由自主创新向创新驱动的转变,创新活力不断增强。创新资源的分布也逐渐向阶段重点聚集,从无序到有序,并且服务系统也在不断完善。

5 科技创新政策研究的创新点、局限性与研究展望

本文研究的创新点是基于文本挖掘工具将中国科技创新政策发展3 个阶段的重点予以提炼,并总结了政策重点的变迁情况,不仅增强了政策文本的易读性,将文本背后隐藏的数据和关系挖掘出来,还基于文本分析的结果将政策变迁的情况予以客观地总结。相较于纯文本的分析,本文更为客观、有效地消除了研究人员主观性对研究结果的影响。

本文研究的局限性及对应的研究展望有以下3 点:一是为确保较高的政策样本精度,研究将样本筛选条件设定得较为严格,虽然为了弥补这一局限性,手动对政策样本予以补充,但仍有可能会损失一些政策样本。下一步将继续优化样本筛选机制,最大限度地将有价值的政策样本完整地保留下来,以优化研究结果。二是仅在政策层面进行了研究,没有精细到政策工具层面,因为在进行文本整理的过程中,发现随着时间的推移,政策中涉及的政策工具也出现了变化,不仅数量有所提升,而且也出现了从政策工具向政策工具组合转变的趋势,但本文未涉及。针对这一问题,下一步希望能够将研究对象锁定到政策工具层面上,研究政策工具在目标时间内的演变情况。三是文本挖掘方法虽然能客观反映政策文本的具体情况,但仍有些重点会被掩盖,如近几年才出现的政策热点,若放在几十年的政策样本中很可能被淹没,这是文本挖掘方法一直以来存在的一个缺陷,在小团体分析中也有所体现,有些词可能因为没有出现在高频词中而无法在小团体分析中得以体现。下一步也将深入持续改进研究方法,希望能与现有文本挖掘方法结合,从而弥补这一缺陷。

猜你喜欢
高频词阶段样本
关于基础教育阶段实验教学的几点看法
科学与社会(2022年1期)2022-04-19 11:38:42
30份政府工作报告中的高频词
小康(2022年7期)2022-03-10 11:15:54
省级两会上的高频词
小康(2022年7期)2022-03-10 11:15:54
用样本估计总体复习点拨
28份政府工作报告中的高频词
小康(2021年7期)2021-03-15 05:29:03
省级两会上的高频词
小康(2021年7期)2021-03-15 05:29:03
在学前教育阶段,提前抢跑,只能跑得快一时,却跑不快一生。
莫愁(2019年36期)2019-11-13 20:26:16
推动医改的“直销样本”
随机微分方程的样本Lyapunov二次型估计
村企共赢的样本