黄雪梅,黄定轩
(1. 重庆市规划设计研究院,重庆 401120;2. 重庆理工大学管理学院,重庆 400054)
创新驱动是指要素和投资由创新来带动,即创新成为推动经济增长的主动力[1]。从国内形势看,首先,我国经济发展进入新常态,依靠大规模投资来实现经济增长的传统粗放型增长方式难以为继且代价过大;其次,我国部分关键核心技术受制于人,部分产业仍处于全球价值链的中低端,支撑产业升级、引领未来发展的科学技术储备亟待加强;最后,我国经济转型升级、民生持续改善和国防现代化建设也对创新形成巨大需求。从国际形势看,一方面,以智能、绿色、泛在为特征的群体性技术革命和不断涌现的颠覆性技术将引发国际产业分工的重大调整,并重塑世界竞争格局;另一方面,从国家竞争角度出发,创新驱动发展是众多国家谋求竞争优势的核心战略,后发国家要借助后发优势追赶上先发国家必须实现“蛙跳”,通过科技创新实施技术赶超,在关键产业和领域打造先发优势[2]。
2021年3 月,第十三届全国人民代表大会第四次会议通过的《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》中明确指出,创新驱动发展是我国未来发展的国家战略。创新驱动政策作为中央政府的政策工具,首先,体现了中央决策者的政治意图,反映中央政府关注的焦点;其次,创新驱动政策具有体现国家战略和规划的特征,政策内容能够反映国家对于创新驱动的重点关注领域与应用领域;最后,不同时期颁布的创新驱动政策文本的主题是相互关联的,关联主题可直接揭示国家创新驱动过程中政府关注焦点的变迁。
现有的创新驱动理论研究与实证分析拓展和丰富了创新驱动发展理论,但仍存在以下不足:第一,鲜有学者从大数据分析角度研究创新驱动政策本身的特征,即国家创新驱动政策本身的特征未得到有效揭示。第二,现有创新驱动政策研究多侧重于逻辑思辨上的定性研究,缺乏对国家创新驱动政策的量化分析,尤其是缺乏政策文本中不同高频词之间的网络特征分析研究。因此,本文聚焦于国家创新驱动政策,运用大数据理论与社会网络分析方法分析国家创新驱动政策的高频词特征,进一步挖掘高频词的社会网络特征,以为不同区域创新驱动发展政策的制定提供参考。
创新驱动要素分析是创新驱动发展理论的重要基础,为分析创新驱动路径奠定了基础。蓝乐琴等[3]提出创新驱动要素两分法,即以劳动、土地、资本为代表的初级要素和以技术、知识、信息为表征的高级要素,并指出创新驱动经济增长的过程涉及多种高级要素的整合,其结果并非简单表现为经济速度增长和效率提升,因此有必要研究创新要素在不同产业间的差异性分布。2016年5月,国务院印发的《国家创新驱动发展战略纲要》明确提出,科技创新和体制机制创新是国家创新战略的两个相互协调的驱动轮,要以这两类创新为核心构建企业、科研院所、高校、社会组织等各类创新主体功能定位相互协调的国家创新体系,进一步推动经济增长方式实现六大转变。洪银兴[1]认为经济增长的创新驱动要素主要是科技创新,科技创新的终端则是产业创新,要注重创新型经济的3个协同,即科技创新与产业创新协同、知识创新主体与技术创新主体协同、知识密集产业与绿色技术产业协同,强调要重视协同创新。胡俊等[4]进一步研究发现,企业技术创新努力水平的提升和政府实施竞争政策有利于增加制造商的利润。
创新驱动路径分析是创新驱动发展研究的重要内容之一,最基本的观点是创新驱动发展方式会带动产业结构、企业结构和技术进步模式的转型[1]。例如,在全球价值链分工框架下新兴经济体中间产品创新驱动全球价值链攀升的机制与路径中,存在先利用低成本的比较优势获取发达经济体中低端中间产品外包,引致新兴经济体中间产品的创新,进而实现进口替代,最终实现技能偏向性技术进步的全球价值链攀升[5]。与此不同的是,在“工业4.0”背景下创新驱动经济结构演化将创新驱动划分为核心驱动、基础驱动、辅助驱动3类,进而归纳出工业凝练式发展、服务业扩张式发展、农业融合式发展等发展模式[6]。在具体的创新驱动产业升级路径分析中,不同场景下的创新驱动路径分析结论具有差异性。例如,杨瑾等[7]以装备制造企业为研究对象,分析颠覆式创新驱动装备制造业转型升级的关键影响因素和作用路径,提炼出装备制造业市场型和创新策略型两条转型升级路径;Ranta等[8]基于创新的循环经济转型,利用质性研究方法,结果发现循环经济中的客户价值主张体现了振兴、共享、优化和替换价值等4种价值创造逻辑;张亚明等[9]基于组态视角分析科技创新要素与产业升级的协同效应,研究结果发现高产业升级指数与非高产业升级指数的驱动路径分别为3条和6条,二者的路径具有非对称性的特征。总之,创新驱动经济增长的过程是多种高级要素整合的复杂过程,是高级要素与初级要素两类要素在整合过程中促进整体经济发展的过程,其基本路径体现为由技术模仿逐步转型为知识生产或技术研发[3]。
创新驱动政策的效果同样是创新驱动研究的重要内容,不同研究者利用数据包络分析法、博弈论、实证分析法及社会网络分析法等工具开展了大量研究。在国家级和省级层面的实证研究中,对创新驱动政策对经济或产业发展的促进作用已达成一致结论。例如,孙艺璇等[10]利用数据包络分析法研究科技创新对经济高质量发展的驱动机制,结果显示专利授权数、R&D经费占国内生产总值(GDP)的比重等科技创新要素对经济高质量发展的驱动作用较强,且科技创新要素的驱动影响存在较大的空间差异;刘和东等[11]研究发现创新驱动是经济高质量发展水平的前置因素,省域创新驱动水平与经济高质量综合发展水平呈同步上升趋势,实施创新驱动发展战略能够降低各省份政府绩效目标偏差的程度[12]。在个案的实证研究中,Yuan等[13]基于我国高铁的研究表明,大型企业和高校在高铁技术创新过程中均发挥了至关重要的作用,同时,激励政策促使创新者进行竞争与合作,进一步形成和完善了产业价值链;此外,朱丽等[14]针对现有科技政策失灵的现状,引入复杂网络理论,发现通过对网络创新扩散方式的有效干预和引导,可有效保证科技政策的实施。
本文对中央人民政府官网发布的标题中含有“创新驱动”的政策文本进行搜索,剔除了有关政策解读及各地方关于“创新驱动”的政策文件,最终收集到政策文件共5份(以下简称“样本政策”)。为防止遗漏,编写了爬虫程序进行检索验证。
2.2.1 自然语言处理
自然语言处理(natural language processing,NLP)是一门融语言学、计算机科学、数学、逻辑学和心理学于一体的科学,是计算机科学领域与人工智能领域中的重要方向之一。自然语言处理作为实现文本挖掘的主要技术手段,为信息抽取、文本挖掘及细粒度语言分析等方面的政策量化研究提供了新思路和新方法。
2.2.2 社会网络分析
社会网络分析通过定量分析网络中高频词或群体间关系的特征,与定性研究形成有效互补,有助于获取研究对象的更完整和有价值的研究成果,目前已经应用于项目管理、决策研究等不同领域。社会网络分析方法中的主要指标可以分为以下3类[15]。
(1)中心度(centrality)。在社会网络中,衡量个体中心地位的指标是中心度,中心度指标包括度数中心度(centrality degree)CD(ni)、接近中心度(closeness centrality)CC(ni)和中间中心度(betweenness centrality)CB(ni)。度数中心度可用于测度特定个体自身的交易能力,但未考虑其能否控制他人;接近中心度可用以表达个体在网络中分享资源、信息、方法等内容的能力,考虑的是个体在多大程度上不受其他个体的控制;中间中心度衡量个体在网络中对资源、信息等的控制能力,即该点在多大程度上是其他点的中介。各中心度指标相应的计算公式如下:
式(1)中:N指网络规模;m(ni)为与节点ni连接的线条数目;d(ni,nj)为节点ni与nj之间存在的最短距离数目;gjk表示节点nk与nj之间存在的最短距离数目;gk(ni)表示包含个体ni的两个个体之间的最短距离数目。
(2)密度(density)和中心势(centralization)。网络密度表示网络中不同个体之间联系的紧密程度,个体受到来自网络结构的约束越明显,则网络密度就越大。网络中心势测量网络在多大程度上围绕某个或某些特殊点建构,中心势的值越大,说明网络越具有集中趋势,网络中权力的分布越不均衡。网络中心势可表示为,最核心点的中心度(相应的最大中心度)和其他点的中心度的差值总和与最大可能的差值总和之比。计算公式如下:
式(2)中:Cmax是最大中心度;Ci是节点ni的中心度。
(3)影响力指数。在一个整体网络中,每个个体的关系选择是不同的,如果有的个体明显得到多个其他个体的关照,说明他得到的关系选择多,影响力大。其中,泰勒影响力指数可用公式(3)表示如下:
借助文本挖掘可以避免人为设定的主观性对分词结果造成影响,提高政策分析模型评价的精度[16]。本文将样本政策文本导入文本挖掘数据库,借助Python软件进行预处理。首先,过滤掉“国务院”“考核”“关于”“强化”“实施”“进一步”“深入”等干扰性高频词,根据分词结果进行关键词的词频统计,最终形成创新驱动国家政策的高频关键词;其后,提取单个文件的高频词形成单个文件高频词的词云图(见图1至图5),并将5份文件合并成1个总文件提取高频词,得到全部样本政策文本的高频词的词云图(如图6所示)。各图中,每个高频词所占面积大小与其在该份文件中出现的次数成正比。图1中的“创新”“发展”“县域”“科技”与“创业”,图2中的“创新”“发展”“技术”“产业”和“科技”,图3中的“创新”“发展”“创业”“改革”和“人才”,图4中的“创新”“发展”“经开区”“产业”“国家级”,图5中的“创新”“发展”“改革”“研究”“机制”分别是出现频率较高的高频词。从全部文件词云分析的结果看,“创新”“发展”“产业”“科技”“技术”等词出现频率较高。
图1 《国务院办公厅关于县域创新驱动发展的若干意见》的高频词词云
图2 《国家创新驱动发展战略纲要》的高频词词云
图3 《国务院关于强化实施创新驱动发展战略进一步推进大众创业万众创新深入发展的意见》的高频词词云
图4 《国务院办公厅关于完善国家级经济技术开发区考核制度促进创新驱动发展的指导意见》的高频词词云
图5 《中共中央国务院关于深化体制机制改革加快实施创新驱动发展战略的若干意见》的高频词词云
图6 全部样本政策文本的高频词词云
本文进一步提取每一份政策文件排名前10位的关键词(见表1),然后将5份政策文件的50个高频关键词进行合并,得到30个高频关键词:
表1 样本政策文本中排名前10位的高频词
“政策”“国家级”“研究”“改革”“发展”“机制”“科研院所”“驱动”“战略”“培育”“人才”“分工负责”“创新”“推动”“知识产权”“科技”“加强”“评价”“科技成果”“体系”“创业”“县域”“国家”“完善”“产业”“经开区”“高等学校”“制度”“推进”“技术”。
高频词社会网络用于分析不同高频词、连接边的社会关系,网络的节点是社会网络里的每个高频词,连接边则表示高频词之间的关系,社会网络可标示出所有与高频词相关的连接边。本文对两两高频词(不同政策的前10位高频词)间的关系按以下原则构建社会网络:(1)两个高频词同时出现在同一政策文件中,则联系+1;(2)两个高频词同时出现在不同的政策文件中,则联系+1;(3)对不在同一文件中的高频词对,必须出现在两个以上的政策文件中才予以确认。最终得到不同高频词的共现矩阵(见表2),进而得到国家创新驱动政策文件高频词社会网络图谱(如图7所示)。
图7 样本政策文本的主要高频词社会网络
从表2及图7可知,“科技”“创业”“产业”“驱动”“推动”“改革”“体系”“创新”“知识产权”“科研院所”“人才”“科技成果”“发展”这13个高频词间的连接强度较高,连接强度大于4;其余17个高频词居于网络的外侧,相互之间的连接强度以及与上述13个高频词间的连接强度全部小于4(如图8所示);“创新”与“发展”“科技”“创业”“产业”等12个高频词之间,以及“推动”与“发展”之间的连接强度超过8,其中“创新”与“发展”之间的连接强度最大,达到19(如图9所示)。
表2 样本政策文本的高频词共现矩阵
图8 样本政策文本中连接强度大于4的高频词社会网络
图9 样本政策文本中连接强度大于8的高频词社会网络
由图7可知,整个网络密度的平均值(average value,Avg)为1.75,标准差为2.34,整体网络的凝聚性指标如表3所示。由于在网络构建过程中考虑了对称性,整体网络的外向度数中心势等于内向度数中心势(34%),结合中间中心势数值可知,样本政策文本的高频词社会网络的紧凑性较高。
表3 样本政策文本的高频词网络凝聚性指标值
本文选择了度数中心度、中间中心度和接近中心度3个指标对样本政策文本的高频词进行多维中心度分析(如表4所示)。高频词社会网络的度数中心度主要考虑高频词本身的交易能力,并没有考虑该词是否控制其他词。从表4可知,连接强度大于4的13个高频词的度数中心度位于前列,其中“创新”“推动”“发展”和“创业”位于前4位,其余9个高频词并列第5位。接近中心度表示对应因素在多大程度上不受其他因素控制。从表4中可知,“政策”“国家”“制度”等度数中心度不在前5位的高频词的接近中心度均为45,表明这些关键词较少受到其他关键词的影响。中间中心度的数据大小揭示高频词的控制能力,即数据大的高频词更有可能控制其他高频词。从表4中可知,度数中心度处于前5位的高频词具有相同的中间度,即这13个高频词处于样本政策文本的高频词社会网络连接的核心地位。
表4 样本政策文本的高频词多维中心度分析
在整体网络中,每个高频词的关系选择具有较大的差异性,有的高频词明显得到较多其他利益相关者的关照,体现为得到的关系选择多、影响力大;有的高频词虽不被关注,即得到的关系选择少,但其可能选择较多的其他利益相关者,即发出的关系多。本文在高频词的社会网络关系分析中主要考虑对称关系,即不考虑关系的出发点,因此文中高频词的关系总和是相同的。从表5可知,“创新”和“发展”两个高频词的影响力最大, “推动”和“创业”的影响力并列第3位。
表5 样本政策文本的高频词影响力分析
我国提出创新驱动发展战略多年,不同省份采取了相应的实施举措,但省级市域(不含直辖市)创新驱动发展战略的实施亟待推动[17]。中央政府政策设计的统一性与基层实际状况不完全能够有机结合,因此,准确理解国家创新驱动政策并精准与地区实际条件相融合成为相应决策部门的重要任务。针对国家创新驱动政策研究存在的量化分析不足,本文采用了词云分析和社会网络分析方法对国家创新驱动政策进行了文本分析和高频词社会网络分析。研究发现,“科技”“创业”“产业”“驱动”“推动”“改革”“体系”“创新”“知识产权”等关键词是所有文件中出现频率最高的高频词,其中“创新”“推动”“发展”和“创业”的度数中心度排列在前4位。在出现频率最高的高频词中,“创新”和“发展”是具有最大影响力的两个高频词,说明我国创新驱动政策的重点在于以产业发展为焦点,以创新为抓手,重点突出战略性发展。与陈劲等[18]的研究结果相比较,本文通过政策文本内容分析证实了其逻辑思考的结论,同时弥补了学界对国家创新驱动政策量化分析尤其是对高频词分析的不足。张超等[19]同样采用社会网络分析方法进行政策文本研究,相较而言,本文在政策文本的深度分析上开展了高频词社会网络中不同高频词的影响力分析,掌握政策文本高频词的中心度与影响力可帮助政策分析人员快速了解政策文本的核心内容,从而有益于更充分地利用政策。相较于Ranta等[8]基于质性研究方法进行政策分析的研究,本文采用自然语言处理技术进行政策文本分析,可有效避免人为因素的影响,结果具有可重复性和可验证性,增加了研究结果的可靠性。因此,在国家创新政策研究中,本文提出的方法具有以下3个特征:(1)采用大数据分析中的自然语言处理技术可有效避免政策文本研究中的人为因素干扰,提高了政策文本研究的可重复性和可验证性,保证了政策文本研究的客观性。(2)本文在利用自然语言处理进行政策文本分析的基础上,结合社会网络分析方法可提取政策文本高频词中最具影响力的关键词,有助于提高对政策文本内容理解的准确性。(3)本文以国家创新驱动政策文本为研究样本,准确提取了“创新”“创业”“发展”等出现频率最高的3个关键词,为准确理解国家创新驱动政策奠定了可靠基础。
政策工具可分为供给面政策工具、环境面政策工具与需求面政策工具3类。需求面政策工具包括公共采购、价格补贴和贸易管制等,主要是直接作用于市场维度,目的在于稳定市场预期,减少创新成果所面临的初期市场不确定性,推动创新主体的技术研发。供给面政策工具主要包括科技基础设施建设、科技投入、人才激励培养等形式,更多地表现为政策对共性技术研发的推动,对企业技术研发提供支撑。环境面政策工具主要体现为创立产品标准、规范和要求,通过正式的法律法规和制度对产品性能产生影响,包括标准设计、知识产权、法规管制等。本文对单个政策中出现频率处于前10位及前20位的高频词进行特征分析可知,我国的国家层面创新驱动政策主要以供给面政策工具为主,涉及少量环境面政策工具。具体表现为:《国家创新驱动发展战略纲要》强调国家的核心支撑力量是科技创新能力,要按照“坚持双轮驱动、构建一个体系、推动六大转变”进行布局,采取差异化策略和非对称路径构建新的国家发展动力系统,最终走出一条从人才强、科技强到产业强、经济强、国家强的发展新路径;《国务院关于强化实施创新驱动发展战略进一步推进大众创业万众创新深入发展的意见》强调人才优先、主体联动,以人才支撑为第一要素;《国务院办公厅关于县域创新驱动发展的若干意见》指出,我国实施创新驱动发展战略的基础在县域、活力在县域、难点也在县域;《中共中央 国务院关于深化体制机制改革加快实施创新驱动发展战略的若干意见》强调,要让市场在资源配置中起决定性作用,并更好地发挥政府作用,破除制约创新的思想障碍和制度藩篱,营造有益于创新的政策环境和制度环境;《国务院办公厅关于完善国家级经济技术开发区考核制度促进创新驱动发展的指导意见》指出,国家级经开区是目前我国先进制造业的聚集区和区域经济增长极,在所肩负的历史使命和国际国内形势深刻变化的背景下,国家级经开区应成为创新的落脚地、科技创新驱动和绿色集约发展的示范区。创新驱动打造发展新引擎,培育新的经济增长点,是持续提升我国经济发展质量和提高国家核心竞争优势的内在要求[20]。科技创新中的技术创新,尤其是颠覆性核心技术的创新,具有高投入、高风险、高门槛、长周期、人才密集的特征,在技术系统中具有关键作用,因此,推动核心技术创新有利于维护国家安全、促进经济高质量发展[21]。由于我国经济与科技能力存在地区差异,各地政府在制订区域创新发展政策时,应充分考虑以下3个方面。
5.2.1 目标集聚,明确创新驱动焦点
差异化战略与非对称发展路径是国家创新驱动发展战略的核心指导思想之一,各地在制订本地创新政策时,应对科技创新在创新驱动中的核心地位有充分的认知。如何客观、准确地制订适合本地的创新驱动政策是各地区面临的最棘手的难题,尤其是创新资源较差的地区。立足于本地资源禀赋,有所为同时有所不为是最基础的原则。创新资源丰富的地区,可立足于国家战略,着眼于全国乃至全球的关键共性技术开展创新;创新资源贫瘠的地区,可充分整合本地的各种资源,利用不同类型的创新平台开展创新。
5.2.2 多要素协同,驱动经济高质量发展
实施创新驱动发展战略是以科学发现为源头的发展模式,这种发展模式需要科学家和企业家协同、高校和企业协同、企业与政府协同、企业与资本市场协同,即围绕价值链、利益链、科技链、金融链、人才链五大链条实现有机耦合,整合出一条具有高素质的创新人才队伍、强大的科研创新能力和产出能力、高壁垒的产业领域的经济高质量发展,建设共同富裕示范区的发展新路径。
5.2.3 制度创新协同,实现不同主体价值共创
在创新驱动战略目标的实现过程中,科学家、企业、政府及其他利益相关者具有不同的利益诉求点,分布在不同创新链、价值链的利益相关者具有各自不同的利益诉求,要通过制度创新建立能够有效激励创新主体行为的制度规则和政策体系来协同不同创新主体的创新活动。培养高素质科技创新人才、鼓励原始创新、优化创新资源配置、提高创新效率、促进创新成果转化与产业化、保障国家创新驱动战略的持续进行和真正落地是实施国家创新驱动发展战略的重要环节,因此,必须通过政策协同实现创新驱动发展战略在实施过程中行动原则、推进步骤的协调统一。
制定和实施创新驱动政策既是我国自身发展的需要,也是我国应对国际竞争的迫切需要。本文基于自然语言处理技术和社会网络分析方法,对我国国家级有关创新驱动政策进行了分析与评价。首先,通过自然语言处理技术提取了政策文本中的高频词并构建共现网络;其次,利用社会网络分析方法对社会网络特征进行分析。结果表明,我国的国家层面创新驱动政策具有以下3个特征:其一,政策文本高频词的网络分为内层与外层两个圈层,不同圈层之间的连接强度不同;其二,突出创新与发展,并以国家级经济技术开发区和县域发展为抓手;其三,政策文本高频词网络中内层与外层高频词的影响力具有明显差异。本文提供的政策文本分析方法与技术,可为其他政策文本(如国家精准扶贫政策等)的内容分析提供参考。
但本文仍存在以下不足:其一,没有收集我国省域的创新驱动政策,缺乏对省域创新驱动政策特征的研究;其二,没有收集到与创新驱动政策相关的产业数据,未对创新驱动政策与受其鼓励的产业绩效之间的关联关系进行确认。上述领域仍有待未来进一步的研究和分析。