融合创新价值链和文本关联挖掘的我国人工智能政策扩散特征研究

2024-03-18 04:54武楷彪董瑜
现代情报 2024年3期
关键词:人工智能

武楷彪 董瑜

关键词:政策扩散:创新价值链:文本关联挖掘;人工智能

政策扩散是政策过程理论的重要研究领域,研究内容主要包括特征、影响因素和机制等。随着自然语言处理技术的不断发展以及政府信息公开措施的逐步加强,政策扩散的路径与活动得以被更好地记录,从而为该项研究提供了新视角与更多的数据样本。当前,越来越多的学者运用文本挖掘方法来分析政策扩散特征,并已在政策文本语义挖掘方面取得了较大进展。但从计算社会科学的视角来看,还需在政策扩散特征规律挖掘基础上结合相关理论与方法探索其背后的影响因素和机制,即遵循先“大数据发现”后“小数据验证”的逻辑。为实现这一目标,需要对政策文本挖掘方法进行改进,其中就包括增强政策文本挖掘结果的理论性,这是因为人们普遍认为大数据方法强调数据驱动和相关关系发现,而社会科学研究注重因果分析,而从相关关系走向因果关系需结合研究议题的领域知识和理论:回到基于文本挖掘的政策扩散研究中,以政策扩散的主题分布特征研究为例,现有研究大多集中在不同机构之间政策主题分布异同、演化趋势的描述性分析,而较少探究主题分布特征背后所蕴含的政府行为逻辑、价值取向以及扩散机制。事实上,目前已有研究指出,在政策扩散特征研究基础上寻找扩散的驱动因素和动力机制,既是未来研究的重要议题,同时也是计算社会科学快速发展背景下数据驱动方法和学科指导理论不断融合交叉的必然要求。

当前,对政策扩散过程中政策主题挖掘大多是运用人工编码或概率主题建模方法,其中,人工编码方法可以根据需要选择研究者关注的主题要点,但面临效率低下的问题:而概率主题建模由于对主题的判断并无统一的标准,因而结果难以复现,更重要的是,目前还尚未有较好结合主题模型和公共政策理论的政策扩散特征研究。而在政府医疗服务评价等领域,已有学者开始尝试采用成熟的理论来辅助判断主题聚类算法得到的主题含义。为此,本文尝试建立文本挖掘主题与现有成熟理论分析框架之间的映射关系,以更好地揭示政策扩散过程中不同政府对同一政策议题不同方面的价值取向异同以及背后的潜在机制。本文以我国人工智能政策为分析对象,探讨了如何有效结合文本挖掘方法和创新价值链理论测度政策擴散特征并探究其背后的扩散机制。在文本挖掘方法设计上,本文从文本相似度和主题分布比例两方面揭示政策内容扩散程度和主题扩散分布特征。在基于创新价值链的政策主题分析框架构建上,由于我国人工智能政策布局是覆盖人工智能理论研究到促进社会发展的全过程,而政策主题扩散(即由政府价值取向所反映的政策主题选择性扩散)可以发生在创新价值链的各个阶段。因而,本文选择创新价值链理论构建文本分析框架,具体是通过建立政策文本词汇与创新价值链理论的对应关系实现政策扩散主题倾向性分析。

在得到政策主题扩散分布计算结果后,本文进一步分析了政策扩散的潜在机制。已有大量研究表明,地方政府的经济资源是影响政策采纳主题倾向性的重要因素.而对于科技政策而言,某地科技资源存量会影响该地政策采纳倾向性。不同于之前研究是采用因果推断方法建立了地方政府的资源禀赋与政策采纳与否(即二元变量)的关系,本文尝试从文本数据挖掘角度试图探索政府科技发展情况与政策主题倾向(即定序变量)的关系,最终发现政策主题扩散倾向性与政府资源禀赋之间存在相关性。从方法改进角度,通过探索基于成熟理论的政策文本主题确定方法,有助于弥补当前政策文本分析领域存在深层次方法创新欠缺而应用研究富余的不足。从政策扩散实践角度,通过探索我国人工智能政策扩散实践过程特征,可为我国人工智能政策试点示范推广提供补充性的依据。

1国内外文献综述

1.1基于文本挖掘的政策扩散特征研究

1.1.1政策扩散的概念

政策扩散(Policy Diffusion)通常是指政策创新的扩散,包括两个角度:一是政策创新(Policy Inno-vation),二是创新扩散(Innovation Diffusion)。Walk-er J将政策创新定义为,某一政府首次采纳的政策或项目(无论该政策或项目是否已经出现或已被其他政府采纳)。Rogers E M将创新扩散定义为,“政策创新的传播过程就是创新扩散”,即一种新的理念、思想或方法在社会系统中交流。上述两个角度实际上都是对政府A的政策创新被政府B采纳这一政策过程的观察。通过文本挖掘分析政策扩散特征可分为政策内容扩散程度研究和政策主题扩散分布研究。

1.1.2政策内容扩散程度特征研究

政策内容扩散程度主要是通过文本相似度计算描述政策扩散过程中不同机构发布政策文本的相似性和差异性来衡量,其反映的是不同机构之间政策总体相似性。通常采用政策文本相似度计算,一般而言,文本相似度数值越高,就代表一项政策的扩散程度越低,即新政策对原型政策的细化更新较少。这类研究会将文本计算结果结合其他分析对象(如文本颁布的机构等)进行进一步特征规律的揭示。如Garrett K N等通过立法机构颁布文本和利益集团机构颁布文本之间的相似度构建政策扩散网络,再运用社会网络分析的方法研究利益集团在政策扩散网络中扮演的角色地位。Hinkle R K通过对法律文本计算研究了联邦法院在洲际政策扩散中的影响,具体是对比洲际政策文本与联邦法院立法文本之间的相似性,反映各州立法者对联邦法律政策学习和模仿的程度。Linder F等提出了一种可识别立法文本的相似序列以衡量文本之间相似性程度的算法,并进一步测算了政策传播网络中政策模仿状态变化,最终得到由意识形态相似的发起人提出的法案具有很高的文本重用率等结论。Alschner W等对2100份IIA(International Investment Agree-ments,国际投资协议)的24 000篇文章从4个维度(国际维度、国家维度、扩条约水平以及个别条约)研究全球主要国家(地区)的投资条约文本中的一致性和创新性,从而发现各国(地区)投资政策内容变化。郁建兴计算了“最多跑一次”政策扩散中浙江省出台的政策文本与27个省份出台的“最多跑一次”政策文本的相似度。王雪玲研究了各城市海外高层次人才市级核心政策的文本相似度以测度政策扩散程度。

1.1.3政策主题扩散分布特征研究

主题扩散分布研究主要通过政策文本主题来反映政策扩散过程中不同机构之间的政治理念传递、政令部署和政策议题采纳等主题扩散倾向特征。通常是先计算文本主题分布,再分析这些主题在政策扩散过程中的变化。当前对主题分布的挖掘方法主要集中在主题模型。如王芳等从政策发布时间、布局数量、政策主题强度等维度提出了大数据政策扩散倾向性模型。政府机构的政策扩散倾向性分值越高,则代表越倾向于进行政令部署(如政治经济布局和动员等),其中对政策主题扩散强度的刻画便用到了LDA主题模型。段尧清等利用开源工具,提炼了政策文本的关键词,接下来计算了政策主题扩散的继承比、扩散比和创新比。裴雷等提出了针对信息政策主题扩散的涟漪效应与漏洞效应的5项指标:扩散比率、继承比率、扩散加权比率、继承加权比率与主题分布相似性。Gilardi F等研究了在政策扩散的问题定义阶段引入Text-as-Data方法的可行性,具体使用了结构主题模型(Structural Topic Model,

STM)对1996-2013年49份有关禁烟政策的报纸中共计52 675个段落文本数据进行分析,最终验证了4项影响政策扩散框架因素的假设。

1.1.4小结

综合已有研究发现,现有政策扩散特征研究在具体文本挖掘技术方法选择上存在差异:国外学者倾向于使用文本相似度,而国内学者多基于引用关系和主题模型,而主题模型中主题含义通常是由主观决定的,其理论性和可解释性较弱。针对这一不足,已有研究开始讨论如何通过构建词典的方式来完成主题模型的词汇聚类结果与现有理论主题的映射,这类通过理论驱动主题识别的方法对于社会科学研究人员而言,可有效提升主题结果解释力和增加与理论对话的空间。在政策扩散研究中,政策文本是政府进行社会利益和价值分配的载体,而不同层级政府面临的资源约束和预期目标也不相同。政府面对一项新政策时,通常会进行一定程度的调整,换言之是改变原有政府的价值排序。因此,应当尝试从理论视角搭建政策扩散过程中的主题变化分析框架,以更好地挖掘不同政府之间的价值传遞结果。

1.2基于创新价值链理论的人工智能政策研究

本文拟选择人工智能政策作为实证分析对象,理由包含:人工智能技术是当前世界科技强国在新一轮国际科技竞争中争夺的焦点;与其他国家(地区)政策相比,中国人工智能政策尤其注重顶层设计和引导功能,并强调应用端市场的牵引,在技术研发与应用、产业经济发展和智能社会等方方面面主题均有布局。因此,从实证角度,可较充分说明政策文本词汇与主题对照过程;从现实角度,就我国而言,在颁布《新一代人工智能发展规划》后,“中央一地方”“地方一地方”之间形成了显著的传播、采纳和借鉴现象,即我国人工智能政策扩散符合现实情况。

在政策文本主题研究方面,现有分析维度有政策工具、政策目标、政策主体以及针对政策对象特点构建的理论分析框架,具体在人工智能政策研究中,学者基于创新价值链理论构建了文本主题分析框架并取得一定进展。创新价值链(Innovation Val-ue Chain,IVC)是在价值链理论基础上融人了技术创新理论,其包含从创新源到从创新源转化为新产品、再到市场化的不断增值过程,在产业政策文本分析中,由于创新价值链理论蕴含的技术价值实现过程与新兴产业成长发展过程比较一致,学者已借助该理论分析科技成果转化政策、5G技术发展政策等。

我国人工智能政策重点在于对人工智能产业链各个环节进行布局,包括基础理论研究、技术研发、产业融合以及对社会整体福利的促进,现有研究在创新价值链的阶段划分上各有侧重:如汤志伟等研究维度包括基础理论研究、应用技术深化、学科人才建设、产业市场发展和服务智能社会5个方面。马晓飞等则是从基础层、技术层和应用层3个方面对文本内容进行分析编码。吕文晶等从政策工具和创新过程两个维度展开分析,其中创新过程维度被划分为科学技术研究、产业化和商业化3个阶段。宋伟等从基础理论、核心关键技术、支撑平台、产业化、融合应用和发展环境6个方面展开了各省政策的比较分析。张涛等主要关注人工智能政策的五大任务(科技创新体系、智能经济、智能社会、央地融合以及科技项目)主题相似程度。

上述研究在方法上以人工编码为主,在内容上主要关注政策中有关创新价值链的技术创新过程,而忽略了政策环境、创新主体以及支撑要素等在创新价值链中扮演的角色。因此,有必要进一步拓宽现有创新价值链分析框架的维度,同时构建更为自动化的从文本主题到创新价值链过程的政策文本挖掘方法,从而更好地描述各地政府所颁布的人工智能政策中政策议题的选择倾向性。

2政策扩散特征测度方法构建

依照前文所述,政策扩散特征主要包含两部分:一是内容扩散程度特征,直接通过已有文本关联挖掘算法实现测度,该算法是通过对文本进行依存句法分析得到短语词组的方式计算相似度,除了计算结果较为准确,还可识别文本之间具体关联的短语结构,可直接利用该算法计算政策文本之间相似度来测度内容演化特征。二是主题扩散分布特征,核心包含两个步骤,如图1所示,分别是映射词典的构建及验证和政策主题扩散分布计算。

2.1映射词典构建及验证

2.1.1基于创新价值链的政策文本主题分析框架构建

在已有研究基础上,为更细致地分析不同地方政府颁布政策的主题倾向性,借助采用映射词典识别政策主题方法的优势,本文进一步拓宽主题分析框架的维度,分别从发展阶段、创新主体及合作组织、支持要素和政策保障4个维度构建基于创新价值链理论的文本主题分析框架。其中,发展阶段维度构建了人工智能从基础理论研究到技术研发应用再到最后人工智能产业发展以及促进社会整体智能化的过程:创新主体及组织合作维度主要关注参与创新价值链的实体,可能包括从事人工智能技术的研发机构、产品生成的相关企业以及创新主体之间形成的合作联盟(如产业集群、创业园等);支撑要素维度涉及人才、资本以及底层资源和服务平台,最后是政策保障维度。

2.1.2关键短语抽取和映射词典构建及验证

本文利用依存句法分析和语义计算将政策文本拆成多个围绕句子核心词汇的两类短语结构,一类是动宾短语结构,如“建设人工智能人才实训基地”;一类是修饰短语结构,如“科研院所”“产业联盟”等,上述短语结构可以较好涵盖并传达句子的核心内容。因此,本文将政策文本抽取后的高频短语结构与上述主题分析框架建立一一映射关系,由此便可实现短语结构词汇对应词典的构建。具体在构建词典过程中为了保证词典构建的信度和效度,本文还涉及了多人多轮编码与专家知识相结合的方式,并根据政策文本固有篇章结构构建了文本“内容一主题”的验证集来进一步验证词典的准确性。

2.2政策主题扩散分布特征计算

在构建完成词典之后,便可对政策文本主题分布进行测度。在具体实验过程中,本文发现政策文本的章节标题往往是对所在章节内容的有效概括,可综合章节标题和内容共同判断文本主题以提高准确率。因此,本文在实际进行政策主题分布计算时,通过词典分别得到文本篇章结构中标题与内容的主题,通过对比两者结果(若一致,则根据结果得到主题维度;若不一致,则引人人工判读)从而实现更加精准的主题分布计算。最后,在主题分布计算结果基础上,通过比较不同省份在基于创新价值链理论构建的主题分析框架中的分布情况得到政策主题扩散分布特征。

3我国人工智能政策扩散特征的实证研究

3.1政策文本数据搜集和预处理

3.1.1数据搜集时间范围

自2017年国务院颁布《新一代人工智能发展规划》以来,我国人工智能相关政策进入深化阶段,并开始强调在各行业领域的试点示范,因此,本文将数据搜集时间限定在2017年7月8日(《新一代人工智能发展规划》颁布时间)-2021年12月31日。

3.1.2数据搜集过程

首先,在北大法宝、iPolicy政策分析系统以及各级政府官网根据关键词“人工智能”进行标题检索,获得初始数据集;接下来,对初始数据进行人工筛选。鉴于本文主要从政策文本内容的角度分析人工智能政策扩散特征,为保证搜集得到的政策文件具有可比性且符合政策扩散实际情况,在人工筛选时保留了规划类文本,如政策文本标题含“发展规划”或“产业规划”等词汇,同时删除人工智能创新发展试验区的回复函等文本。此外,还有一些省份的人工智能政策规划文本标题为“智能XX发展规划”,如《智能贵州发展规划(2017-2020年)》也一并纳人数据集。在初步形成本文研究数据集后,对比现有人工智能政策研究中采用的数据集以查漏补缺,同时剔除掉已失效的政策文件,最终形成针对人工智能发展制定的规划性或纲领性政策文件库,共110份。其中,由国家级或省级政府机构颁布的政策文件57份,地级市及以下行政级别政府政策文件53份。

3.2政策扩散的时空分布特征

3.2.1时间分布特征

统计随时间推移累计出台人工智能政策的省级政府数量如图2所示,其扩散趋势符合S型经典累积分布曲线。图2表明截至2021年年底,我国共有24个省份(不含港、澳、台地区)颁布了人工智能政策,其累计分布曲线反映我国人工智能政策呈现早期快速扩散、中期逐步放缓的特征。

3.2.2空间层级特征

使用Gephi绘制2017-2021年我国人工智能政策扩散网络,具体是以各个省份出台的政策文本为节点,政策之间的参照关系为节点之间的连边,将演化过程以年为单位进行切片,再从网络密度、网络平均模块化指数和网络平均路径长度分析我国人工智能政策扩散网络演化特征和趋势,如图3所示。

可以发现,随时间推移,我国人工智能政策扩散网络密度逐步降低,这表明网络节点之间连接紧密程度呈下降趋势,即“地方一地方”之间的政策扩散现象逐步增多;平均度先上升、后下降。在2018年、2019年我国密集出台了大量人工智能政策,随后年份出台数量减少。模块化指数不断上升,即各省份出台的人工智能规划政策与配套政策之间逐步形成模块。网络平均路径长度不断上升,这是因为人工智能政策正不断从中央向地方省市区进行扩散,网络层级结构不断增加。整体而言,我国人工智能政策扩散网络的核心节点始终是中央出台的两项政策,呈现出“由点到面”的特征。

3.3政策内容扩散程度特征

以中央文件为对比对象,对24个省份的人工智能领域政策文本进行相似度计算,为保证各省之间纳入计算的政策文本具有可比性,只考虑省级政府层面颁布的政策文本。在计算之前,还需对文本进行预处理:删除文本中与人工智能规划部署无直接关联的内容(如战略态势、指导思想等),仅保留对人工智能发展规划做出详细部署的内容(如重点目标、保障措施等),此外还删除政策内容中的专栏部分内容。同时,若该省份发布的人工智能领域政策数量超过1份时,对该省份进行标记,最終得到各省份相对于中央政策文件的相似度数值如图4所示(按相似度从高至低展示)。

由图4可知,这24个省份和直辖市的平均相似度为0.704,其中,颁布文本数量为1份的省份平均相似度(0.726)高于政策文本数量大于1的省份平均相似度(0.679)。因此,从数据反映的特征可以发现,中国人工智能政策在扩散过程中,各个省份首先会学习模仿中央出台的政策规划,然后再根据本省的实际情况出台其他配套政策,因而出台政策较少的省份与中央政策相似度越高,因为出台政策较少的省份尚处于政策扩散早期,因此会倾向于先模仿中央政策迅速出台相关政策文件。然而,文本相似度数值对政策扩散过程内容变化程度揭示的粒度仍较粗,因此,有必要进一步探究各省政策文本主题扩散情况。

3.4政策主题扩散分布特征

3.4.1主题映射词典构建及验证

首先构建文本短语结构与主题分析框架映射关系的词典,具体从实际分析的政策文本(字数约351844字)中分别抽取两类短语结构,其中动宾短语结构13437个,修饰短语结构8328个,依据短语的依存关系,从这些短语结构中抽取主要成分关系(动宾结构和修饰语结构等),再剔除掉结构中不能表达文本主题的词汇(如动词、介词等),得到7572个不同词组。在建立映射关系词典时,主要考虑高频短语词组,这是因为高频短语词组往往也是政策文本内容关联的词组结构。高频词组的选取过程参考了学界对高频词的选取方法,研究表明,借助二八定律的思想来确定高频词阈值是比较合理的。具体到本研究,以累计词频为20%的词组结构作为高频词组,则应选取频率大于或等于13的词组作为待分析高频词组,考虑到并非所有高频词组都能一一对应至主题分析框架,因此适当拓宽词组,最终选取词频大于等于12的词组,得到154个高频短语词组。通过回溯政策文本内容,结合上下文语境,将这些词组对应到文本主题分析框架不同维度,形成最终高频短语词典,如表1所示。

本文还进一步验证了所提主题分布算法的有效性,由于政策文本标题可在一定程度上概括章节内容,因而可将部分段落作为算法测试验证集。本文从原始文本数据集中提取了105个政策文本段落,人工标记文本主题标签用于测试算法有效性,在分别计算不纳入和纳入章节标题后,发现算法准确率由72.54%上升至82.35%。由此可见,本文算法可较好地辅助人工主题识别和判读,且考虑章节标题主题的算法,有效提升了主題识别准确率。

3.4.2政策主题扩散分布结果

央地政策主题分布计算如图5所示,可发现央地政策在创新价值链各环节上均有所布局,但侧重点有所不同。

上述主题扩散分布计算结果表明,从整体上,在发展阶段维度,中央和地方都更关注“技术研发与应用”,可见当前我国人工智能发展规划更为人工智能技术的研发及具体应用,具体体现在对人工智能相关产品针对性展开布局:在创新主体及组织合作维度,中央和地方都更注重强调发展人工智能企业;在支撑要素维度,中央和地方都较少对资金资本进行规划,而更强调人才建设和资源平台在人工智能发展中起到的作用。在央地政策细分主题对比上,计算相较于中央而言各省颁布政策主题的侧重点。计算结果表明,发展阶段维度,北京市、上海市、福建省、天津市、广东省、浙江省、江苏省和安徽省更注重在创新价值链的前端进行布局:陕西省、山东省、河南省、吉林省、贵州省、山西省、江西省、广西壮族自治区、甘肃省、黑龙江省和云南省则更注重在创新价值链的后端进行布局:创新主体维度,除企业以外,相较于中央政策而言,安徽省、北京市、福建省、广东省、上海市和江苏省更强调科研机构作为创新价值链主体发挥的作用:支撑要素维度,中央当前发布的政策更强调人才建设,具体表现在教育部出台了两项有关加强人工智能人才培养和学科建设的政策文件。而各省份有的更强调加快人才培养,有的则更强调建设资源平台。其中,安徽省、重庆市、广东省、甘肃省、贵州省、黑龙江省、湖北省、吉林省、江苏省、江西省、辽宁省、四川省、山东省、上海市、陕西省、山西省和浙江省这17个省份更强调对资源平台建设的布局,而北京市、福建省、广西壮族自治区、河南省、天津市和湖南省这6个省份更强调人才建设;政策保障维度,中央与地方政策这一部分内容占比相较于其他维度较少,与中央政策相比,有7个省份有关政策保障的内容占比较高,表明这些省份更强调人工智能发展规划中软环境的营造,分别是重庆市、广东省、甘肃省、广西壮族自治区、黑龙江省、辽宁省和山西省。

3.4.3政策扩散潜在机制探因

为进一步考察政策扩散潜在机制,本文建立各省份人工智能发展阶段与政策主题扩散倾向性的关系。其中,各省按人工智能的发展程度划分3个梯度,划分方式参考了国家工业信息安全发展研究中心发布的《中国人工智能产业发展指数(2019)》、中国互联网协会和中国信息通信研究院发布的《中国“智能+”社会发展指数报告(2019)》和吕荣杰等对中国人工智能区域发展水平的动态测度,结合政策主题扩散分布计算结果得到各省在创新价值链各环节主题侧重如表2所示。

将省份所在梯队阶段和政策主题扩散倾向性分别作为定序变量并赋值,并计算两者的Spearman等级相关系数。结果表明,在0.01的置信水平区间上,两者相关性为0.6636,由此发现,地方政府在面对中央政府政策文件时,当前人工智能发展状况较好、具有较多科技资源的省份会相对更注重对创新价值链的前端进行布局,反之亦成立。对于这一现象,行政指令机制可作为潜在解释机制。在我国人工智能政策发展过程中,中央颁布了《国家新一代人工智能创新发展试验区建设》(以下简称“试验区”)的相关文件,指出要在2023年建成20个试验区,通过先行先试的方式探索人工智能技术与经济社会的融合路径,探索适应人工智能创新发展的制度环境和智能时代政府治理的方法,以及强化人工智能发展的基础设施建设,并重点依托人工智能创新资源较为丰富的城市作为探索载体,发挥引领作用。在试验区的建设过程中,科技部对各城市发展试验区的致函中体现了对不同城市发挥示范引领作用的要求,如对北京市强调“打造全球人工智能技术创新策源地”、对杭州市强调“打造人工智能产业聚集高地”、对济南市强调“推动人工智能在重大场景中的创新应用”等。由此可见,上级政府及部门通过直接介入政策内容,以行政指令方式推动了人工智能政策的广泛扩散和实施,对于各省市的要求贴合该省市的资源禀赋,由此影响了各省政策规划布局重点的倾向性和价值取向。在未来,为进一步增强我国人工智能产业发展的推动力,可适当采用政治和经济手段混合激励方式。

4结论和讨论

本文构建了融合创新价值链理论和文本关联挖掘方法的政策扩散特征测度方法,并以人工智能政策为例说明了这一过程。研究结果表明,相较于中央政策,各省人工智能政策主题扩散各有侧重,其中,人工智能发展状况较好、具有较多科技资源的省份相对更注重对创新价值链的前端(即基础理论)进行布局,反之亦成立。此外,在日寸间上,呈现早期快速扩散、中期逐步放缓特征;在空间上,形成了围绕中央颁布政策的扩散网络,且地方政策正逐步形成模块化效应;在内容上,各省政府先“学习模仿中央政策”后“因地制宜创新细化”。

与现有研究相比,本文部分结论与前人研究一致,如宋伟等提出,央地政策均更强调人工智能技术应用。单晓红等比较了人工智能产业区域(京津冀、长三角、珠三角)政策,指出这些区域政策主题均侧重于基础理论与技术研究以及相关产业智能化升级。在内容扩散程度研究方面,有学者的计算结果也同样表明,辽宁省人工智能政策文本与中央政策文本相似度最高。但需要特别说明的是,上述关于政策主题扩散研究对特定主题的识别采用的是人工编码方式,而本文是通过建立词典的方式,考虑到政策文本用词的稳定性以及构建的主题分析框架不仅仅适用于人工智能政策,也同样适用于其他对贯穿创新价值链各环节进行政策指引的科技政策。因此,本文构建的词典和分析框架具有一定的拓展性,可重复利用在其他相关领域政策。

除了上述提到的优势,得益于基于成熟理论构建的政策文本主题分析框架,本文核心贡献在于在政策主题扩散分布特征基础上,进一步探讨了各级政府主题倾向与其资源禀赋关系以及潜在扩散机制,这将有助于更细粒度揭示政府创新行为。当然,本文目前还处于相关性关系探索阶段,未来可以在本文结果基础上,将内容扩散程度数值作为因变量,将潜在影响因素(如科技资源)作为自变量,建立回归方程进行因果推断研究。

猜你喜欢
人工智能
我校新增“人工智能”本科专业
用“小AI”解决人工智能的“大”烦恼
当人工智能遇见再制造
2019:人工智能
AI人工智能解疑答问
人工智能与就业
基于人工智能的电力系统自动化控制
人工智能,来了
数读人工智能
人工智能来了