陈 美 孙瑞乾
(中南财经政法大学公共管理学院 武汉 430073)
随着信息通讯技术(ICT)丰富完善,数字经济逐渐成为全球经济增量的主要贡献来源[1],并在后疫情时代下深度渗入各个社会领域,成为最具潜力的经济业态。数字技术为我们的经济和社会带来了前所未有的机遇。数字领域的技术创新正在提高生产力、培养创造力和推动创新。根据中国信息通信研究院测算数据,我国2020年数字经济增加值规模首次进入世界前十位,且保持良好的增长速度。2022年12月,中国信息通信研究院正式发布《全球数字经济白皮书(2022年)》。白皮书指出,2021年,从数字经济规模看,中国位居第二,为7.1万亿美元[2]。作为我国经济高质量现代化发展的重要引擎,数字经济同时也产生了“双刃剑”的破坏效应[3],如“数字鸿沟”问题[4]、冲击挑战现行贸易制度[5]、与政府治理理念与手段不协调[6]等,错综复杂的国际环境也为数字经济持续发展带来新矛盾和新挑战。在机遇与危机并存的背景下,亟待设立相关政策制度以配套保障数字经济蓬勃发展。《“十四五”数字经济发展规划》中明确加快数字化发展、建设数字中国部署,以展望2035年我国数字经济顺利迈入繁荣成熟期。
数字经济需要政府积极发挥政策引导作用,加快数字发展并赋予人们正确的技术技能,使他们能够开发技术解决方案,推动数字化转型,为人们提供就业机会,并最终支持政府的整体数字经济议程。为完善地方数字经济治理保障体系、提升数字经济竞争力和影响力,我国各地方政府纷纷出台地方法规与规范性文件来引导当地数字经济健康发展,以响应完成国家“十四五”数字经济发展规划及相关政策。截至2022年12月,现行有效的地方数字经济综合性法规与工作文件共有43份,覆盖全国24个省份。数字经济政策通过其公共政策属性来配置人力、技术等多种资源,旨在重新定位经济,以利用数字技术提供的众多机会,为信息通讯技术行业必须开展的主要活动指明了方向,以巩固行业已有的成就并突出应重点关注的新领域,以便国家实现真正的数字经济。在这个背景下,本文借助LDA主题模型实现对各省级数字经济政策的自动化效词分析,提取政策的共同主题,以厘清现今省级数字政策要点和现状。同时,通过社会网络分析(SNA)模型共现主体特征词的网络图,力图佐证分析结果,为数字政策的路径规划和各层面政策之间的耦合互动提供借鉴。
政策计量分析是基于政策文本特有的结构要素而统计分析其分布特征,如张会平等[7]采用CitesSpace 5.0分析来自政府门户网站189条文本的时间分布、关键词共现网络。但该方法较为依赖成型的结构化语料库,在深层次上并没有摆脱人工解读的限制和局限[8]。内容分析法则针对文章内容所含信息及其变化进行分析,从而提出可再现、有效的推断,其方法重点是对分析单元的定义编码[9]。进入数字化时代后,Ethnograph、Nvivo、QDA Miner、ROST CM、ALCESTE等计算机编码工具出现大大提高编码分析效率[10]。国内学者纷纷应用该方法分析众多领域的国家政策,如黄新平等[11]从政策工具视角,通过Maxqda质性分析软件研究我国科技金融发展政策。裴雷等[12]对省市县三级智慧城市政策文本的建设实践与应用进行扎根统计,发现我国智慧城市政策未来应多注重平衡性与多样性的协调。在政策演变和协同研究领域,洪伟达等[13]从时间维度,针对2012—2020年我国省部级以上开放政府数据政策进行量化分析,得出应进一步提升政策强度、明确政策目标和促进政策协同配合的发展方向。
效词分析法源于自然语言处理,并由Grimmer等[14]最早提出检验流程。与前两种方法不同,该方法通过机器学习、文本挖掘等[15]可实现最大程度的自动化文本分析,故在处理大样本政策数据集与政策量化研究的深度上具有天然优势。盛东方等[16]应用LDA模型探究突发公共事件背景下我国中小企业扶持政策的供需匹配问题。在政策演化过程方面,张宝建等[17]采用K-means发现我国1996—2017年的国家科技创新政策存在各阶段差异性和失配性。在政策主题方面,张涛等[18]针对我国138部人工智能政策进行主题热点与演进分析,以更好廓析我国人工智能政策路径,助力人工智能稳定有序发展。在国外,该方法还延用到利用非政策文本来分析探寻公共政策问题,如Andrea Ceron等[19]运用社交媒体网络信息分析预测意大利与法国的选举结果,同时建立政党派系识别、舆情监测的计算化模型[20]。由于完全依赖计算机的自动化分析,内容分析法可能会存在过度拟合模型与解读数据[21],但可通过困惑度指标、主题一致性得分等方法确定最优主题数来进行一定程度的避免,保证分析效果的准确度和可信度。
作为社会学的经典方法,社会网络分析法近年来逐渐进入政策研究领域,引起一部分学者的关注使用。汪洁等[22]首次引入该方法分析了江苏省38份产学研合作政策。张超等[23]运用此方法描绘1978—2017年693份中国创新创业政策文件之间的交互作用,并分析该政策主体的演变过程。基于LDA和SNA模型,苏林等[24]进行对我国科技创新政策的文本计量分析,发现该政策的发文主体较为分散,有待探寻发文主体多元化合作。但是,通过文献梳理发现,在数字经济政策分析领域,尚未有学者使用社会网络分析(SNA)方法对省域层面的数字经济政策展开分析讨论。
以数字技术为核心的数字经济一个突出特点便是实践领先于政策,政策领先于理论[25]。Christopher Foster等[26]广泛分析各发展中国家的现行数字经济政策,发现政府干预型政策可以更有力促进数字经济相关产业发展。我国数字经济政策起步较晚,直至党的十八大以后,数字经济政策的实践与理论研究之间良性耦合互动效用才逐步开始发挥效用[27]。在早期,我国相关研究集中于借鉴学习国外各国数字经济政策的理论研究,如于晓等[28]学习欧日韩发展数字经济的经验,倡导我国建立与数字经济发展相符的治理体系;基于“数字破坏效应”视角,陈友骏等[29]评析日本数字经济政策释放经济发展潜能作用;丁声一等[30]借鉴英国数字经济战略得失,提出我国数字经济政策应建立协同治理机制,即与数字经济发展相符的市场体制[31]。
在我国数字经济政策的文本研究上,吴湘玲等[32]于2020年首次采用内容分析法分析中央政府层面9份政策文本中,发现以供给型政策工具为主。同时,也有学者借助PMC指数模型与共识型政策执行概念对单一省份的数字经济政策进行探讨的研究[33-34]。
综上,政策文本的分析研究框架和方法已经比较成熟完善,尤其以定量分析中的内容分析法和效词分析法为主,它们对于解读分析具体政策的焦点、路径和发展方向发挥重要作用。但从整体上来看,还有如下扩展空间。第一,现有研究较多涉及具体数字经济政策执行研究,较少对整体数字经济政策进行系统性研究。第二,较多涉及单一省份数字经济政策进行研究,较少从国家层面来进行宏观性的数字经济政策量化研究。第三,国内研究仍聚焦于数字经济政策文本的回顾总结讨论,实证量化类的分析研究相对较少,研究的实证证据还有进一步扩展的空间。鉴于此,本文运用自动化机器分析的LDA模型探究来自24个地方政府的43份数字经济政策,同时引入SNA模型分析特征词的共现网络支撑研究可信度,对省级数字经济政策进行无监督的主题内容挖掘,并对各主题词语进行政策工具倾向匹配,以分析省级层面的数字经济政策脉络与路径,力图为今后地方政策制定方向提供参考和借鉴。
借鉴既往关于政策工具研究视角[32-34],本研究引入Rothwdl和Zegveldt提出的观点,将政策工具分为供给型、需求型、环境型三类[35]。在数字经济政策情境下,供给型政策工具指通过供给数字发展相关生产要素直接推动数字经济发展,涵盖基础设施、资金、信息资源、人才、科技与公共服务等各类基本生产要素;环境型政策工具则是通过建构良好的内外部环境间接促进数字经济发展,既有政策法规、税收金融优惠的内部支持软环境,也有信息安全、信息流通的外部保障硬环境;而需求型政策工具致力于通过合作和贸易来发挥市场对数字经济的拉动效应。表1是数字经济政策的具体政策工具类型及其定义。
表1 数字经济政策工具的类型、名称和含义
本文对地方政府层面的43份数字经济综合性政策文本分析主要采用无监督的LDA主题模型法和社会语义网络分析法。一方面,本文使用无监督学习的LDA模型进行政策文本的主题提取上述各省级层面的数字经济政策文本划分为不同研究主题,并进行关键词合并整理,归纳探索各省级政策文本之间的联系。另一方面,在借鉴陈红琳等[36]关于社会网络分析与研究主题的关联方法基础上,本文使用社会语义网络分析继续探寻和验证LDA挖掘的主题特征词之间关联程度。具体而言,在经过LDA主题模型实现对长政策文本的无监督机器挖掘为12个主题下的各词语短文本的基础上,本文再通过PMI词语类似度来衡量LDA结果下12个主题特征词间的关联程度, 确保LDA结果的可靠性。其基本思想是统计两个词语在文本中同时出现的概率,如果概率越大,则两个词语的关联度就越高。两个词语之间的PMI值计算公式如式(1)所示。最后,再通过Gephi软件对所得共现程度数据进行绘图分析,进而从整体把握不同政策的战略取向方向。
(1)
考虑到政策样本的代表性、连贯性和整体性,文章以各省级地方政府围绕数字经济发布的综合性政策文件和地方性法规为研究对象,以从整体全面视角考察我国数字经济发展中的政策效应,而剔除只针对数字经济各个细小领域或技术的专项性政策文件。截至2022年12月,按照此条件在北大法宝和各省地方政府网站的公开数据和政务公开中共检索到43份现行有效的符合要求的文件,均为省市级政府签发的正式文件,覆盖全国24个省(直辖市或自治区)。
如图1所示,大多数各地方政府均发布1-2份数字经济综合发展规划政策,只有不到20%的省份发布更多的政策文件。各地方政府发文数量之间不存在显著差异,其中江西省以4份的政策数量位居各省围绕数字经济发文榜首。
图1 各省级数字经济政策省份分布图
图2呈现了43份省级数字经济政策的政策类型。可以看出,当今省级数字经济政策以通知为主,占比近77%,同时兼有少部分的意见和条例类政策。从整体来看,各省份的综合性数字经济政策体系尚在起步构建阶段,政策数量匮乏,政策聚合力量薄弱,以要求具体、执行性强的“通知”类政策为主,而缺乏统领性、指导性的文件,政策高度不足,有待建立更加全面完善的地方政府数字经济政策治理体系。
图2 省级数字经济政策类型分布图
以上述43份政策文本构建文本分析的语料库,调用中文分词工具Jieba进行分词预处理。在分词前添加如 “数字经济”“互联网+”“5G+”“数字XX”“智慧XX”“XX化”等与数字经济乃至数字化密切相关的新兴和专业词汇以提高分词准确度,确保后续分析结果的可信度。同时,使用包括虚词、地名等无意义词语的停止词列表,在后续分析过程予以剔除。
基于Python进行主题建模前,按研究惯例需要将LDA模型的两个超参数α和β分别设定为50/k和0.1,其中k是选择的主题数[37]。本研究使用主题一致性得分和困惑度曲线两种方法来综合确定样本政策文件的最佳主题数量。通过主题一致性得分提炼文本的高频主题数量,结果如图3所示。经计算得出,主题数为12时一致性得分最高,且之后一致性得分随主题数量增加而趋于稳定。因此,主题数12为主题一致性得分方法下的最佳主题数。
图3 LDA模型的一致性得分曲线
为保证最佳主题数量确定的稳健性,本研究继续通过式(2)计算政策文本困惑度,构建困惑度曲线(如图4所示)。困惑度曲线在主题数为(9,12)时急剧下降,在(12,14)趋于平缓。根据困惑度曲线结果,12为文本的最佳主题数量。
图4 LDA模型的困惑度曲线
(2)
结合两种最佳主题数量的确定方法,本文最终将12作为LDA模型的最佳主题数量,以进行后续LDA模型的挖掘分析。
在设定主题数量为12后,对43份政策进行无监督干扰的机器挖掘爬取,并应用Python将LDA主题模型最终的主题结果可视化(见图5、图6)。由图5所示,将主题数量为12时,各主题圆圈之间存在一定距离且分布在各象限,即LDA建模后的12个主题之间相对互斥,且反映原政策文本结果良好。同时,这也表明,我国省级层面的数字经济政策覆盖各个社会领域,影响广泛深刻。图6显示了政策文本中出现频率排名前50位的主题特征词语。可以看出,高频词语分别代表不同领域主题,主题词的同质化程度较低,政策分词效果良好,模型反映情况较为真实可信。其中,“发展”和“建设”成为仅落后于“数字经济”出现频率的高频频率,与上文43份政策近77%比例均为“通知”类型相符合。
图5 主题之间距离地图
图6 政策文本中出现频率排名前30的特征词词语
根据上述确定的最佳主题数量,无监督的LDA模型对于43份政策文本进行机器提取与分析,得到12个主题及其特征词,同时根据各主题特征词的词语属性与表1中的数字经济政策政策工具分类及定义,进行人工匹配其所属政策工具,从而得出该主题主要采用的政策工具类型(结果见表2)。气泡图显示的主题2与主题3存在部分重叠的情况,但根据主题特征词来看,两个主题反映具体内容并不存在相近类同状况,主题数量确定合适。
表2 省级数字经济政策的LDA模型结果
同时,根据主题特征词在全文出现频率大小制成词云图(如图7所示)。由图7可以发现:“数字经济”“发展”“数据”“人民政府”“产业”等词语在各政策文本的出现频率处于领先位置,符合政策制定基本规律,而且有关新兴政策热点的“数据安全”“公共数据”“数字基础设施”的出现频率也处于中坚地位,展现政府数字经济工作中心偏移与多元化趋势。
图7 主题特征词出现概率词云图
基于Rothwdl和Zegveldt的政策工具理论,结合LDA模型结果、词云图和43份原政策文本,本文得出下述分析结果,以廓析省级数字经济政策的政策重点和政策路径。
3.2.1政策内容主题覆盖社会各个领域
从LDA分析结果的各主题来看,现今各省级数字经济政策主要辐射涵盖以下方面:一是全面推进工业、农业与服务业等各产业的数字赋能转型,全面充分提高国家在数字化时代的全球竞争力。当前,地区的数字鸿沟问题仍是影响我国所有产业数字化转型的重要阻碍,东西部地区之间的数据统筹协调仍有待落实完善,各产业集聚的新数字规模效应没有得到充分发挥。二是完善数据要素市场体系的顶层设计与内部流程,向数字经济城乡一体化和地区协同发展迈进。三是落实数字政府建设,切实提高现代化治理水平。信息通讯技术不断发展丰富政府治理手段的同时,也无形中提高了公众对社会治理和政府治理成效的期待值。四是维护数据安全和数据监管成为政府未来的主要工作重点与难点。数据信息爆炸式增长的背后是大量的数据信息暴露和监管制度的空白缺位,国家数据主权安全受到严重的挑战威胁,亟待确立国家数据安全保护保障制度。五是促进企业的数字化转型。企业作为经济发展最主要的微观主体,一直以来都是数字经济政策的主要着力点,未来也势必是政策不可忽略的方面。
3.2.2数据安全保障与数据要素市场体系成为政策热点
数据安全风险日益严峻下,数字相关问题的治理也逐渐成为政策关注的新焦点。我国现有的数字安全治理法律体系与国家的数据安全现实需求之间仍存在较大差距,国家数据安全难以得到妥善保障和解决。随着《网络安全法》《数据安全法》与《个人信息保护法》的相继出台,为我国数据安全法律体系初绘雏形,更有待统一和谐的政策体系以落实数据安全。同时,数据作为新生产基本要素,也具备独特的市场优势和作用。《数据要素流通标准化白皮书》的发布,展现国家力求解决数据供给侧结构性矛盾和提升数据要素市场治理能力的决心。在国家密集出台数据要素市场政策法规引领下,各地方政府纷纷建构、培育数据市场流通体系和规则以充分释放数据要素的经济引擎效用,构筑数字竞争新平台,实现为千行百业数据赋能的目标,推动我国经济高质量全面发展。
3.2.3以供给型政策工具为主,政策工具使用比例失衡
从各主题结果人工匹配的主要使用政策工具类型来看,现今省级数字经济政策的政策工具选择主要以供给型政策工具为主,而需求型和环境型的政策工具相对使用较少,政策工具的使用比例存在一定程度的不均衡性。我国当前的数字经济发展仍主要依赖于政府引领,数字经济各主体的参与度和积极性较低,相关政策起步较晚,完备的政策体系尚未形成。因此,在政策工具上多选择供给性,以迅速推动数字经济发展。但是,过度使用供给型政策工具容易产生重视基础投资和建设而忽视经济发展的系统性与整体性,长期不合理的使用比例下可能会存在制度隐患与漏洞,造成经济体系不稳定和脆弱性。同时,在政策要求愈发复杂综合具体下,多种政策工具的合理组合使用成为政策制定的新趋势与必然之路,从而更好应对解决现今多元的社会问题,为实现中国式现代化发展助力。
3.3LDA主题的语义社会网络探究分析
基于LDA模型的结果,经过同义词合并处理,总共保留110个意义互异的主题特征词。再通过PMI公式两两统计出主题特征词出现在同一政策文本中的概率,形成一个110×110的关键词共现矩阵,最后借助Gephi软件构建主题特征词之间的社会网络,共现社会网络分析的可视化结果如图8所示。
图8 主题特征词共现网络图
同时,本文描述社会网络节点特征共有4个指标数据,以反映词语在网络中的重要程度。首先是表示某个关键词与其他键词在网络中共同出现的频率的点度中心度,其中包括绝对点度中心度和加权点度中心度。其次是接近中心性,它反映网络中某一节点与其他节点之间的接近程度。介数中心性则是用来度量某个节点在多大程度上“介于”其它节点之间(节点特征的描述性统计结果见表3)。
表3 共现网络图节点特征描述性统计
从图8的网络各词语关联程度来看,语义社会网络基本呈现出12个主要节点主题,节点主题数量与上述LDA模型确定最佳主题数量吻合。同时,各节点之间连接线段的密集复杂程度之高表明各主题特征词均频繁共同在各个省级政策文本,即LDA模型综合反映各政策文本的共同主题情况良好,现今省级数字经济综合性政策已具备体系化、制度化为LDA模型结果的稳健性提供强有力的可视化证据。表3节点特征中平均值与最大值的接近情况表明12个主要节点在整个语义网络的贡献度接近,即各省级政策整体布局类似。对于各政策主题的重视程度基本相同,呈现高度“向中央看齐”局面,更反映出我国数字经济政策体系由上到下均坚持强制性治理与政府引导理念,即政策工具使用比例失衡,有待“柔性治理”介入。通过非强制性的市场工具激发数字经济各主体的自主性、主动性和积极性,再次为上述LDA模型分析结果提供证据参考。
国家治理现代化要求公共政策体现社会共识的凝聚过程、吸纳和包容现代社会的多样性和差异性、完善社会主体的多重互动逻辑,搭建国家治理的高效平台。增强数字经济政策的包容性和社会参与性,通过多种途径实现政策各环节广泛而真实的公民参与,使其能够融合更多群体的利益诉求,协调个体利益与公共利益的冲突与矛盾,追求社会发展与秩序稳定前提下个体利益的合理实现。当前数字经济政策仍坚持以“强制性治理”为主的治理理念和方针,但“强制性治理”绝对不是简单粗放的强制,也不能对于所有政策路径和主体一刀切地实行“强制性治理”。尤其是针对数字经济这种涵盖影响各个社会领域的复杂政策议程,更需要进行缜密具体的政策设计和充分科学的理论论证,力求以最广大人民的利益出发。因此,不再过度依赖传统行政机制,反而更加坚持以人为本的柔性治理理念逐渐成为现代化公共治理的未来发展方向,为纾解各级政府现有的治理困境贡献独特现实价值和意义,也成为中国式现代化发展的有力引擎。
从LDA挖掘出的主题来看,现今数字经济政策的工具选用结构并不合理,过度依赖使用供给型政策工具。一个政策从出台到丰富完善的过程中,工具的选用往往会经历从供给型到环境型再到需求型的转变过程,但顺利过渡并适应整个过程并非易事。需求型、环境型和供给型三类政策工具都有其自身的独特优势作用,但政策工具的选择应用绝不是“平均化”和“随意化”的。未来数字经济政策制定应基于时代要求和政策议程,均衡调整政策工具的组合使用,根据政策目标合理选择最符合的政策工具,激发各主体形成良好的政策合力。同时,提高政策工具的可操作性和现实应用性,完善相应的政绩考核评价与监督体系,切实将政策的最优效用落实到实地,共同促进全国数字经济全方位健康发展。
政策目标必须具体到每个省的实际情况,并以证据为基础。省级数字经济政策的目标是通过向公共部门、私营企业和国际社会呈现中国各省在数字经济相关事项上的立场,推动数字经济的增长。这些政策目标为政府机构提供了指导原则,以便通过各自的职责利用数字经济,推动经济的多样化和可持续性,并为各省创造更大的竞争优势。因此,数字经济政策的基础必须是具体分析当前行为主体以及优势和劣势,包括实现数字经济发展失败的指标和原因。这可以被视为数字经济审计或简单的SWOT分析。鉴于数字经济政策准备情况,还可以深入了解政策需要关注的步骤,这些调查可以通过数字经济准备情况评估而被有效地应用。
单靠政策制定并不能确保政策成功,还需要额外的步骤来执行政策,以增加政策实现其预期结果的可能性。政策执行机构和利益相关者不仅可以教育受新政策影响的人或组织,还能够更改先前存在的运作流程。根据各省数字经济政策的颁布级别以及政策类型(从通知到条例),政策执行可以涉及范围广泛的人员和组织。例如,核心数字经济政策以及信息通讯技术政策涉及的政策主体包括发改委、信息中心、大数据局等,它们所涉及的政策责任包括基础设施、生态系统和不利因素等政策的技术和社会因素,以及数字基础设施、生态系统和不利于政策执行的技术和数据元素。通过咨询数字经济的利益相关者,能够了解数字经济政策执行过程中可能出现的任何挑战。对于数字经济政策执行过程中出现的任何挑战,可以学习标准制定机构的经验,以改进政策执行并为政策执行提供信息。
监管是政府实现社会、经济和环境政策目标的关键工具。为了发展一个充满活力的数字经济,有必要确保适当的监管工具到位。监管通常被视为一个消极的词,它会扼杀发展和创新。但从现有数字经济政策来看,各省的做法是促进而不是扼杀发展。发展数字经济的一些现有监管工具包括《网络安全法》《数据安全法》《个人信息保护法》《移动互联网应用程序信息服务管理规定》等。但是,数字经济领域的许多现有监管工具都是从各自领域的利益出发而制定的。作为发展监管支柱活动的一部分,未来应当优先考虑融合监管,而且相关监管机构可以共同编写监管文书。这将使投资者和利益相关者更容易支持该行业的发展。例如,截至2022年6月,我国网络支付用户规模达9.04亿,较2021年12月增长81万,占网民整体的86.0%[38]。数字支付生态系统的增长得益于政府的“观望”监管方法,允许行业参与者在非正式限制下进行创新,在相关监管机构的仔细监督下,创造新的商业机会并增加金融包容性。从国际商业角度来看,这可能会带来高度的监管不确定性,但对中国资本而言,这是一种很好理解的环境。
本研究将LDA和SNA模型引入省级层面的数字经济政策文本内容分析,力图解决目前针对数字经济政策文本内容定性研究的主观性、不确定性、依赖性的弊端。同时,通过融合政策工具视角,厘清未来地方政府数字经济的政策路径和战略重点,希望实现数字经济政策研究主、客观的统一。社会网络模型分析结果在一定程度证实LDA模型结果的可信度和准确度。需要说明的是,本研究尚具备一定局限性,有待更深入的探究改进。一是本文量化分析了现行有效的43份省级层面数字经济政策文本,但缺乏对整体地方政府的数字经济政策体系进行时间动态分析和与中央有关政策的纵向比较分析,难以准确把握全部政策的侧重点与发展方向的趋势变化;二是缺乏对于中央-地方两个层次的政策协同度和政策内容、政策目标之间耦合性的研究,以更好为我国数字经济政策的体系化发展提供实证支撑。未来可以从上述方面开展研究。