陈清华 高晓惠 勾文沙 李小萌
摘 要:“一带一路”对世界经济及我国民生的发展和改善发挥了积极作用,自“一带一路”实施以来,中国多个相关省、自治区、直辖市围绕自身特点积极布局,发布了一系列地方性“一带一路”相关政策。文章基于关键词词频—逆文件频率(TF-IDF),对中国“一带一路”沿线各省、自治区、直辖市在2014—2020年颁布的“一带一路”相关的政策文本进行量化分析和研究,通过可视化关键词的地理分布和构建的关键词网络发现,社团内部地区间的政策相似性主要并不取决于权重较大的关键词,而是由更多较小权重关键词共同决定的。文章还利用显性比较优势(RCA)进一步量化了各地的政策关键词的显性差异,得出各省、自治区、直辖市在政策关注上具有不同侧重的结论。
关键词:一带一路;地方政策;关键词网络;显性比较优势
中图分类号:D523 文献标识码:A
DOI:10.19881/j.cnki.1006-3676.2021.12.04
A Textual Quantitative Study on China's Local Policies of“the Belt and Road”
Chen Qinghua Gao Xiaohui Gou Wensha Li Xiaomeng
(Beijing Normal University,Beijing,100875)
Abstract:“The Belt and Road”initiative has played a positive role in the development and improvement of the world economy and our people's livelihood,since the implementation of“the Belt and Road”, many relevant provinces,autonomous regions and municipalities in China have actively deployed their own characteristics and issued a series of local“Belt and Road”related policies. Based on the keyword term frequency-inverse document frequency(TF-IDF),the article conducts a quantitative analysis and research on the policy texts related to“the Belt and Road”issued by the provinces,autonomous regions,and municipalities along“the Belt and Road”in China from 2014 to 2020,through visualization The geographical distribution of keywords and the constructed keyword network found that the policy similarity between regions within the community is not mainly determined by keywords with larger weights,but by more keywords with smaller weights. The article also uses revealed comparative advantage(RCA)to further quantify the significant differences in policy keywords in various regions,and draws the conclusion that provinces,autonomous regions,and municipalities have different focus on policy concerns.
Key words:The Belt and Road;Local policies;Keyword network;Revealed comparative advantage
一、引言
2013年9月和10月,中國国家主席习近平在访问中亚和东南亚时分别提出建设“丝绸之路经济带”和“21世纪海上丝绸之路”的伟大构想。在国家发展和改革委员会(简称“发改委”)、外交部、商务部的共同推动下,“一带一路”得到世界各国的积极响应。2013—2018年,中国与“一带一路”沿线国家货物贸易进出口总额超过6万亿美元,进出口总额年均增长4%,占中国货物贸易总额的27.4%。“一带一路”倡议加强了中国与沿线国家的交流,为国内沿线地区经济发展带来了新的契机。在国家顶层设计的指引下,中国“一带一路”沿线18个省、自治区、直辖市抓住时代赋予的新机遇,积极根据自身情况出台了一些相关政策,在基础设施建设、贸易金融和人文交流等方面的对外开放工作中不断发力,进一步夯实“一带一路”的建设成果。
二、文献综述
“一带一路”倡议及建设发展受到国内外学者的广泛关注,相关研究涉及极为广泛。综合来看,学术界从中国角度对“一带一路”的研究大体可以分为3个方面:其一,作用与成效,分析“一带一路”倡议和相关建设产生的成果,包括在经济增长[1]、政治格局[2]等方面产生的影响;其二,地域背景特点,展示和分析“一带一路”沿线国家或地区的某些具体指标或特征,如PM2.5污染与人口暴露风险的时空分布[3]、国际物流通道的建设水平[4]等,以期为地区发展提供建设性建议;其三,政策与管理保障,对“一带一路”政策及其他管理措施进行分析讨论,如相关的财税政策研究、国际产能合作的可行性和意义[5]等。
已有的研究文献往往侧重于主观性的分析解释,对“一带一路”相关政策的系统研究和梳理相对较少,忽视了对政策客观性的挖掘。政策文本是政策存在的物理载体,是政府行为的反映,也是记述政策意图和政策过程的客观凭证,对政策文本的研究和剖析是追溯和观察政策过程的一个重要途径[6]。主观性的分析评述可以给决策者或者相关人员一个政策概览,而统计等量化手段能给读者提供一些必要的客观信息。政策文本的量化方法[7]可以分为3类:内容分析法[8-9]、政策计量分析法[10-11]和效词分析法[12-13]。
近年来,有学者尝试对“一带一路”相关政策文本进行量化分析并得出相应结论。黄凯丽等[14]从政策工具视角出发,对国家宏观层面的“一带一路”政策文本进行了多角度的解读分析,她们关注了政策文本数量和政策类型等信息,但没有充分利用政策文本内容提供的信息。陈升等[15]通过打分制建立了政策效力、政策措施与政策保障3个评判要点,通过量化沿线省、自治区、直辖市的政策文本,探究政策强度与经济开放度之间的关系,但他们侧重于政策文本的量化过程,在对比分析上仍有不足。中国相关省、自治区、直辖市是“一带一路”倡议践行的实际主体,对政策文本的深入挖掘及比较分析有助于更好地展示国内各地区“一带一路”建设思路上的异同和发展变化。笔者将政策计量分析与效词分析相结合,通过收集和分析相关政策文本数据,对“一带一路”政策进行系统、全面的研究。这不仅有利于跟进中国“一带一路”政策实施的进度与影响程度,探寻各地区的发展特征以及地区之间的联系,还可以为进一步落实“一带一路”倡议提供方向性的指引和有效参考。
三、“一带一路”政策数据概览
(一)数据来源
中国“一带一路”沿线省级行政区包括新疆、陕西、宁夏、甘肃等18个省、直辖市、自治区。自中国2013年创造性地提出“一带一路”倡议后,“一带一路”沿线各省级行政区为深入贯彻落实党中央、国务院关于“一带一路”建设总体部署,推动“一带一路”高质量发展,相继出台了关于“一带一路”建设的相关政策。笔者通过对各省级政区人民政府官方网站,中国“一带一路”网,各省级行政单位发改委官网、“一带一路”网等网站中标题包含“一带一路”“丝绸之路”“对外開放”等关键词的政策文件进行收集整理,得到2014—2020年政策文件颁布数量的变化,如图1所示。
由图1可知,从2014年开始,我国“一带一路”沿线各省、自治区、直辖市开始颁布“一带一路”相关政策,2015年颁布的相关政策数迅速增加到12个,后续一直稳定在10~13个,直到2020年才有所下降。各地区的“一带一路”相关政策具体汇总结果,如表1所示。
从各省、自治区、直辖市的政策的文件名称上可以初步发现地区间对“一带一路”政策解读及落实的差异。受地理位置、历史文化、经济水平等因素的影响,不同地区制定的政策各有侧重。例如,甘肃高度重视对知识产权的维护,基于知识产权的总体目标制定了具体的保障措施;福建利用沿海优势,积极发展海上丝绸之路;上海除了聚焦桥头堡建设,还强调要加强“一带一路”的法律服务建设。
(二)政策主题的时间变化
中国“一带一路”政策文本具有相对固定的格式和语言风格,遣词造句中蕴含着决策者的态度及其强弱程度。例如,“推进”“坚持”“加强”能够反映决策者对某一领域发展的重视程度,“支持”“打击”“严格”能够体现当地政府对某一任务部署或对解决特定问题的态度。虽然,此类动词或副词能够较强地反映决策者的情绪或态度,但此类词汇只能对篇幅较小的文本作出准确的情感判断。篇幅较大的政策文本包含的主题更丰富多样,决策者可能同时强调了多个侧重点,此时根据分析动词或副词得到的决策者情绪与文本主题不一定匹配。因此,笔者对“一带一路”政策文本的研究重点集中于以名词为核心的少数高频词或主题词。
笔者将2014—2020年的“一带一路”政策按省级政区集聚成政策文本语料库,对文本进行格式转换、清洗等预处理后,通过python中的jieba分词来提取关键词。在“一带一路”文本分词结果中,如“基地”“活动”“地方”等名词在各地政策文本中出现的频率很高,但这些词对理解文本的主题并无助益。然而,若将所有分词结果中无意义的名词挑选出来,效率低下且冗余,为保证分词结果的准确性,需要保证权重较大的关键词对分析文本主题是有意义的。因此,在数据预处理的过程中,笔者将无意义名词加入通用停词表(包括标点符号、助词、副词、介词、连接词、英文字母等无明确意义的词),保证分词结果权重排名前五十的关键词中不存在无意义名词。笔者的分析都是基于更新停词表的分词结果进行的。
以2014—2020年的政策文本为研究对象,根据分词结果得到各个关键词的词频大小,提取排名前五的关键词,结果如表2所示。由表2可知,“合作”一直是近几年沿线地区发展的重要策略,“企业”也一直是政策关注的主体对象。在“一带一路”倡议提出的前两年里,国家十分重视沿线地区尤其是西部地区的铁路建设。铁路基础设施建设一直是西部地区发展的软肋,健全铁路网络有利于为我国企业在国际化市场交流中提供更多机遇,同时,“一带一路”是铁路行业重新审视自己、完成跨越发展的有利契机。2016年,各地区制定的政策更具针对性和地区特色,在基础设施建设层面更进一步,开始强调医疗卫生建设、文化建设的重要性。自2017年开始,物流业建设受到重点关注。物流业是现代服务业的重要组成部分,也是发展现代交通运输业的重要切入点和主要着力点,利用“互联网+物流”策略既可以发展新经济,又能不断带动传统经济增长。2018—2020年,各地区有了适合自身发展的大致定位,中国的“一带一路”建设目标转向更宏观的层面,我国希望在“一带一路”建设中大力推进科技创新合作,实施创新驱动发展战略,以推动沿线地区的深化改革。2016年,“一带一路”沿线的部分国家和地区共同展望了加强知识产权领域合作的愿景,形成了共同倡议,至2020年知识产权的相关规定增多。总之,建设中心从基础设施向服务行业的转移,维权对象从有形资产向无形资产的变化,建设目标从微观向宏观的转变,都体现了中国“一带一路”政策的制定呈现层层递进的总体特征。
四、“一带一路”政策的地方性联系
(一)关键词分布
为了凸显政策的地方性差异,笔者引入TF-IDF技术[16]对所有政策文本进行关键词重要程度计算。TF-IDF是一种用于资讯检索与资讯分析的常规加权技术,常被用来评估字词对一个文件集或一个语料库中一份文件的重要程度。字词的重要性随着它在文件中出现的次数呈正比增加,但同时也会随着它在语料库中出现的总频率呈反比下降。由于各地区的政策数量和政策篇幅不同,采用TF-IDF提取关键词可以消除地区间政策关键词词频绝对水平的差异。
从总体过渡到省级行政单位层次,观察各地区政策中权重排名前三的关键词可以发现,地区间存在一定相似性,并且这种基于权重前三关键词的政策相似性与地理位置和条件有关。其中特征最明显的是东北三省,作为“一带一路”倡议中向北开放的重要窗口,“合作”均为三省政策中最重要的关键词,东北三省扩大对外开放,不断加速开放与合作的步伐,发展口岸经济,进一步激发东北老工业基地的活力,释放其潜能。在地理条件上,青海、陕西、云南、广东4个省份虽然在地理位置上并不相近,但因相似的地理优势而具备得天独厚的发展旅游经济的条件。由于地形、土壤、气候等条件的差异,青海具有丰富的自然资源;陕西凭借悠久的历史拥有深厚的历史文化底蕴;云南地处西南边疆,气候宜人,民族气息浓厚,保留了很多物质文化遗产;广东自改革开放以来,始终是国内重要的旅游接待中心和旅游创汇中心,更凭借科技创新的崛起吸引了大批有志青年。这4个省份都借“一带一路”的发展契机,积极扩大自身的旅游优势,格外注重旅游业的发展。
(二)省际政策的相关性
分析关键词是为了清晰明了地获取政策的内容、主题等相关信息,基于关键词构建的省际网络,可以进一步分析各省份之间“一带一路”政策的相关性。
在各省、自治区、直辖市政策文本的分词结果中,选取TF-IDF值排名前二十的关键词,构建网络可视化各省、自治区、直辖市政策之间的联系。以各省级行政单位作为节点,如果该省级行政单位与其他省级行政单位间拥有共同的关键词,则这两个省级行政单位(节点)间存在一条连边;连边的粗细代表省级行政单位相同关键词TF-IDF序列的皮尔逊相关系数;各个节点的大小代表各个省级行政单位的强度之和,即该省级行政单位与其他省级行政单位连边的所有权重之和,网络结构如图2所示。
从省、自治区、直辖市政策关键词网络中可以发现,地区之间关键词相似程度差异较大,但由于地区间组合数量过多,并不能直接明了地从原始网络结构中获取有效信息。因此,通过社团划分对省际关键词网络进行处理,可以更好地把握各省在制定政策上的联系。利用Louvain算法[17]对原始网络进行社团划分,根据模块度(Modularity)确定断边或连边的阈值。模块度是描述社团内紧密程度的指标,计算方式如下:
Q= ∑ij(aij- )δ(ci ,cj) (1)
其中,aij是节点i和节点j之间的权重,ki=∑j aij表示所有与节点i相连的边的权重之和,m= ∑ij aij 表示所有边的权重之和,ci表示节点i所属的社团,δ(ci ,cj)表示节点i与节点j是否属于同一社团,如在同一个社团内则为1,否则为0。基于模块度的社团划分方法以最大化模块度为目标,多个网络的实证结果显示模块度在0.3~0.7时社团聚类效果较好[18]。根据模块度确定断边或连边的阈值,当阈值设定为0.8时,模块度的计算结果为0.4,划分效果较好。因此,在省际关键词网络中只保留省级行政单位间皮尔逊相关系数大于0.8的连边,结果如图3所示。
如图3所示,根据模块度最大原则,笔者将“一带一路”沿線省级行政单位分为4个社团,不同的颜色代表不同的社团。根据省、自治区、直辖市共同关键词划分社团的结果,与只根据权重排名前三关键词得到的分类结果不同,即使在关键词地理分布图上特征最明显的黑龙江、吉林和辽宁3个省份都被划分到了不同的社团。这就表明,省、自治区、直辖市之间的政策相似性并不是由权重最大的几个共现关键词决定的,而主要取决于权重较小的共现关键词。这是因为权重排名前三的关键词更多地体现了政策的大方向,当笔者把权重排名放宽至前二十,排名前三的词由于高频性几乎会出现在大部分省、自治区、直辖市排名前二十的关键词中。通过网络社团的构建,笔者发现除了前三的关键词,各省级行政单位确实存在其他特征让其成为相似或相异的省份,而这种性质来源于关键词排名中相对不是最大的词。那么,在各个省级行政单位权重较大的关键词中,该关键词相对于本地区其他关键词以及其他省级行政单位关键词的突出优势有多大,就是该关键词对省级行政单位间差异性的贡献程度有多大,这需要进一步对地区关键词的比较优势进行分析。
五、“一带一路”政策的地方比较优势
权重最大的几个关键词能代表省份政策的方向性,但难以体现省级行政单位政策的地方特性,而集合更多的大权重关键词信息能更好地体现出地区差异性(形成了社团),即存在一些词,是某些省级行政单位里常出现,但不是所有省级行政单位都常出现的词。因此,为了找出这些真正具有各省特性的词,量化关键词对于各省、自治区、直辖市政策特性的贡献度,笔者引入显性比较优势RCA[19]这一无量纲指标进行比较分析,即一个词在某个省级行政单位的关键词权重份额与该词在所有省级行政单位中权重份额的比率。RCA可以通过标准化省级行政单位和全国的关键词权重来捕捉省级行政单位间在关键词使用上的微小差异,计算方式如下:
RCApi = (2)
Wpi表示关键词i在省份p政策文件中的权重,公式右边的分子代表省级行政单位p的关键词i占该地区所有关键词权重的百分比,分母代表关键词i在全国的权重之和与所有关键词权重之和的占比。依据RCA大小进行排序,将各个省级行政单位的关键词统计整理出来,利用Z分数(Z-Score)对不同水平的RCA进行分组以绘制关键词热力图,颜色越深表示Z分数越大,分组过程如下:
(3)
其中,E(RCApi)表示所有关键词比较优势的均值,σ(RCApi)表示所有關键词比较优势的标准差。图4展示了各个地区最具有显性比较优势的前10个关键词。由此可知,海南的关键词比较优势是所有省级行政单位中整体水平最大的,这意味着海南在制定“一带一路”政策时,更能体现地方的独特性和创新性。2018年末,中共中央、国务院发布了《关于建立更加有效的区域协调发展新机制的意见》,海南为深入贯彻该意见,决定实行全面深化改革开放,建立全岛自由贸易试验区,推进中国特色自由贸易港建设,建立更加有效的区域协调发展新机制。福建的关键词比较优势次之,其更具创新特色的是关于海上丝绸之路相关政策内容的制定,当地政府致力于将福建建设为21世纪海上丝绸之路的核心区。在甘肃关键词比较优势分布中,“知识产权”一词尤为突出,这体现了甘肃力图发挥知识产权对创新驱动发展的支撑和引领作用,紧紧抓住“一带一路”建设重大机遇,推进丝绸之路国际知识产权港的建设。浙江为进一步发挥标准互联互通作用,打造“一带一路”枢纽,构建全面开放新格局,制定了标准联通的行动计划,同时也推出了督查评价体系,以保证“一带一路”建设的高质量进行。辽宁为了推进全省商贸流通业供给侧结构性改革,十分重视电子商务的发展。宁夏为推进“一带一路”和内陆开放型经济试验区建设,对保税区提出了相关要求。陕西作为颁布“一带一路”相关政策较多的省份之一,特别强调了促进绿色“一带一路”建设,提升绿色发展水平,致力于建成为西部重要的生态环境屏障。青海虽然是古丝绸之路南线的重要通道,但对于21世纪的“一带一路”建设仍有许多不足之处,需要不断完善铁路交通网络、通信网络等基础设施建设。
经济建设离不开人才队伍。值得注意的是,在各地区的关键词显性比较优势中,只有甘肃和上海的“人才”关键词跻身前十。加大人才吸引力度是甘肃推进丝绸之路信息港建设的重要措施之一,其在加强招商引资的策略中强调了引进高端人才的重要性;上海通过鼓励海外高层次人才在沪创新创业,促进开放型经济新体制的构建,而推进桥头堡建设的重要举措更是以人文交流和人才培训为纽带的。相对而言,其他沿线省级行政单位对“人才支撑”和相关方面的关注不足。从绝对数量来看,新疆颁布的“一带一路”相关政策的数量最多,但其在人才支撑方面的政策还比较笼统,实施细则不够明确。例如,在强调密切与周边国家进行人文交流时,新疆只提出了要通过实施一系列合作活动吸引高科技人才来疆从事科研工作,而在如基础设施互联互通、推进与周边国家经贸合作等方面的政策措施中未有明晰的说明。
六、总结和讨论
政策是行为的先导和保障,政策分析可以根据掌握的事实寻求最佳对策,以解决存在的问题。笔者以2014—2020年“一带一路”18个省级行政单位发布的相关政策文本为研究对象,系统地分析了各个地区的政策异同。在消除了省、自治区、直辖市间关键词绝对数量的差异后,笔者发现虽然地区之间的政策趋同性与地理分布相关,但地区之间的政策相似性并不主要取决于权重较大的关键词,而是由权重排名前二十的关键词甚至更多小权重关键词共同决定。为了进一步探究各省份具有地方特性的关键词的贡献度,笔者利用RCA比较了各地区关键词的特征。
在“一带一路”政策的原始文本中,各个省级行政单位的政策文本大致包含政策措施和政策保障两部分,政策措施方面包含政策沟通、设施联通、贸易畅通、资金融通和民心相通5个方面,政策保障包括行政手段、金融外汇、财政税收和人才支撑4个方面,而且大部分政策措施的篇幅大于政策保障的篇幅。各地政策文本存在不同方面的侧重,笔者通过计算不同地区的TF-IDF值和RCA值,可以发现各地政策的关注点及其变化。可以看出,海南侧重于区域协调发展,甘肃强调知识产权的重要性,浙江致力于打造“一带一路”枢纽,等等。各地因地制宜,积极响应“一带一路”倡议。尽管如此,政策文本中缺少“人才支撑”相关内容的问题仍十分突出。即使在提出了人才相关政策的省份中,关于人才引进、人才培训和培养、人才输出、人才社会福利与保障制度等方面制定的政策不够具体,缺乏明确的指导性。具体来讲,在基于TF-IDF权重的关键词排序中,只有甘肃、福建和上海3个地区的“人才”关键词跻身前二十;在各地区的关键词显性比较优势中,只有甘肃和上海的“人才”关键词跻身前十。除此之外,其他省份对“人才支撑”相关方面不够重视。然而,“一带一路”政策的执行与落实必然会带来省份之间的合作交流,不仅会促进沿线省份之间的人才流动,也会吸引其他非沿线省份的人才,而人才的规模很大程度上决定了本地经济和社会发展。因此,各省份需要加强对人才政策的重视。
与此同时,在地区合作方面,虽然地域相邻省份之间的合作存在运输成本较低、文化交流便利等优势,但根据沿线省份的社团划分结果可知,当考虑一个地区的多个政策侧重点时,地理位置不相邻的地区被划分到一个社团,说明这些地区之间更适合合作。这是因为,地域相邻的省份很可能具有类似的自然和经济条件,此时它们的发展侧重点也是相似的,但若要提高自身的竞争优势,还需要选择更多具有不同发展侧重点和特色的合作伙伴,此时加强同社团伙伴之间的合作要比加强与地域相邻的地区之间的合作更有助于提高自身的竞争力。
参考文献:
[1] 曹翔,李慎婷.“一带一路”倡议对沿线国家经济增长的影响及中国作用[J].世界经济研究,2021(10):13-24,134.
[2] 罗强强.“一带一路”实践与国际政治格局—基于风险社会视角的战略分析[J].社会科学辑刊,2021(03):105-112.
[3] 慕航,何超,阮秋明,等.“一帶一路”沿线国家PM2.5污染与人口暴露风险的时空分布特征[J].环境科学学报,2021,41(06):2229-2240.
[4] 张子扬,曹荣光.“一带一路”倡议下国际物流通道建设及其区域空间效应[J].商业经济研究,2021(19):158-161.
[5] 夏先良.构筑“一带一路”国际产能合作体制机制与政策体系[J].国际贸易,2015(11):26-33.
[6] 李钢.公共政策内容分析方法:理论与应用[M].重庆:重庆大学出版社,2007.
[7] 郑新曼,董瑜.政策文本量化研究的综述与展望[J].现代情报,2021,41(02):168-177.
[8] 邱均平,邹菲.关于内容分析法的研究[J].中国图书馆学报,2004,30(02):12-17.
[9] 谭春辉,谢荣,刘倩.政策工具视角下的我国科技评估政策文本量化研究[J].情报杂志,2020,39(10):181-190.
[10] 谢博闻,张瑜烨,刘儒田.“一带一路”新闻与传媒研究的知识经验与趋势分析—基于CiteSpace科学知识图谱(2013—2019)[J].中国出版,2021(11):63-67.
[11] 韩旭,杨岩.基于多层次主题模型的科技政策文本量化研究[J].全球科技经济瞭望,2020,35(11):59-69.
[12] 王春龙,张敬旭.基于LDA的改进K-means算法在文本聚类中的应用[J].计算机应用,2014,34(01):249-254.
[13] 张涛,马海群,易扬.文本相似度视角下我国大数据政策比较研究[J].图书情报工作,2020,64(12):26-37.
[14] 黄凯丽,赵频.“一带一路”倡议的政策文本量化研究—基于政策工具视角[J].情报杂志,2018,37(01):46,53-58.
[15] 陈升,顾娟,何增华.“一带一路”相关文件政策强度与省域经济开放度关系研究—“一带一路”沿线18个省份实证分析[J].重庆大学学报(社会科学版),2021,27(02):23-43.
[16] Rajaraman A,Ullman J D.Mining of massive datasets[M].Cambridge:Cambridge University Press,2011.
[17] Blondel V D,Guillaume J L,Lambiotte R,et al.Fast unfolding of communities in large networks[J].Journal of Statistical Mechanics:Theory and Experiment,2008(10):10008.
[18] Newman M E J.Modularity and community structure innetworks[J].Proceedings of the National Academy of Sciences of the United States of America,2006,103(23):8577-8582.
[19] Balassa B.Trade Liberalisation and“Revealed”Comparative Advantage[J].The Manchester School,1965,33(02):99-123.