□ 周海炜 陈青青
(河海大学 商学院战略管理研究所, 江苏 南京 211100)
随着云计算、人工智能、物联网、Web2.0等新一代科学信息技术的广泛应用,数据的多样性、实时性、多变性、价值稀疏性等复杂特征日益显著,大数据时代已经到来[1]。许多国家已经认识到大数据的发展和应用是经济社会高效稳定运行的重要手段,相继出台了多部大数据战略规划和相关法律法规,以此监管和指导国家大数据产业的高效发展。2015年8月,国务院印发《促进大数据发展的行动纲要》,首次明确指出加快建设数据强国,全面推进我国大数据发展和应用。2016 年发布的《中华人民共和国国民经济和社会发展第十三个五年规划纲要》中首次将大数据发展定位为国家战略,提出拓展网络经济空间,实施“互联网+”行动计划,发展分享经济,推进数据资源开放共享,支持基于互联网的各类创新,这些举措充分体现了国家政府对大数据发展的统筹规划。随着各类大数据发展政策的出台和实施,大数据发展政策体系逐渐复杂化,政策制定水平和实施效果仍存在突出问题。
大数据政策发展和完善是实施国家大数据战略的重要保障[2]。我国大数据发展还不成熟完善的政策体系可以纠正市场失灵防范政府失灵弥补系统失灵修正伦理失范[3]。如何对已有政策进行客观科学的评价,从而为新一轮政策的制定提供具体可操作的决策依据,实现大数据行业演进与政策制定的协同发展,是政府部门和大数据行业参与主体的关注焦点。因此,本研究通过文本挖掘和PMC指数模型建立大数据发展政策评价指标体系,通过8项大数据发展政策的PMC指数评分和PMC曲面图,多角度直观剖析政策合理性与可行性并提出相应的优化路径,以期为下一步大数据发展政策的制定与创新提供借鉴。
数字时代的到来使得大数据发展水平成为国家竞争力的重要体现,大数据发展政策则为其提供了科学的政策指引。以往文献主要采用定性与定量相结合的方法,包括文献计量、内容分析法、图论、网络分析、知识图谱等[4]。例如,范梓腾和谭海波[1]以省级政府出台的大数据政策为样本,从政策“目标工具”匹配的角度量化分析了地方政府大数据发展政策的主要内容、基本特征和发展趋势,认为当下中国地方政府的大数据发展政策的主要目标是应用创新,侧重于使用供给面政策工具。李樵[2]运用内容分析法,构建大数据发展政策工具的基础资源维度、技术维度和领域维度三维分析框架,总结我国大数据发展政策工具选择上存在的问题。徐蕾等[5]综合运用扎根理论、词频分析和政策力度测量方法,通过共词网络分析大数据试验区政策的关注重点与不足。季飞等[6]利用 Nvivo11 软件对贵阳市发展大数据产业的42份文件做信息编码和文本量化分析,得出供给型、环境型、需求型政策工具的使用都较为均衡合理的结论。刘亚亚等[3]从大数据政策的演进脉络、政策关系网络、政策主题词演进态势以及政策工具的使用情况等四个方面分析大数据政策。
综上,目前研究关于大数据发展研究政策的样本范围较为局限,通常选取某区域的政策评价,或是专门针对国家层面的政策进行评价,研究深度也亟需加深,具体对政策本身内容的研究还较少,政策评价指标的多元性不足,难以从宏观和微观上同时把控政策水平,对某项具体政策的详细解析研究较为缺乏。本文采用的PMC指数模型为大数据发展政策的研究视角提供了新思路。选取的8项大数据发展政策发布主体包含了国家级,省市级和地方级,样本范围相对宽泛,研究主题清晰明了,研究结果更具普遍参考和应用价值。本文基于政策情报进行文本挖掘,采用适用于大数据发展的PMC指数模型,由于评价指标体系本身就具备了大数据发展政策的特点,因此量化评价结果的精确度更高,避免了人为评价的主观性。
PMC指数模型是Ruiz Estrada等[7]基于Omnia Mobilis假说思想提出的一种政策文本分析模型,主张万事万物都是不断运动且相互联系的,不应该忽视任何一个相关变量的影响。因此研究政策模型时选取的二级变量范围应尽可能广泛且不受限制,同时各变量权重应该相同。因此,作者采用二进制法平衡所有变量,通过PMC指数和PMC曲面从任意维度反映各政策优劣势。 PMC指数模型已成为国际上较为先进的政策文本评价方法[8]。通常建立PMC指数模型的步骤如下。
步骤1:设定政策变量与参数;
步骤2:建立多投入产出表;
步骤3:计算一级变量值得出PMC指数;
步骤4:绘制PMC立体曲面图。
为了保证研究结果的价值性与适用性,本文从不同级别机构发布的1500多份有关大数据政策文件中选取了8项富有代表性的政策,具体如表1所示。
表1 8项待评价大数据发展政策汇总
为了更具针对性的对我国大数据发展政策进行评价,本文参照Estrada[9]和已有文献中学者对于大数据发展政策评价变量的设定并结合我国大数据发展政策的具体特点,确立了1个一级变量和43个二级变量。具体变量设计见表2。
表2 大数据发展政策PMC评价指标体系变量设计
设置好一级和二级变量后,运用文本挖掘的方法对二级变量进行赋值,当待评价政策满足相应的二级变量内容时,变量取值为1,不满足时取值为0。
多投入产出表是一种可存储大量数据、对单个变量采用多维度测量的数据分析框架,由若干个一级变量和不受数量限制的二级变量组成。一级变量没有固定的排列顺序且相互独立,二级变量构成一级变量,各二级变量权重相等[10],如表3所示。
表3 大数据发展政策评价多投入产出表
本文采用文本挖掘的方法确定二级变量的取值,运用ROSTCM6软件将各项政策导入文本挖掘数据库进行分词处理,依据每项政策文本的关键词对二级变量进行赋值,当政策文本包含二级变量对应的关键词时,赋值为1,否则为0。相较于主观性的专家打分,文本挖掘发更具客观性和科学性。本文结合我国大数据发展政策的特点和研究现状依据设定的变量,构建各项大数据发展政策的多投入产出表并依照上述方法对各项政策赋值。受篇幅限制,本文不再列出赋值详情。
Estrada[9]将 PMC指数计算步骤定义如下:(1)根据政策内容建立一级变量与二级变量;(2)根据式(1)和(2),采用二进制法确定二级变量的具体数值,构建多投入产出表;(3)根据式(3)计算一级变量的数值;(4)通过公式(4)加总计算待评价政策的PMC指数。
X~N[0,1]
(1)
X={XR:[0~1]}
(2)
(3)
t=1,2,3,45,…,式(3)中t为一级变量,j为二级变量。
(4)
根据多投入产出表计算各项大数据发展政策的PMC指数,对各项大数据发展政策进行量化评价,评价标准为:8.5~10分(完美),7.5~8.5分(优秀)6~7.5分(可接受),0~6分(不达标)。评价结果如表4所示。
表4 8项大数据发展政策的PMC指数
PMC立体曲面有助于直观立体的显示PMC指数模型评价结果,更有利于分析各项政策的优劣势。本文中由于X10的取值在8项政策中均相同,考虑到矩阵的对称性和平衡性,去掉X10,按照式(5)建立三阶矩阵绘制PMC曲面图。
受篇幅的限制,本文仅列出了PMC指数排名第一和排名最后的PMC曲面图即P1和P3。如图1和图2所示。
图1 P1的PMC曲面
图2 P3的PMC曲面
(5)
从上述PMC指数量化结果可知,8项大数据发展政策中5项政策评价结果为优秀,3项政策评价结果为可接受,没有不达标的政策样本。5项优秀政策中两项是国家级政策,3项是地方政府级政策,表明国家在政策制定中起到较好的领导作用,地方政府也在紧跟步伐,结合实际情况制定高水平的大数据产业政策。从宏观角度看,8项政策PMC指数平均值为7.65,总体处于优秀水平,表明国家和地方政府在大数据发展政策的制定上考虑较为全面,计划较为详尽,正在积极贯彻落实国家引导的大数据发展战略。其中,X1政策性质均值为0.93,说明大数据发展政策在建议、预测、引导、监管等方面作用齐全;X2政策效力均值为0.42,说明大数据发展政策内容包含的发展目标期限值较为单一,在短期与长期时限上的具体规划不够全面;X3政策级别均值为0.33,说明大数据发展政策的发布机构单一,大多是国家层面机关或地方政府层面机构单独发布;X4政策评价均值为1,说明大数据发展政策制定的依据、方案、规划有理有据;X5政策领域均值为0.92,说明大数据发展政策涵盖范围全面,内容涉及我国经济、政治、社会等多个领域;X6激励措施均值为0.76,说明大数据发展政策含有多种激励方式,以促进大数据产业的持续发展;X7政策重点均值为0.76,说明大数据发展政策制定重点内容突出,引导性较强;X8政策受体均值为0.80.说明大数据发展政策适用对象全面;X9政策视角均值为0.75,说明大数据发展政策中对宏观和微观内容的把握与解析较为具体。
同时,结合PMC立体曲面图,从微观上对8项政策分别进行深入解读,并提出对应的优化路径。结果如下:
P1的PMC指数为8.16,排名第1,评价等级为优秀,是2015年为全面推进我国大数据发展和应用,加快建设数据强国,由国务院发布的《促进大数据发展行动纲要》。其中,只有X2政策效力低于均值,其他均大于或等于均值,表明我国在制定大数据发展政策时对各维度的指标考虑较为充分。P1主要考虑长期规划,其原因是P1作为全国大数据发展引导性文件,在长期总体目标上必须制定清晰,而短期具体规划需要各地政府结合当地实际经验。
P2的PMC指数为8.0,排名第2,评价等级为优秀,是2015年国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见。其中,X1政策性质和X7政策重点低于均值,这与政策发布目的相关,P2的出台的主要作用是运用大数据监管市场主体,因此政策重点落在了监管上,忽视了审批流程、试验区建立等政策重点。表明未来在政策制定过程中,要着眼于政策内容筹划全面性,丰富大数据发展工具的使用。建议优化路径为X7—X1。
P3的PMC指数为7.39,排名第7,评价等级为可接受,是2017年工业和信息化部关于印发大数据产业发展规划(2016—2020年)的通知。其中,X1政策性质、X2政策效力、X5政策领域和X9政策视角评分低于均值,此项政策是在P1的指导下发布的着眼于当前短时期内的政策,政策时效较短,缺少对环境方面的关注度导致政策领域分值较低,涵盖的政策重点也是从宏观角度出发,对各领域的细分度不够。建议优化路径为X5—X9—X2—X1。
P4的PMC指数为7.66,排名第4,评价等级为优秀,是2016年上海市人民政府关于印发《上海市大数据发展实施意见》的通知。其中,X2政策效力、X8政策受体、X9政策视角评分低于均值,由于政策属于地方性文件,政策效力与政策受体较为单一,但制定时仍可以从完善政策视角层面出发,制定更加详实的政策计划,避免宏观上的指导力不足。建议优化路径为X9—X2—X8。
P5的PMC指数为7.86,排名第3,评价等级为优秀,是2016年江苏省政府关于印发江苏省大数据发展行动计划的通知。其中,X1政策性质、X2政策效力、X8政策受体评分低于均值,对于地方级别的文件,普遍存在政策受体较少的局限性,未将政策上升到国家层面。政策中的目标期限值为5年,导致政策目标难以匹配当前大数据发展需求。建议优化路径为X1—X2—X8。
P6的PMC指数为7.63,排名第5,评价等价为优秀,是2016年山西省人民政府关于印发山西省大数据发展规划(2017—2020年)的通知。其中,X5政策领域、X6激励措施、X8政策受体评分低于均值,政策领域涉及经济、政治等多方面,但大数据在制度领域的运用涉及内容较少,导致X5得分较低,此外,激励措施较少,仅在政府补贴和政策法规上采取措施,对于人才培养、基金设立等方面考虑不足,激励措施的丰富性对于大数据发展能力至关重要。因此建议优化路径为X6—X5—X8。
P7的PMC指数为7.39,排名第7,评价等级为可接受,是2015年农业部关于推进农业农村大数据发展的实施意见。其中,X2政策效力、X5政策领域、X7政策重点、X9政策视角评分低于均值,该政策是农业农村大数据发展规划,中国农村大数据发展较为落后,应重视基础设施建设和技术水平的提升,该政策涉及的发展重点较少,缺乏国际交流合作、产业融合创新和试验区等较先进领域的政策计划,政策整体落实难度较大。建议优化路径为X7—X5—X9—X2。
P8的PMC指数为7.49,排名第6,评价等级为可接受,是2019年交通运输部关于印发《推进综合交通运输大数据发展行动纲要(2020—2025年)》的通知。其中,X2政策效力、X5政策领域、X7政策重点、X9政策视角评分低于均值,作为近期发布的交通运输大数据发展政策,政策重点还有待完善,可参照P1在行政审批和建立大数据试验区方面加以完善政策重点。建议优化路径为X9—X5—X2—X7。
本文从大数据发展政策评价指标体系构建的角度,利用文本挖掘和PMC指数模型对我国大数据发展政策进行量化评价,选取8项大数据发展政策进行实证分析,通过构建1个一级变量和43个二级变量,利用PCM指数计算结果和PMC曲面图直观清晰的展示政策各项指标的完整性与优劣性,从宏观和微观层面分别分析了政策特点并提出相应的优化路径,为我国正在制定和将要制定的大数据发展政策提供参考。本文的研究结论主要如下。
首先,从宏观层面看,一方面,我国大数据发展政策普遍存在政策效力单一的问题,在长期、中期、短期目标的制定上还不完善,目标与政策工具未能一一对应;另一方面,在政策涵盖重点、政策领域、激励措施的设置上还不完善。
其次,从微观层面依次分析每项政策发现,8项政策中有5项评价为优秀,3项评价为可接受,PMC指数均值为7.65,表明我国大数据发展战略总体制定水平较高,国家在政策制定中发挥了良好的指引作用,但也存在部分指标一级变量得分多数低于均值的情况,本文对每项政策的不足提出了对应的改进路径。本文使用PMC指数的优势在于,多投入产出表和PMC曲面图能够快速找到某项政策的指标得分并且识别得分差异度,明确改进方向,提高后期政策完善的效率。
根据PMC指数模型得出的研究结论和综合分析,本文对大数据发展政策的优化提出以下建议。
第一,国家和地方政府在出台大数据发展政策时,要立足于国情和当地具体情况,在总体目标的引导下分阶段制定操作性强的小目标,兼顾政策的宏观层面和微观层面,提高大数据发展政策的可实施性和实施效果,同时,建议成立专门的大数据政策制定机构,协调不同政策制定主体间的行为。
第二,政策内容中激励措施的丰富性,在政府补贴、技术支持、税收优惠、专项基金、人才激励等都要考虑,丰富的激励手段有助于大数据发展水平的快速提升,同时建议在强调数据共享重要性的同时加强大数据信息公开和知识产权方面的立法与执法力度,为大数据产业的应用提供坚实的保障。
第三,加大政策宣传力度,可先在某些大数据发展较成熟的领域开展政策落实示范区,随后再逐渐拓宽应用领域,如医疗健康领域、电子商务领域等,重视大数据产业间的紧密联系。□