基于公共政策评估视角下大数据的应用

2022-02-03 21:11莫雨
南方论刊 2022年6期
关键词:政策评估信息

莫雨

(河北保定 073199)

【关键字】大数据;政策评估;公共政策

引言

公共政策即由公共权力机关所制定的政策。公共政策评估即在特定的政策制度下,评估主体按照一定的评估标准和程序,对公共政策的质量和效果,以及构成政策系统的诸要素、环节和评价方法进行局部或全面分析,并获得相关信息与政策结论的过程[1]。政策评估不仅是检验政策结果的重要标杆,进行政策调整的重要依据,也是进行社会资源配置的重要途径。一项政策如果只实施而不对其进行及时有效的评估,那么很可能会浪费社会资源,不利于维护最广大人民群众的根本利益,同时也会有损政府的权威,因此政策评估的作用不可忽视。

当今世界发展日新月异,计算机,互联网,物联网和人工智能等高科技的迅速发展使我们进入了一个现代化,数字化的信息时代。在此大背景下,大数据的重要作用逐渐凸显出来,在万物互联的现在,我们的每一项活动都在创造着数据。据国家信息主任预计,到2025 年为止,中国数据总量预计将跃居世界第一,全球占比有望达到27%以上。面对如此丰富的数据,我们应对其进行充分的利用,快速高效地释放“数字红利”。 政策评估的基础就是政策信息,政策信息包含政策进行过程中以及政策完成后的所有信息,只有以翔实丰富的信息为基础,才能保证政策评估顺利地进行。而大数据就是通过网络收集而来的庞大的数据组,这些数据组就是信息。大数据产生于各行各业也存在于各行各业,因此也能够应用于任何一个行业和领域。据此,我们应将大数据应用到政策评估中,扬长避短,不断促进我国治理体系和治理能力现代化。

一、大数据基于政策评估视角的应用流程

(一)数据采集

政策评估往往是基于某一领域的政策进行评估,因此在进行数据的采集时应首先确定好政策所在领域,然后进行数据的收集。确定好领域后,根据政策评估所需要信息的时间维度,利用时间锁定好数据范围。由于政策评估的基本“原料”就是信息,因此应利用爬虫技术在尽可能多的网站和APP 上搜集数据,比如,微博,微信,QQ,论坛,抖音,快手,各种新闻网站等,这样,可以获得更多人群的信息。

(二)数据清洗

政策结果的客观性和准确性以大量丰富的信息为基础,因此采集的数据也会比较庞大。在庞大的数据库中,不可避免地会有一些重复或者无效甚至错误的信息,为了保证数据的准确以及提高后续建模算法的鲁棒性,准确性需要进行数据清洗以初步剔除噪声信息。噪声信息主要可以分为两种,一种是离群点信息,这是由于政策评估收集的某些信息比较偏激,不具有代表性,还有一种是缺省值信息,这类信息是由于信息的收集来源比较广,人群比较大的特点,导致某些数据维度的信息存在丢失。对于离群点信息,可以使用分项、回归、聚类方法剔除出去;对于缺省值信息,可以通过回归、贝叶斯估计、决策树方法来填补缺省值信息。这样,经过数据清洗后的数据,才是可用的数据,才可以分析出有意义有代表性的结论。

(三)政策评估客体维度的建立

政策的推行往往对于特定目标人群才具有意义与影响,而这些目标人群对政策的反馈才会对该政策的完善有意义。所以对于收集到的多条信息,可以通过“年龄”“性别”“职业”“居住城市”等多方面因素来判断该信息是否满足某些政策客体的特征,从而为该信息补充政策客体维度信息。由于每个用户有可能同时符合多个政策客体的特征,因此对于政策客体的划分,应采用硬编码的形式。这种形式能够方便数据扩充,当新的数据以及新的政策客体加入时,可以迅速生成新的有用信息。经过这样的信息加工,最后构建的数据信息具有政策客体的额外信息,方便产生政策评估的具体结论。

(四)数据选定与特征工程

在经过数据清洗之后,仍会存在由于数据纬度高而导致数据分析结果没有意义的现象。在此基础上需要对这些数据进行数据选取,针对不同的分析要求,利用专业背景知识处理数据,提取出有价值的信息。完成数据的选定后,还可以利用特征工程进行进一步加工,比如可以利用方差选择法、卡方检验、互信息法,递归特征消除法等方法来进一步进行特征的选择。若是信息维度较大,影响建模算法的运行速度,可以利用PCA,LDA等方法进行特征降维。

此次步骤中输出的所有数据便是接下步骤中所应用的数据。

(五)数据分析和建模

数据分析和数据建模是利用大数据进行政策评估的整个流程中最为关键的一环,直接影响着评估结果的质量。在互联网中得到的信息都是文本信息,只有对这些文本进行语义上的分析才能够得到文字表面下所内涵的意义,即公众对政策的看法和思考。在此步骤中,数据分析者可以通过多种方法来进行统计分析,比如可以直接通过文本聚类和回归的方法直接进行统计分析,通过添加的政策客体信息,可以判断出政策客体对于政策的看法;也可以通过关键词提取,文本再生成的方法,将文本信息进行规范化表达,再生成知识图谱,利用知识图谱来提供政策评估相关信息。

在此步骤中,数据分析者可以对所收集到的信息设置关键词,关键句等,之后利用聚类分析对相对同质的群组进行统计分析。

(六)结果输出

这一步是将数据转化为文字,图表的过程。在经历过一系列的筛选和分析之后,最终会得到分析结果,分析结果将会以用户画像,数字图表等形式呈现。最后再由政策评估主体进行专业分析,得出文字性的有效结论,从而完成由文字到数字再到文字的过程。

二、大数据在政策评估各阶段的实际应用

政策评估的流程按照其所进行的时间划分为实施前评估,实施中评估和实施后评估,即事前评估,事中评估和事后评估。下面笔者将按照政策评估进行的过程分析大数据在各阶段的实际应用。

(一)大数据在事前评估中的应用

公共政策的事前评估又被称为政策预评估。此阶段的主要目的是通过一系列的措施,对政策的实施可能造成的影响和后果进行预测,从而提升政策的质量。在政策实施前进行有效的事前评估可以避免资源浪费,提前发现问题,做好应对方案,甚至防患于未然,在整体上提升政策的效果。

大数据在此阶段的应用主要是通过收集“客观性”的数据和“主观性”的数据来进行基于对数据的分析预测,从而为政策的制定提供信息支持和建议。“客观性”的数据指的是对事物本身的固有性质进行客观描述的,而非公众发表的主观意见的数据。“主观性”数据则是指由公众表达的看法和意见,具有强烈主观性,民众意愿的数据。在某项具体政策中,比如针对我国刚刚出台的“开放三孩政策”。若针对这一政策进行事前评估,需要收集的“客观性”数据主要有我国近多少年的人口数量,出生率,死亡率,我国经济发展情况等数据。需要收集的“主观性”数据主要有,公众当前的生育意愿,对独生子女政策和“二孩”政策的看法等数据。大数据对这些“客观性”的数据进行分析,从而为政策制定提供一系列的客观详实的事实资料,使政策具有科学支撑,更加具有准确性。对“主观性”的数据分析主要体现在实时监测舆情,及时掌握公众的反馈和意愿。在积极性文本信息中总结经验,在负面性文本信息中及时反思,调整政策的制定方案,在此基础上政策会更加符合民意,使政策更加具有“人情味”。

不针对某项具体政策,针对广泛的政策的出台,大数据具有更加明显的优势。大数据的一个特性就是即时性。通过对生产生活数据的日常动态监测,可以发现某些异常数据,从而针对这些问题制定有强针对性的政策,避免未来发生重大问题。通过对民情民意的舆情监测可以及时发现当前公众关注的实时热点问题,在此基础上进行数据深挖则会有利于有效解决社会问题,防患于未然。

(二)大数据在事中评估的应用

政策的事中评估又被称为过程评估。此阶段存在的主要目的是及时调整政策制定和政策执行。在事中评估中,可以利用大数据全面收集政策实施中的所有相关信息,比如政策实施后各项指标数据,相关部门落实情况的数据,以及公众对政策实施情况的意见和态度等数据资料。

在政策调整方面,对所收集的全面、广泛、即时的数据进行分析,从而发现数据是否正常。若有异常的数据资料则能够通过这些异常信息发现政策的问题,以及公众对政策的关注点所在,从而及时调整政策的制定,避免“问题政策”的产生,以及及时掌握舆情,避免造成公众的不满。例如若想出台一项交通政策来降低事故发生率,在政策的实施中则可以利用大数据进行即时监测和评估。可以首先利用大数据收集政策实施前和实施中的各种信息,比如某路段的人口流量,车流量,刹车数,事故发生率等数据,然后进行前后对比,确定该政策的实施是否有效降低了事故发生率。若效果不明显甚至是达到了相反的目的,则需要及时调整政策。除此之外,还需要对公众针对此项政策的反馈进行实时监控,收集数据。若公众对政策抱有怨言,认为影响了其出行效率等,那么需要及时研究公众所反馈的问题所在,及时调整政策,使政策既保证效果又能够让公众感到政策的人性化。

在政策执行方面,及时收集政策执行的相关数据,监测政策执行力度和效果,根据数据分析结果不断调整政策执行的方式,确保政策能够落到实处。例如,若是通过在政府公务网站进行政策发布,则需要实时监测该发布网页的点击量,以及浏览量,若数据低迷则说明此公布方式没有到位,需要辅以其他方式进行发布和施行。

大数据可以有效提高公共政策执行过程中触发感知和反馈能力,对实施过程中的“中梗阻”问题进行分析,及时掌握社会政策执行阶段的真实情况,保障公共政策的顺利实施。[2]

(三)大数据在事后评估的应用

公共政策的事后评估又被称为结果评估,主要包含两方面的内容,政策的实用性和价值性的评估。

实用性是指政策是否达到了预期目标,是否对社会经济发展起到了作用。在这一层面,可以通过大数据来全面收集政策实施前后的有效数据,然后对这些数据进行建模和分析,并进行政策实施前后的数据对比,从而得出政策是否具有实用性的结论。在价值性层面,则需要大数据分析人员密切监测各个社交网站和APP,及时获取公众对政策的反馈,利用数据建模来对收集到的信息进行文本文件的分析,将定性的信息定量化,得出公众对政策的满意率。最后对满意率背后所反映的问题进行深究,以期完善政策和总结经验。例如,若想对某项“人才引进政策”进行事后评估,则需要利用大数据从两方面入手。一方面利用庞大的数据库将某地实施该政策前后几年的数据进行收集(比如人口数量、各年龄段人口占比、经济发展总量、科技创新奖项、企业个数等信息),再进行前后对比,便可得出政策是否有效果的结论。另一方面,利用实时在社交网络等网站收集到的舆情,进行数据分析,研究该政策是否在提升该地人口素养等方面起到了积极作用。

三、大数据应用于政策评估的综合分析

(一)大数据应用于公共政策的优越性分析

1.大数据使政策评估更具客观性和科学性

从本质上来看,大数据在公共政策评估中的应用主要是提供数据,进行数据分析。在传统的政策评估信息收集中,往往采取的是抽样方法,其所获得的数据信息是有限的,不全面的,并且是局限在某一时间段的信息,无法及时更新。大数据所获得的信息是庞大的,全面的,广泛的,因此其分析的数据是全部数据而非只有样本数据,对足够多的数据进行研究才会使评估结果更加科学。基于传统的信息采集方法所收集的信息数据是固定不变的,而基于互联网的大数据可以实时进行数据采集和分析,能帮助政策评估主体随时随地地掌握一手资料,从而使政策评估主体及时掌握政策的进行状况,为政策评估提供及时有效的数据支撑。

2.大数据使政策评估更具民主性

在传统的政策评估中,评估主体主要是政府等体制内的工作人员,评估所需要的信息往往也是政府部门提供的。公众虽然可以通过听证会等方式表达自己的态度,但其作用和效果比较微小,并且参与的公众也比较少,得到的信息就不具有全面性。在大数据背景下,每个人都是信息的提供者,每个人在日常生活和互联网活动中留下的痕迹都可能成为将来政策评估所收集到的数据。这样,公众就成为了数据的提供者,基于大数据的政策评估也就成了针对于广泛大众的评估,而不是某一部分人群的评估,从而使评估过程和结果更加具有民主性。

3.大数据使政策评估更具全面性

传统的政策评估的着眼点是政策和结果两者之间的因果关系,即这项政策的实施有没有达到其所期望的目的。但大数据则可以探索影响政策的各方面因素,不仅仅是政策和结果两者之间的因果关系,而是众多因素的相关关系。例如颁布出台了某项农业政策,想知道粮食产量和政策的实施到底有无关系。若是传统的数据收集方法则会对比政策出台前后几年的粮食产量,从而得出结论。但这是不科学的,因为产量很大可能会受到气候和国内外市场的变化影响。基于大数据,则可以轻松的全方面收集相关气候,天气,市场变化等信息,然后对这些信息数据进行分析,得出可视化结论,探索各要素对粮食产量的影响,进而得出全面的评估结论。

4.依据大数据可进行政策预测

在互联网中,数据是每时每刻都在产生的。通过对这些数据的动态监控可以及时发现异常数据,从而在这些异常数据中发现隐藏在其背后的问题,进而制定出相关政策避免问题的恶化甚至产生。利用大数据进行政策预测是传统的数据收集方式所无法完成的。

5.提高政策评估效率

在大数据时代,海量信息来源于互联网,大数据的应用可以促进无纸化、电子化办公,提升工作效率。并且相对于之前手动翻阅繁重文档查找资料,大数据可节省大量的人力和财力,只需要几行代码便可以轻松完成资料的搜寻工作。

(二)大数据在政策评估运用中的风险分析

1.数据收集困难

大数据收集的前提是要产生数据,且数据是存在于网络中而不是纸质文本中。但基于现实,我国许多政府部门还没有完全实现资料电子存档,也没有相对完善的数据采集存储机制和数据共享平台。

2.数据噪声大

大数据的数据量庞大是其主要优点,但是在某种程度上也会造成错误或异常数据较多,甚至由于互联网的开放性,还会造成数据不真实。在互联网时代,人人都可发言,甚至某些人会故意发布一些不实的信息来达到某种目的,这些数据都有可能被采集,因此基于缺乏数据真实性的政策评估,其结果的客观性和准确性会大打折扣。

3.公平问题

虽然大数据已经尽可能多地涵盖了所有人的发声,但终归有人没有使用互联网。这就会造成提供数据的人并非全体公民,而是有能力接触到网络,会使用并且愿意使用互联网的人。这在一定程度上表明只有提供了数据的人才能在该评估中受益,这就会导致出现政策评估结果不公平的问题。

4. 隐私问题

大数据虽然为人们带来诸多便利,但不可回避的是,对数据的大规模收集和分析很有可能会侵犯个人隐私。保护个人隐私也是政府部门的职责,不可为了政策评估而顾此失彼。若在未经当事人同意的情况下,数据分析者擅自通过技术收集且利用其信息则构成了侵犯隐私的问题。但值得思考的是,向每位当事人征求同意是不科学也是不现实的,这就需要我国尽快完善有关数据保护和应用的法律法规,对哪些数据政府部门和企业可直接采用,哪些不可擅自收集作出相应的规范。

5. 数据分析能力较弱

仅仅拥有大量的数据并不能够很好地进行政策评估,重要的是利用科学高效的大数据分析技术,对隐藏在数据背后的内容进行探索。我国数据资料虽然很丰富,但由于大数据分析是一个全新的研究领域,因此专业人才较少,面对海量的数据,如何将其转换为有用信息的能力还比较薄弱。

(三)利用大数据进行政策评估的建议

1.构建政府部门大数据采集机制

提升政府工作人员的大数据收集意识。只有在思想上意识到其重要性,才会落实到实际行动中去。设置专门的数据信息上传系统,并对政府部门的工作人员进行技术培训,确保每位工作人员都会使用相关软件进行数据的上传和存档。对相关领导实施数据收集责任制,将收集数据的任务落实到人。

2.构建数据共享平台

政府部门和各企业都会具有各自的数据库,若想获取大量的数据则需要各平台进行数据共享。可由相关政府部门搭线构建数据分析平台,在合法合规,保护公民隐私的情况下,使政府各部门以及政府和企业间实现数据共享。

3.培养大数据分析人才

当前世界大数据和人工智能发展如火如荼,我国大数据的研究正处于起步阶段,与发达国家相比有一定的差距。我们可以借鉴其他国家的相关理论以及经验,并结合我国实际情况,完善大数据科学相关理论体系,健全大数据人才培养机制。设立专门基金促进大数据研究的发展,在各大高校开设相关课程,为我国培养更多的大数据分析人才。

4.完善数据安全相关法律法规

进行政策评估是政府的职责,保护公民隐私安全也是政府的责任。大数据给政策评估带来了便利,但同时也带来了有关隐私安全问题的挑战。政府和一些社会机构、公司,是否可以直接收集公民的数据,利用所收集的数据进行公益性或利益性的分析,以及如何合法地收集公民数据,如何对公民的数据进行保护等问题都亟待解决。这就需要国家有关部门完善保护公民数据安全的相关法律法规。有了法律保障,公民的数据便可以得到保护,政府部门和其他机构也能够按照规定合法的采集数据,避免违法情况的产生。

四、结语

大数据由于其强大的包容性可以应用到任何领域。在政策评估领域应用大数据可以有效地提供评估所需信息数据,进而不仅提高评估效率,还可以使评估结果更加具有科学性。但大数据的应用也是一把双刃剑,有利有弊,带来了诸多急需解决的问题。想要让大数据在政策评估中得到科学的应用,便需要扬长避短。本文对上述问题进行了些许的探讨,以期能为各位学者的研究提供思路,抛砖引玉。

猜你喜欢
政策评估信息
政策
政策
第四代评估理论对我国学科评估的启示
助企政策
政策
订阅信息
评估依据
展会信息
立法后评估:且行且尽善
资产评估法:能否终结“多龙治水”