朱 虹
(国家信息中心,北京 100045)
党的十八大以来,以习近平为核心的党中央从信息化发展大势出发,作出了“大数据”引领未来产业发展、“互联网+”行动、建设“数字中国”等一系列重大部署。2022年,国务院印发了《国务院关于加强数字政府建设的指导意见》,就全面开创数字政府建设新局面作出部署,标志着政务信息化时代的结束和数字政府全面建设时代的开启[1]。推进数字政府建设,对不断推动数据的汇聚共享、数字化技术的应用和政府治理流程的创新等方面都提出了更高的要求,必须综合运用新技术、新理念、新模式提升治理能力和治理水平。
文章从解决实际问题的角度出发,充分收集部门内部积累的政务服务数据,广泛利用散落在互联网中的数据,借鉴用户画像和企业画像的构建方法,利用数据挖掘、大数据等技术对这些数据进行整理分析,构建政策画像,实现政策全流程闭环管理的最后一环,将政策执行情况和企业基层群众的关切反馈给政策制定者,方便政策制定者有的放矢地优化政策、出台细则或解决政策协同问题等。同时,也可将一些政策画像开放给企业、基层和群众,方便其理顺政策与政策之间的关系,提升政务服务效能。
当前,全国一体化政务服务平台的建成不断强化数字政府的顶层设计,极大地推动了数据的汇聚和共享,各级政府部门都积累了大量的数据,加之智能问答、语音识别、辅助坐席等智能化产品的应用,积累的数据更是以指数级增长。在不断积累数据的同时也要看到,各级政府部门对于数据的利用还仅限于身份核验、电子材料提交等,在我国推动发挥数据要素新动能、创新政府治理流程的新要求下,各级政府在政务数据和社会数据融合、分析上还做得十分不足,使得数据价值未得到有效发挥。若利用有效的分析工具将数据中蕴含的深层次价值挖掘出来辅助决策,将有助于推动政府决策科学化和社会治理精准化,进一步提升服务效能。
在技术方面,用户画像和企业画像的方法非常适合用于对这些数据进行挖掘利用。目前,国际、国内对于用户画像和企业画像的研究非常深入,普遍应用于不同领域,但是以政策为对象,利用数据挖掘和大数据手段构建政策画像,助力政策制定实施、提升政府决策科学化水平方面还是空白的。
政府决策的科学化水平一定程度上影响着国家治理目标的实现,数据赋能是数字政府建设的关键和发展方向,是实现治理目标的发展动力[2]。党的十八大以来,党中央、国务院高度重视数据基础资源价值,围绕加快政府数据开放共享、加快培育数据要素市场、发挥数据要素价值等作出了一系列重大部署。2020年,国务院提出加快培育数据要素市场,标志着数据要素已经成为我国的基础性资源、战略性资源和重要生产力[3]。
数据要素主要由政务数据和社会数据组成,是进行大数据分析和应用、人工智能应用的基础性数据资源,政务数据和社会数据的融合使用将形成对社会治理和产业升级的强大推动力。建设数字政府激发数据要素新动能,需要从把控政府内部数据质量开始,首先确保数据的及时性、完整性和准确性,这就要求政府部门制定完善的数据标准,将技术、业务与数据要素深度融合,而后通过数据分析建模提供决策依据,从而提升政府决策科学化水平。
互联网、云计算、大数据、人工智能等智能科技改变了人们政治、经济、社会等的运转方式,人类社会朝着多元化、开放化、智能化的方向发展[4]。而社会变革又推动了政治领域的发展,通过智能科技创新政府服务模式和治理理念,推动政府治理向数据化、智能化和精准化方向发展[5]。
创新数字技术可以从两个方面推动数字政府建设,一是面向广大群众和企业,推动云计算、大数据、人工智能等数字技术融入政务服务全流程,事前主动推送服务、事中精准化引导服务和审批精准化发布、事后评价精准化反馈等,加强智能搜索、智能问答、智能推荐等服务方式创新,全方位提升政务服务水平、优化服务体验;二是面向政府内部,优化审批流程,推动全流程网上办理,加强部门间的协同办理,汇聚政务数据,利用数据挖掘、大数据等将数据蕴含的深层次价值反馈给政策制定者辅助决策,从而提高政府施策精准化水平。
数字政府发展带来的治理议题,可分为“基于数字的政府治理”和“政府数字化的治理”两大方向,前者主要关注传统公共管理议题借用数字技术所带来的变革和影响[6]。数字化转型通过数字技术将国务院各部门、各级政府联系到了一起,形成了一种新型的更加紧密的、协同性更强的组织模型,通过数据的积累和传输、系统间的协同将原来各自为政的、条块分割的部门联系到一起,构建了跨部门、跨层级、跨业务的政府部门协同体系,提升了政府的整体性,同时数字政府建设也推动了政府治理流程的创新和重构。
数字化平台的优势为公众表达政策诉求提供了丰富便捷的渠道,在重大政策制定过程中、做出决策前,政府部门通过在网站上增加专栏、公开征求意见稿等方式广泛征集民众意见,政策发布后及时发布相关的政策解读,开通网上、电话咨询热线方便群众咨询,这些都增强了民众对于政府决策的参与度。随着数字政府建设的不断推进,对于现有的数据分析、挖掘等工作必然推动增加更多的反馈流程,将更有价值的内容反馈给政府用于决策。如在政策执行阶段,地方发布配套措施数据将有助于推动政策更好更快落地,企业基层群众咨询数据将有助于政策的优化完善等。
数字政府建设创新实践需要从数据入手,首先需要整理政府部门所积累的数据,对数据进行收集、整理和清洗。政务服务数据属于政府数据,分为政策基本数据、政务服务审批数据和政务服务咨询数据等。除了对于政策基本数据的整理,文章主要研究政务服务咨询数据和散落在互联网中的政策执行数据的整理分析。一是政务服务咨询数据。2015—2020年,文章梳理了国务院F部门积累的数十万条政务服务咨询数据,通过整理、清洗,其中记录完整、有分析价值的数据为50781条。根据2021年12月31日全国信息安全标准化技术委员会发布的《网络安全标准实践指南——网络数据分类分级指引》[7]要求,参考贵州省、浙江省、北京市等地方数据分级分类指南,根据政务服务领域数据管理相关经验,将政务服务咨询数据进行分类。二是政策执行数据。只利用部门内部积累的数据还远远不够,文章还充分利用了散落在互联网中的数据,如各地方各平台发布的配套政策数据。
用户画像就是用户信息的标签化,根据用户的社会属性、生活习惯和消费行为建立的用户模型[8]。用户画像比较通用的方法是应用大数据的方法,爬取互联网用户的消费数据、浏览数据、发布的文本信息等数据,对数据集进行整理、清洗等处理,为用户标记基本信息、行为习惯、兴趣爱好等不同维度的标签,分析出用户喜好偏好,让企业能够针对用户精准营销。用户画像构建流程一般可划分为数据采集、数据挖掘过滤、标签提取重组等。用户画像广泛应用于产品销售、卫生健康、文化旅游等领域[9]。如郝胜宇等人通过用户画像技术准确识别和描绘目标客户,从而实现企业精准营销,提升营销效果[10];马费成等人利用健康知识和个人健康大数据构建用户需求画像和用户健康画像,创新了智慧健康服务模式[11];单晓红等人利用用户信息、酒店信息和在线评论等数据构建多维度用户画像模型,从而提升市场营销和用户服务的精准化水平[12],等等。
在广泛的商业应用中,不仅可以为用户画像,同样也可以给企业画像。企业画像就是把企业信息标签化,将企业的具体行为属性进行归类,建立标签模型体系,最终形成一个多元化的标签对象[13]。企业画像的步骤:首先,根据语义、短文本两个特征提取标签,为标签撰写关键词,并对一些关键词增加权重,而后开展企业行为分析、预测分析、关联分析等。企业画像不仅可以为政府监管提供依据,还可以为企业竞争提供数据分析。如吕辉等人构建了基于电力大数据的标签画像[14];吴行惠等人利用质监大数据构建企业画像提升质监部门的监管效率[15];黄晓斌等人用“拟人化”的方式,利用多源数据抽象企业特征构建企业竞争对手画像,为企业在激烈的市场竞争中提供参考[16],等等。
当前,国内外以政策为对象,构建政策画像的研究比较少,在互联网上搜索“政策画像”更多的是对于政策的数据检索,例如:《涉企政策转入云端青岛市城阳区率先上线政策画像平台》[17],青岛市城阳区运用大数据、人工智能、云计算等技术手段,实现了企业更加精准搜索其所需的政策,确切来说不是对政策画像,而是对企业政策需求“画像”。
数据的分级分类为政策画像的构建打下了坚实的基础。整理、清洗政务服务数据后,给出政策画像的定义,深入分析研究政策基本属性、政策之间的关系、企业基层群众关切情况等内容,将政策属性按照不同维度进行分解,提出构建政策画像的方法和设计。
政策画像可以定义为把政策的基本属性、政策之间的关系、执行情况等信息标签化,通过打标签、聚类等方式,形成一个多维度的政策模型。将政策的内涵和执行情况可视化,从多个角度呈现出政策的各方面情况。
通过对现有国家宏观经济政策的分析研究,根据相关性原则,可从3个维度刻画政策画像,包括政策基本信息、政策与政策之间的关系、执行情况等。①政策基本信息,包括标题、发文字号、发文单位、联合发文单位、主题词、主题分类、发布时间、实施时间、是否公开等。②政策与政策之间的关系,包括政策的依据、政策的相关政策、政策的前序政策和上位政策、补充说明等。③执行情况,包括各地方配套政策的出台情况、企业基层群众关切情况等。
不同的政策基本信息指标相似,但是每个政策特点不同,需要针对每个政策的特点构建不同维度的政策画像。有的政策涉及相关的法律法规、实施条例、政策解读较多且关系密切,企业基层群众迫切需要理顺政策之间的关系,那么这种政策更适合用政策关系图谱画像。有的政策发布后需要地方出台配套政策才能落地,且具有明显的时效性要求,为了方便中央层面的政策制定者掌握政策执行情况,这种政策更适合使用政策执行情况画像描绘。作者以宏观经济政策为例,研究设计3个维度的政策画像,包括政策基本信息画像、政策关系图谱、政策执行情况。
4.3.1 政策基本信息画像和政策关系图谱
政策基本信息画像主要展示政策的基本属性,政策关系图谱主要展现上位政策、平行政策与相关解读文件等之间的关系。政策基本信息画像和政策关系图谱的数据均来源于原有系统的数据库,人工梳理政策与政策之间的关系。以国家发展改革委第16号令《必须招标的工程项目规定》(以下简称《第16号令》)为例绘制政策基本信息画像和政策关系图谱(如表1所示)。
表1 政策基本信息示例
4.3.2 政策执行情况
(1)政策执行情况时序图和执行情况分布图。政策执行情况画像分为政策执行情况时序图和政策执行情况分布图,两张画像分别描绘地方政府发布配套政策的时间序列和各地发布配套政策的地域分布情况。以《关于促进服务业领域困难行业恢复发展的若干政策》(发改财金〔2022〕271号)为例,截至5月10日除港澳台外29个省(自治区、直辖市)政府发布了配套措施,用时间序列和地域分布的方式绘制政策执行情况时序图和执行情况分布图(如图1所示)。
图1 政策执行情况时序图
(2)企业基层群众关切情况。企业基层群众关切情况画像是根据政务服务咨询数据绘制的关切图。按照前述建立的政务服务数据分类目录规范中的分类形成标签体系,为每个标签设置关键词。通过语义、短文本两个特征提取每一条咨询中的关键词,为其打上多个标签,而后用聚类的方式获得企业基层群众关切情况画像。企业基层群众关切情况画像的数据来源于已有系统中积累的政务服务咨询数据,并不断根据政务服务系统运行数据实时更新。以《第16号令》为例,构建三维三级标签体系(如表2所示)。根据关切政策内容分类、具体问题等角度绘制企业基层群众关切画像(如图2所示)。
表2 政务服务咨询数据标签体系
续表
图2 企业基层群众关切情况示例
关切情况画像可以很清晰地反映出企业基层群众对于《第16号令》的关切主要是“确认单项合同价格是否必须招标”“确认‘勘察、设计、监理等服务的采购’范围”“分包是否必须招标”等。主要反映在对政策的第二条和第五条的把握,虽然国家发展改革委又专门发布了发改办法规〔2020〕770号文件对其进行了进一步的解释说明,但是有些内容仍需进一步加强政策解读和宣传引导。
依照政策服务的对象不同,政策画像的应用场景也分为两部分。一是在政策制定者的机关办公网络中,实时动态展示对于政策执行情况的画像,包括政策执行情况时序图、政策执行情况分布图、企业基层群众关切情况画像等。让政策发布者能够及时了解企业、基层和群众的诉求,从而分析出政策存在的问题,开展优化完善、发布政策解读或者出台相应措施促进政策的落地。二是在政府网站政务服务栏目中,开辟专栏主动为企业、基层和群众展示热门的政策画像,包括政策基本信息、政策关系图谱和相关各省市发布配套政策的情况。方便企业、基层和群众一目了然地了解政策的相关情况,快速找到所需的政策。
绘制多维政策画像是政策制定实施优化的一般规律和方法,可以实现对政策的优化完善,辅助政策制定者科学决策,快速发现解决政策落地过程中出现的堵点、痛点问题,促进政策更好更快地落地。下一步,将从研究的高度、深度、广度持续深入开展研究。一是加强顶层设计研究,强化数据协同。强化系统观念,进一步开展汇聚国家政务服务平台、各部门网上政务服务大厅、各地方政务服务平台中的政务服务数据的顶层框架的研究。二是持续开展政策画像研究,提升画像精准性。持续扩充政务服务咨询数据,进一步优化绘制画像的算法,积累对于政务服务咨询内容打标签和关键词的设置的经验,不断提升画像的准确性。三是扩大应用案例,推动研究成果转化。探索为不同政策建立标签体系、绘制政策画像,深入分析政策画像中隐含的政策执行情况,不断推动成果转化,真正惠及政策制定者和企业基层群众。