基于智能报表的政府数据利用模式探索

2024-08-17 00:00曹晖张亮
数字通信世界 2024年7期

摘要:随着城市数字化的发展,城市运行所产生的政务数据进入快速增长模式。江宁区政府利用数据统计报表的方式,通过大数据分析对整个江宁区城市运行态势进行全方位感知,从而为江宁区政府领导制定宏观经济政策和城市长期规划提供重要依据。智能报表从政府业务人员的角度出发,将政府的业务需求进行抽象化处理,选择有需要的数据和指标,避免无意义的数据共享,提升了数据共享的目的性和效率;通过低代码技术,将各类政务数据进行灵活的排列和组合,能更好地展现数据之间的联系,提升了数据利用的效率。

关键词:城市数字化;智能报表;低代码

doi:10.3969/J.ISSN.1672-7274.2024.07.075

中图分类号:G 203 文献标志码:A 文章编码:1672-7274(2024)07-0-04

Exploration of Government Data Utilization Model Based on Intelligent Reports

CAO Hui, ZHANG Liang

(Judicial and Legal Committee of Jiangning District Committee of the CPC, Nanjing 210000, China)

Abstract: With the development of urban digitization, the government data generated by urban operations has entered a rapid growth mode. The Jiangning District Government utilizes data statistics and reports to comprehensively perceive the overall urban operation situation of the entire Jiangning District through big data analysis, providing important basis for the leadership of the Jiangning District Government to formulate macroeconomic policies and long-term urban planning. Intelligent reporting starts from the perspective of government business personnel, abstracts government business needs, selects necessary data and indicators, avoids meaningless data sharing, and improves the purpose and efficiency of data sharing; By using low code technology, various types of government data can be flexibly arranged and combined, which can better display the connections between data and improve the efficiency of data utilization.

Keywords: urban digitization; intelligent reporting; low code

0 引言

江宁区政府统计报表是建立在江宁区十个街道、经济开发区、区级职能部门日常工作统计数据基础之上,经过数据的采集、比对、分析等一系列数据处理方式形成江宁区政务报表资产基础目录,通过对基础报表的数值进行分析得出的结论是江宁区政府领导制定宏观经济政策和城市长期规划的重要依据。传统静态报表设计与应用系统耦合度高、灵活性差,不能适应报表的动态需求变化。为提升江宁区政务数据的感知能力、处理能力、分析能力,实现自主构建多形态江宁区政府统计报表,提升对区级各业务部门数据统计和数据分析的支撑能力,同时在数据共享层面,向江宁区上层领导和决策部门以及社会相关团体、第三方机构提供高质量、高可用的报表数据,对推动江宁区政务数据共享体系和数据挖掘体系的构建具有重要意义。

1 政府大数据

2022年我国数据总产量达8.1ZB左右,同比增长22.7%,全球占比高达10.5%,位居世界第二。截至2022年底,我国数据存储量达724.5 EB左右,同比增长21.1%,全球占比达14.4%[1]。其中,政府数据占到了约80%。如图1所示。

图1 2017—2022年我国数据产量及全球占比情况

(数据来源:中国信息通信研究院、中国网络空间研究院)

2 政府统计报表样式

在政府日常使用的统计报表中,各类统计报表通常包括表单标题/名称、表前注释区、表单主体以及表尾注释区等。

2.1 表单标题/名称

作为表格统计的名称,标题/名称常包含对表格统计内容的主题性描述。

2.2 表前注释区

用于对表格标题的补充说明或标题内容的全局注释,包括统计调查对象或统计指标的分项标注,以及统计口径、量纲单位和统计时间等信息的全局说明。

2.3 表单主体

表单主体是表格的“正文”,统计表单的数据项目集合,每个数据项还包括以下信息:数据项目标题,如数据类目、统计口径、统计区域等;数据项目类型,如文本、数字等;数据项目的属性,如数值区间、密级等。

2.4 表格注释区

该模块的作用是对表格的内容或者单个表字段进行说明,以及对表体单元格内容的局部注释。

3 政府统计报表制作面临的困难

政府统计报表可以帮助政府更好地了解、使用、挖掘数据价值,并把数据信息以安全可靠的方式呈现给政府用户,作为政府运行数据常用的输出方式,统计报表在政府信息平台中起着重要的作用。

目前政府对统计报表需求量巨大,由于政府部门业务逻辑复杂、需求变化多、数据来源多等原因,造成政府统计报表结构复杂,表现在以下几个方面:

3.1 业务逻辑复杂

政府内部业务逻辑复杂,部门职能交叉重合多,我国虽然在制度上构建了同质化的条块组织架构,但其形成的条块关系却具有复杂性和多变性,条块关系在不同层级政府中、在不同的治理背景下并不相同。一方面,在中国的大国治理中,职责同构的“条条”面临资源禀赋与区域差异巨大的“块块”,在不同层级政府中形成的条块关系可能并不相同。另一方面,从时间维度上看,条块关系在不同的时期会呈现不同的样态,这与当时的治理环境有很大的关系[2]。业务逻辑的复杂性体现在报表中就是报表边框线规则复杂、表头指标多、格子层套多,给报表制作和阅读都造成很大的负担,且维护难度大、灵活性差。

与普通关系型表单每行(列)只表达单层语义不同,政府统计报表需构建政务服务独特的业务知识体系,在业务表集中,每张表之间、表与表之间的行列表头存在大量的总分关系、同位关系、并列关系、上下级关系、组合关系等,具有复杂的、多层级嵌套的特点。

同时,政务报表的复杂性还体现在使用人员常常无法从中得到明确的关联信息;使得数据流转和共享存在巨大的阻碍。

3.2 报表数据源多

随着政府信息化的发展,政府内部不同层级、不同部门都fAnmRCbFWQv7RUz+Jv/TWw==建设了很多信息化系统。政府统计报表的数据通常会来自多个不同的系统数据库,数据的格式、数据质量都不相同。例如,对于常住人口的统计,有统计局、公安局、卫健部门、政法委等多个口径,由于几方数据基本来源于各自业务系统,系统本身设计存在巨大差异,数据的统计方式、统计目的和统计标准也各不相同,造成后续无法以统一的标准进行数据比对。

而且在政务大数据共享的推进过程中,存在着出于权力本位和自身惰性不愿共享、基于信息安全和风险考虑不敢共享、缺乏体制机制和技术支撑不能共享等问题,给报表制作造成很大的障碍。

3.3 需求变化较多

政府统计报表关联了多个数据源,含有大量的数据。对数据统计通常根据政府部门的业务要求、时间要求、管理要求,需从不同口径、不同视角对数据予以分析,需对数据进行逻辑计算,这种计算基本上都是跨行、跨组的,且对灵活性要求很高。传统的数据报表定制研发是由软件厂商或运维厂商设计、研发、部署和实施产生的,不仅灵活性差,且由于软件厂商对政府各条专业线的细分知识和政策缺乏整体了解,在处理业务系统产生的大量数据时,很难有效地通过报表的形式实时、高效构建政府用户所需数据集,对后续政府用户从数据集中提取有效信息产生影响。

4 报表引擎在数字政府中的应用

智能报表是通过对数字政府具体业务场景的分析和政府使用者日常工作行为习惯的掌握,从分离业务过程与重新排列组合的角度出发,为政府实际使用者提供单纯的业务层服务组合手段,让用户能够从业务层面来直接描述其需求,使得系统能快速获取使用者的意图,从而提升数据共享利用的效率和数据获取的准确度。

4.1 多源采集,促进多部门数据共享

为了提高系统的灵活性和扩展性,无缝透明对接底层业务数据,运用组件的先性进屏蔽内部所有技术细节,提供从数据字典、数据开发、机器学习、数据稽核到运维调度的所有功能,从而大幅降低使用门槛。为数十种不同的异构数据源提供丰富的连接处理能力,搭建高效的数据连接汇聚通道,促进融合管理,支撑数据挖掘与上层应用,形成高性能、安全可靠的数据涌流通道,按需搭建、快速获取数据。

通过采用配置文件的方式,使用户可以根据自己的需求定义数据源,然后选择其中的属性完成数据定义。通过关联包含相应逻辑连接的数据库字段,从数据库中将数据取出来,形成可直接应用于模板设计的数据集,达到将多个源表的数据在同一单元内关联展现的目的,实现报表数据集和数据源的分离,提升了政务数据共享的效率。

4.2 分离业务与IT资源,让用户专注业务需求

从政府用户的角度出发,将用户的业务需求进行抽象化处理,通过整合和提取现有的数据资源,得到面向政府用户的业务层抽象服务资源;为政府用户提供单纯的业务层报表级和字段级组合手段,一键形成政府用户想要的表单。

利用可视化技术和低代码技术,以用户的思考行为为基础,在报表展示形式、展示内容、表头组合和数据样式等方面,可以根据用户的需求进行界面、指标和报表的定制,满足不同管理层级和岗位的需求,给予用户最佳的使用路径,提升智能化报表应用。

(1)表单设计。支持通过拖拽式编辑,供选项卡、主子表、富文本、部门选择、日期选择、视图选择、二维码扫描、OCR识别多种功能控件供调用,同时平台支持控件自定义拓展,不同部门用户在同一平台可结合自身业务需求自由添加及复用。

(2)数据模型(Data-Business)。数据建模是一种定义和分析数据的手段,在具体实现方面了采用基于“标签+属性”的方式进行数据管理模型的创建。标签是一种数据特征,是根据数据的业务性质定义出来的,是构建数据画像的核心要素,是将用户数据提炼后生成的具有差异性特征的形容词,按照生成方式,可分为统计类标签、规则类标签、机器学习类标签。对同一个数据,可以打上多个标签,同一数据上的标签会随着时间的推移而持续增加,同时也会让数据画像信息更加准确且完整。

在标签特征建立后,为每个不同标签自动/手动添加属性,能够更精准地描述事实和度量特征,属性相较于标签而言具有稳性定,其值可以在阶段时间内保持不变或变化较小,同时属性也可以根据具体的业务和查询要求来决定是否要进行聚合(求和/运算)与分解(明细),也可以进行大小的比较和排序(如年龄、党龄、纳税记录等)。通过“标签+属性”的数据模型,为政务数据构建精准画像,使业务人员能够更精准、快速找到所需的结果,而不用花精力关心底层的数据库逻辑、表关联逻辑。

(3)流程配置。基于BPMN2.0规范的可视化流程设计模式,无论是标准的模板流程、新兴的自由流程还是子流程嵌套,均能在Web页面通过拖拉拽方式以图形化+参数化的方式快速完成。

(3)权限管理。提供审批节点、审批路径、审批人员、审批权限、审批时限、审批动作和审批通知等控制内核,以适应中国式流程管理模式和操作习惯。

(4)数据集成。提供多种方式帮助用户实现与第三方系统的集成对接,支持将数据结果服务化的同时,再基于权限控制进行服务的共享,任一部门、任一业务人员可在许可范围内进行数据服务的调用,在表单定制、模型定制的基础上增加灵活性和扩展性,同时又不会因为数据的接入影响源数据及业务,所有数据服务可通过管理中心实时监管,安全便捷。

4.3 数据深度挖掘,提升决策水平

统计数据报表信息的深度挖掘是面向结构一致的统计数据集,在在数据读取与集成的基础上,采用报表引擎的方式,根据定义的报表主题及配置的算法,发现其中的相关关系以及探寻表与表之间的因果关系,从而进行多维度的统计评价与数据预测,以反映区域经济发展情况、研究特定问题及支撑制定决策等。

报表引擎提供了丰富的数据分析和统计功能,用户可以通过设置各种过滤条件和统计函数,对数据进行聚合和分析。这样可以帮助用户更好地理解数据背后的含义和趋势,并提供预测和决策支持。用户也可以根据实际需求,随时调整报表主题及算法的定义语言,通过多维变量自绑定技术将多维变量引用方、多维变量及多维变量提供方在解析时进行自动多级绑定,当提供方数据发生变化时,根据绑定关系通知表达式引擎向引用方广播数据变动通知消息,附带表达式计算结果,从而可实现复杂的数据联动逻辑[3]。报表引擎运行结束后,自动形成政府用户所需的完整报表,当定义内容变化时,所需报表的格式和数据内容也会进行及时调整,提升了业务的灵活性、降低了政府用户的使用成本。

5 结束语

智能报表系统在建设之始,锚定“整合数据资源,挖掘数据价值”,立足数据有效归集、工具实效应用、辅助高效决策,打造贴近业务的报表工具平台。通过技术与业务的关联预设,使业务人员摆脱技术限制,基于业务即可实现多维报表样式定制、指标定制、条件定制,并支持按权限的结果和有条件查询/使用,优化了政府运行数据的利用方式。

参考文献

[1] 刘云朋,卢贝.基于数字政府建设视角下的政务数据共享现实困境与对策研究[J].焦作大学学报,2024,38(2):61-64.

[2] 成婧.政府过程中的复杂性条块关系及其产生逻辑——基于干部调配数据的观察[J].公共行政评论,2023,16(1):181-196,200.

[3]张启伟,刘海涛,尹洪苓,等.面向业务用户的智能报表实现研究[J].电脑知识与技术,2022,18(28):109-112.