基于大数据的民政业务数据海平台规划与设计

2020-02-27 03:35徐佩黄爱国陈震熊红林沈俭樊重俊
电子商务 2020年2期
关键词:电子政务大数据

徐佩 黄爱国 陈震 熊红林 沈俭 樊重俊

摘要:在電子政务的背景下,民政部门已建立的信息系统每天会产生大量数据,针对如何让数据提升价值,本文提出了民政业务数据海平台,并通过平台架构、数据资源、应用功能三个方面分析设计了民政业务数据海平台。民政业务数据海平台通过高效采集、有效整合,深化应用民政业务数据,从而实现民政精准化、动态化服务的目标。

关键词:大数据;电子政务;数据海;Hadoop

引言

在大数据时代,每天会产生大量数据,那么在数据层面获得大量的、有关联的民政业务数据集合却不能直接获得数据的业务价值,而民政业务数据海的提出在于,一方面是整合生成并管理民政业务大数据,另一方面是在民政业务大数据的基础上,提升民政业务数据集合的数据应用价值,为各业务部门建立实用的数据分析模型与数据挖掘模型,搭建对民政业务指导、服务改善、辅助决策有实际指导价值的信息化应用,切实改进民政信息化生态。

1、民政业务数据海简介

民政业务数据海是基于民政各项业务和服务运行而汇聚的、能够长期、真实反映民政业务过程、状态和结果的民政数据资源之上的数据价值分析和挖掘应用。它设计的目的就在于提升民政业务数据集合的数据应用价值。一方面,民政业务数据海平台能够联接构建民政业务全息信息,不但追溯业务的过去、还原业务现状,还能预测未来业务的发展。另一方面,以民政业务需求为导向,选取若干当前民政领域比较热点的业务子域,如社会救助、居家养老服务等开展数据价值分析研究,探索研发若干数据分析模型,并以数据模型为依托,开发若干业务监控应用,用民政业务大数据监控预测业务走向,提高服务能力和水平。

民政业务数据海与传统的民政数据中心之间既有联系又有区别,两者的联系在于业务数据海的数据基础来源于民政数据中心的数据资源,这些数据既有民政领域内部的业务数据和服务数据,也有来自于民政领域之外的、有公信力的、可公开使用的数据;两者之间的区别在于数据海的重点不在于数据的汇聚和整合,而是侧重于数据价值分析与挖掘应用的搭建,在于业务数据内在联系和价值的发掘,并通过信息化工具展现出分析结果,从而指导民政业务和决策。

2、民政业务数据海平台架构设计

民政业务数据海平台通过收集结构化数据和非结构数据,利用ETL工具对数据进行分析处理,并通过Hadoop系统对大数据内容进行数据挖掘,形成支撑面向政府决策支持和相关行业应用的决策支持数据,实现灵活、快速的数据重组服务,系统架构如图1所示。

该架构采用分布与集中相结合的方式,将民政行业内与业务活动密切相关的结构化数据和非结构化数据进行汇聚、分类,逐步实现由分散存储向集中存储,孤岛数据向关联数据的推进,为各类数据应用提供坚实的基础。在形成统一的数据平台的基础上,通过对基础数据的分析、挖掘获得各种加工数据,合理地构建各类数据库和数据仓库,并对大数据内容进行处理。

3、民政业务数据海平台数据资源设计

依照平台总体架构设计,利用时间序列分析方法、聚类以及分类等方法将数据分为五大区数据,本平台的数据库规划设计如图2所示。

数据库规划主要划分为基础数据区、应用数据区、统计数据区、交换数据区、历史数据区五个区。其中基础数据区用来保存民政业务全域的基础性数据,包括服务对象个人数据、家庭数据、企业法人数据、非企业社会组织数据、系统元数据、空间地理数据等。原则上,基础数据区属于跨条线共享数据。

应用数据区用来保存业务运行数据,包括结果数据和过程数据。进一步划分为条线业务专有数据、跨条线业务共享数据以及民政知识库数据。

统计数据区用来保存各种统计分析数据,这些数据的来源是应用数据。统计数据区还可以进一步划分为指标数据、模型数据、统计数据、多维数据、动态监控数据等统计服务数据。

交换数据区用来阶段性保留各类民政外部的交换用数据,比如人力资源和社会保障数据、公安数据、医保数据、保障房数据、残联数据等等,这些数据都是支持双向传输的,既有民政业务数据海提供给其他委办系统的数据,也有其他委办提供给民政业务数据海的数据。

历史数据区用来保存各个数据库区所存储的超过3年的各类数据,为了便于管理、响应迅速,历史数据区的设计也分为应用数据、基础数据、统计数据、交换数据等类别。

4、民政业务数据海平台应用功能设计

业务数据海门户是数据分析应用的访问入口,依照工作职责和使用需求来确定平台的使用权限,依照权限的不同,开放给三类人员,即业务人员、管理人员和系统运维人员。该门户的具体应用功能包括以下四个方面:

(1) 数据整合任务管理

主要是指对数据整合相关数据库编程脚本的调度任务进行管理,以实现对相关联业务数据的有效整合,具体功能包括:数据整合任务的新增、调度执行、执行结果监控等内容。

(2) 自定义查询管理

业务数据海的数据范围需要涵盖业务信息化覆盖的所有民政业务领域,而且需要通过以服务对象主体为中心进行数据整合。系统提供针对使用者的完全动态化、个性化的数据查询与组织功能,即自定义查询管理。该功能包括数据源选择、数据表选择、数据过滤条件选择、数据项选择等功能要求,不但支持数据过滤条件的动态组合,而且还需要能够支持业务领域数据字段的动态组合。

(3) 业务数据海监控管理

随着民政业务和服务的持续进行,民政业务数据海的数据量必然会持续膨胀,对支撑资源的要求也会不断提高,因此需要监控工具对业务数据海的数据情况进行统计和监控,对触发或靠近支撑资源运行警戒线的情况做出预警,便于用户方在资源方面及时做出调整,具体功能包括:监控指标项管理、监控预警报表管理。其中监控指标项管理是指对业务数据海的相关监控指标项进行管理,包括数据存储空间、数据查询时间、数据整合任务运行时间等内容,具体包括:监控指标项新增、修改等维护功能。监控预警报表管理是指在现有有效监控指标作用下的监控预警报表进行管理,具体包括报表的生成、展示、存储、打印等管理功能。

(4) 業务数据海应用设计

业务数据海应用设计主要包括以下几个方面:

① 服务全息信息查询,主要包括两大方面:自然人服务全息信息查询和社会组织服务全息信息查询。自然人通过证件类型和证件号码,社会组织通过组织类型和组织机构代码定位到某一具体自然人和社会组织,查询结果会集中呈现其目前所有民政业务和服务的相关状态和业务办理情况,也可进行条件查询。

② 社会救助对象监控,包括困难对象筛查监控、养老机构分布及服务能力评估监控、死亡人员服务监控、(社会救助享受信息监控、居家养老服务信息监控、优抚服务信息监控)婚姻状态相关业务监控等等。社会救助对象监控可采用柱形图、饼图、折线图等可视化显示,更加直观的了解当前状况。

其中困难对象筛查监控主要是对目前享受民政相关社会救助业务的服务对象的困难程度进行分级统计和展示,重点找出多重困难群体在整个社会救助群体中的分布、占比及其个体组成情况。

养老机构分布及服务能力评估监控主要依赖地图系统进行数据分析和结果展示,重点展示现有各类养老服务机构的地图位置分布,并能够依照选定的市、区县、街镇进行当前养老服务能力的评估和监控。在地图上展示各个养老机构分布情况,鼠标放置在特定养老机构位置上面,会自动显示该养老机构的地址、联系方式、设立时间、机构性质(养老院、居家养老服务中心、托老所、助餐中心等)、服务老人数量等信息。

死亡人员服务监控主要是通过与公安人口数据库对接,重点获取死亡人口数据,每月同步一次。社会救助享受信息监控主要在各级各类社会救助信息中对死亡状态人员进行筛查,以监控人员死亡之后还在享受社会救助服务的情况;居家养老服务信息监控主要在居家养老服务信息中对死亡状态人员进行筛查,以监控人员死亡之后还在享受居家养老服务或补贴的情况;优抚服务信息监控主要在优抚信息中对死亡状态人员进行筛查,以监控人员死亡之后还在享受优抚服务的情况。

婚姻状态相关业务监控主要对与婚姻状态相关性高业务申请和经办情况进行筛查,以监控这部分特定婚姻状态人群(离婚状态、复婚一次及以上状态、丧偶状态)在享受社会救助、社会福利相关服务的情况。

5、结语

鉴于当前民政业务现状以及大数据背景,提出民政业务数据海平台。通过数据海的建设,形成真正的、全面的、高质量的民政业务与服务数据资源中心,该数据资源中心依靠对内梳理整合、对外交换共享的更新与管理机制的保证,能够确保持久的生命力,依靠数据海中心统一负责民政对内、对外两条线的信息提供服务。民政业务数据海平台持续在急、难、热点民政业务建立若干适用的数据模型,通过数据价值分析搭建信息化应用,找出当前民政部门工作的业务问题、服务缺陷和可能的业务创新点,进一步改进工作。从而实现业务数据价值的应用,从信息整合共享层次向业务协同层次迈进,实现数据海信息化成果反补业务,全方位提升民政业务经办和公共服务水平,促进电子政务的进一步发展。

本文由上海市民政局科研课题项目支持,特感谢。

参考文献:

[1] 陈国清.基于Hadoop民政大数据云架构设计与实现[J].福建电脑. 2017.33(03):111-113.

[2] 周天琦.基于民政大数据的动态数据中心构建[J].软件导刊.2016. 15(01):141-143.

[3] 费贤举,王树锋,王文.一种海量大数据云存储系统框架设计[J].常州工学院学报. 2014(03):38-42.

[4] 陈世敏.大数据分析与高速数据更新.计算机研究与发展[J]. 2015(02):333-342.

[5] 张楠.公共衍生大数据分析与政府决策过程重构:理论演进与研究展望.中国行政管理[J].2015(10):19-24.

作者简介:

徐佩,上海理工大学管理学院;黄爱国,上海市民政局信息研究中心主任、高级工程师;陈震,上海市民政局信息研究中心副主任;熊红林,上海理工大学管理学院博士研究生;沈俭,上海市民政局信息研究中心技术部主任、高级工程师;樊重俊,上海理工大学教授、博士生导师。

猜你喜欢
电子政务大数据
基于大数据背景下的智慧城市建设研究
中国电子政务的“短板”
我国县域电子政务工作的困境
试论基于Petri网的电子政务系统
信城通:与中国电子政务共同成长