面向大数据的廉政防控平台研究

2018-06-04 03:42刘扬国网天津市电力公司东丽供电分公司杨鹏杨青陈艳龙国网天津市电力公司信息通信公司
数码世界 2018年5期
关键词:廉政聚类预警

刘扬 国网天津市电力公司东丽供电分公司 杨鹏 杨青 陈艳龙国网天津市电力公司信息通信公司

引言:党风廉政建设一靠教育、二靠监督、三靠法制。加强廉政监督、健全制约约束机制是搞好党风廉政建设的重要一环,现阶段廉政防控的主要手段是通过定期教育、不定期抽检、群众反馈等。由于廉政监督力量有限,日常工作中暴露出廉政防控范围有限、监督内容针对性不强、重点事项监督保障缺乏协作配合。这些问题直接导致监督合力无法有效形成,有的部门没有充分发挥专业监督的主体职能,对公司协同监督作用没有充分发挥。

为解决目前在廉政防控方面暴露的问题,整合廉政监督力量,突出问题导向,增强监督工作及时性、针对性和有效性,不断提升公司管控效能和廉政风险防范能力,建设“面向大数据的廉政防控平台”成为重要手段。该平台有效融合各专业系统的信息,将实时数据流和历史数据相结合,利用数据分析模型进行实时计算,形成以数据为驱动,以深度挖掘和预测为目标的实时监控体系[1]。

通过对现有各种业务数据进行分析,找出党风廉政建设责任制执行过程中风险点。重点围绕有关权力运行中的重要环节,设置“信息化预警监督”功能,及时捕捉权力运行“非常态”信息。对于试图逾越规章制度操作的行为系统会自动预警并终止操作进程,有效促进了监督工作由事后监督向即时监督、被动监督向主动监督、局部监督向全程监督转变。

1 技术架构

该平台的技术架构完全遵循J2EE技术体系,使用目前较流行的SSH集成框架,以帮助开发人员在短期内搭建结构清晰、可复用性好、维护方便的Web应用程序。其中使用Struts作为系统的整体基础架构,负责MVC的分离,在Struts框架的模型部分,控制业务跳转;利用Hibernate框架对持久层提供支持,实现Java类与数据库之间的转换和访问;Spring做管理,管理struts和hibernate。

该平台采用组件化、动态化的软件技术,利用一致的可共享的数据模型,按照界面控制层、业务逻辑层、数据层实现多层技术体系设计[2],实现各接口组件能够在企业内的协同工作、各层次上集成,实现重用,以满足全公司范围内各职能层次考核业务的需求,为内部业务和管理人员提供技术先进的工作平台和灵活的业务构造能力。

图1 平台架构图Fig.1 Platform Architecture Diagram

该平台以元数据层为基础,容纳了分散在各个业务系统中的数据,通过元数据处理层提供的大数据处理技术,实现对数据的抽取、校验、治理等,形成中心数据层的数据,为平台分析提供稳定的数据源。基础组件由一系列服务组成,主要完成基础功能的服务,与业务模块没有关系,通过其接口完成其数据服务的持久化,该层也是调用基础设施的入口,其余各层禁止使用基础设施提供的接口。业务逻辑层只关心业务逻辑,通调用基础组件提供的服务完成业务逻辑的整合,本项目用JavaBean来实现业务逻辑层功能。展现层主要完成用户交互功能。数据的展示主要使用JSP生成HTML页面,一些特殊的操作和页面效果通过Java Script完成,用CSS来规范页面样式。向服务器提交的数据提交到后台的Action类进行处理,部分功能通过AJAX方式提交以提高用户界面友好性。

2 应用架构

该平台横向集成各个业务系统,其中涉及众多数据抽取[3]工作,主要完成基于大数据分析的廉政风险防控管理,主要包括:基础管理、数据处理、统计汇总、预警处理、对比排名等五大功能模块。

图2 应用架构图Fig.2 Application Architecture Diagram

3 核心技术

3.1 风险指数

该平台第一次引入了风险指数的概念,评价一个预警周期内风险点风险程度的度量值,预警周期主要为月度、季度;风险点层级定义为风险防控大类(五防)、风险点、监测点、监测指标(风险指标)四个层级;风险指数越大表示风险程度越高;通过设定风险指数的额定值划分预警阈值,依据防控手册,通过黄色、红色两个预警区来确定一个单位的廉政风险程度。

图3 风险指标层级Fig.3 Risk index hierarchy

对风险防控大类、监测指标、检测点、风险点,按照一定的数据归集算法[4],逐级归集,并按照检测周期及各种口径进行全方位的汇总,形成各类数据台帐。由于各类业务数据的格式不同,业务系统流程中的关键和风险节点也有较大区别,利用灵活分析指标定义,通过统一的归集规则定义,实现统一的分析逻辑[5-6],达到对业务数据的无限扩展和延升。

3.2 差异化分析模型

对于数据的意义不完全明确,异常判定规则不明晰的情况,完全通过数学分析的办法,分析数据的内在规律来判断疑似异常数据,一方面为纪检工作提供有益的参考;另一方面可以为我们寻找明晰的判定规则提供帮助。

该分析模型[7-8]以客观的原始数据列为输入点,通过各种算法的综合分析,形成数据的差异化分组,通过与业务逻辑的结合,发现其廉政风险。

该模型集成了以下算法:

1)变异系数(CV)算法

通过引入变异系数,分析数据之间的差异率,从而发现可能存在的廉政隐患,具体算法如下:

a. 假设一组数据xi( i为1到n的正整数)

b. 计算平均值 m

c. 计算方差 s2

d. 计算标准差(即方差的算术平方根)

e. 计算变异系数 CV

2)正态分布

图4 标准正态分布曲线Fig.4 Standard Normal Curve

d. 计算标准差见公式(3)

e. 计算分位值:

f. 若满足个,且满足的数有n0.68个,则表示满足正态分布,其分位点为;否则,不满足正态分布。

3)K均值算法

a. 初始化

输入为N个升序排列的样本,记为D1,D2,…Dn;

K = 5;即设定五个聚类中心[9]。

b. 迭代

从样本中依次选取样本Di,分别计算和每个聚类中心的距离,并把样本重新归入距离最小的聚类中心中;

重新计算各聚类的中心向量;

重复前两步直至样本全部取完;

保存当前迭代的各聚类中心向量值;

返回第一步,开始下一次迭代;

比较本次迭代后各聚类中心向量值和上次迭代的相应向量值,如果全部相等,则算法收敛,迭代结束;如果不完全相等,则继续迭代。

c. 返回

返回所有样本的聚类编号。

4 结束语

面向大数据的廉政防控平台主要是利用网络信息技术实时采集主要业务系统的数据信息,通过分析业务系统流程[10]中的关键和风险节点,设置预警规则。当出现可能存在的违规违纪行为时,系统会自动发出警告,提醒相关部门和监察机关进行处理,进而进行预警。

预警主要有三个特点。实时预警,即风险参数事先预定,预警数据定时提示,异常情况及时处置;在采集数据的基础上,系统对业务行为实现自动监控,并及时发现问题,实现事先、事中提醒相关部门和人员;主动预警,即通过对主要业务进行全面分析,设定预警规则,主动发现问题,实现由被动监督向主动监督的转变;个体预警与整体防控相结合,即预警信息产生后,系统会根据情况的不同进行反馈。既对个人违纪违规情况进行监督预警,又通过对个体问题的剖析,发现倾向性、苗头性问题,对反腐倡廉形势作出判断,从整体上进行警示提醒。

[1]贾楠,李冬,周强.基于“五位一体”的信息运维标准化作业构建[J]。电力信息与通信技术.2015,13(10):104-107.

JIA Nan,LI Dong,ZHOU Qiang.Construction of information operation and maintenance standardized workflow with the “five-in-one”mode[J].Electric Power Information and Communication Technology.2015,13(10):104-107.

[2]王德文.基于云计算的电力数据中心基础架构及其关键技术[J].电力系统自动化.2012.36(11):67-71.

WANG De-wen,Basic framework and key technology for a new generation of data center in elrctric power corporation based on cloud computation[J]. Automation of Electric Power System. 2012.36(11):67-71.

[3]杨正洪.智慧城市:大数据、物联网和云计算之应用[M].北京:清华大学出版社.2014.

[4]张冰.面向服务的电子商务平台集中运维管理实践[J].电力信息与通信技术,2015,13(9):116-119.

Zhang Bing.Practice op centralized operation and maintenance management of service-oriented electronic commerce platform[J].Electric Power Information and Communication Technology,2015,13(9):116-119.

[5]维克托。麦克-舍恩伯格, 肯尼思。库克耶, 大数据时代[M]. 盛杨燕,周涛,译. 浙江:浙江人民出版社,2013.

[6]REEVE A.数据集成的技术、方法与最佳实践[M]。北京:机械工业出版社,2014.

[7]徐尚英. 面向用户个性化需求的网络服务智能发现方法研究[D].武汉理工大学,2014.

[8]曹国威,杨明博,张德华,等. 能源互联网:信息和能源的基础设施一体化[J]. 南方电网技术. 2014,8(4):1-10.

Cao jun-wei,Yang ming-bo,Zhang,de-hua,et al.Energy internet:an infrastructure for cyber-energy integration[J].Southern Power System Technology. 2014,8(4):1-10.

[9]罗军舟,金嘉晖,宋爱波,等. 云计算:体系架构与关键技术[J]. 通信学报,2011,32(7):18-21.

LUO Jun-zhou,JIN Jia-hui,SONG Ai-bo,et al.Cloud computing:architecture and key technologies[J].Journal on Communications, 2011,32(7):18-21.

[10]王磊.微服务架构与实践[M].北京:电子工业出版社, 2015:13-38

猜你喜欢
廉政聚类预警
一种傅里叶域海量数据高速谱聚类方法
廉政教育走“新”更走“心”
预警型智能包装在食品安全中的应用和设计
党的廉政思想“听得懂”
超级秀场 大风预警
传统家训里的廉政观
面向WSN的聚类头选举与维护协议的研究综述
改进K均值聚类算法
基于Spark平台的K-means聚类算法改进及并行化实现
我省试行重大节假日廉政短信提醒制度