数据挖掘技术在智慧矿区建设中的应用

2015-03-15 05:52范之光曹爱琴
中国管理信息化 2015年13期
关键词:统计表数据挖掘矿区

范之光,曹爱琴,马 杰

(华北石油通信公司,河北 任丘 062550)

1 引言

华北油田自2011年启动智慧油田建设以来,作为智慧油田4大板块之一的“智慧矿区”也随之建设,确定以基本型、智能型、智慧型为3个建设阶段,逐步形成集生产运行、居民服务、社区管理、医疗健康4大功能板块为一体的智慧矿区,而随之带来的数据量越来越大。为避免造成各自的数据孤岛,数据挖掘技术顺其自然的应用到智慧矿区中。

数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中人们事先不知道的、但又是潜在有用的信息和知识的过程。通过数据挖掘,可以充分利用所采集到的信息。与传统方法相比,数据挖掘具有能够处理更大规模数据,即时查询,准确提出预测等优点[1]。

2 建设思路

智慧矿区是矿区管理的一种新理念,是新形势下社会管理创新的一种新模式。华北油田为方便矿区居民缴纳水电讯等公共事业的费用、居民健康咨询、客服管理等建立华北油田社区居民服务平台,提供矿区综合服务。

居民信息、便民热线、缴费数据、医疗服务、社区安防等等信息,产生大量并发数据,但由于上述应用的数据信息分属于不同业务部门的数据库,在数据采集点、数据标准等方面存在差异,因而无法实现数据共享和复杂应用,不仅数据冗余程度高,同时数据连续性和综合决策支持能力也比较差,使用效率低。从上述角度出发,以存储格式的统一、规则和标准的统一、流程和算法的统一、管理平台的统一为建设思路,建立统一、集成的信息系统平台。

基于上述对数据挖掘的应用,构建即席查询、智能报表、多维分析、元数据管理、数据质量监控、数据集成等模块,以及数据确认、数据反馈两个回路的数据管理分析平台。

3 数据挖掘的设计应用

数据挖掘主要功能是从数据库中获取有意义的信息以及对数据归纳出有用的结构,作为制定决策的重要依据。数据挖掘模块采用模块化及组件化的设计理念,采用多种设计模式,充分利用高性能的各种数据挖掘算法、数据过滤器、数据文本及可视化的输出方式,形成了更高效率挖掘大型数据库及更高维数数据库中潜在、隐含的各种关系及知识,为决策者提供了良好的数据支持[2]。

对于挖掘的应用,数据的最基本形式是数据库数据、数据仓库数据和事务数据。智慧矿区平台关注的是每一个数据记录,也就是事务数据。一般来说,事务数据库的每个记录代表一个事务,如顾客的一次购物、一次预约医疗服务,或者一个用户的网页点击、一项客服热线服务。通常,一个事务包含一个唯一的事务标识号,以及一个组成事务的项的列表[3]。这些数据的频繁挖掘,感知矿区运行的各项体征数据,管理者会发现数据之间的关联,分析数据因素,对数据进行历史、现状的综合挖掘分析,从中发现客观规律,较为准确地预测未来,提前发出预警信息,使当前决策和未来决策更有科学依据。

3.1 数据挖掘功能设计

数据挖掘通过对数据库、数据仓库和事务数据中的记录数据按照一定的规则进行信息开采、挖掘和分析,从中识别和抽取出潜在的规律和有用知识,并以此为管理者提供决策依据。数据挖掘主要以海量数据库、支持数据集成与处理的数据仓库为基础,实现了数据预处理、聚类分析、关联分析、分类及预测,属性评估及数据可视化的数据挖掘技术。

3.2 数据挖掘功能应用

在基础共享数据和不同业务协同数据的基础上,需要通过数据管理分析平台对不同业务数据进行抽取转换、清洗、加载到中心数据库,并进行数据应用,根据相关业务主题和业务模型,形成专题业务数据库,进行可以受理缴费明细查询、交易趋势分析、数据统筹分析、季度报表分析等的缴费报表。

3.2.1 缴费日报表一:各个业务单位统计表

各个业务单位统计表为统计华北油田社区服务系统接入的所有业务单位当天缴费情况信息,按照统计时间统计缴费总额,报表示例如表1所示:

表1 事业单位缴费统计表

各个业务单位缴费报表:

(1)可以更加方便查看社区服务系统所接入的所有业务单位缴费情况,直观地反映各个业务单位每天的交易量及交易金额;

(2)同时可以根据每天交易量统计出每个业务单位缴费走势,方便记录用户在该业务系统缴费时的高峰及低谷时段;

(3)当我们需要查询某一天的交易情况时,不需再去查询数据库计算缴费金额,使用该报表即可准确、快捷地查出交易信息;

(4)在与各个业务单位对账、划账时,该报表数据也可作为验证统计出的对账金额、划账金额正确性的依据。

3.2.2 缴费日报表二:缴费银行统计表

银行统计表为统计当天用户使用不同网上银行缴费时的缴费情况按照缴费周期汇总欠费信息报表,报表示例如表2所示:

表2 缴费银行统计表

统计缴费银行统计表:

(1)可以更加方便查看社区服务系统所接入的所有银行的交易情况,直观地反映各个银行每天的交易量及交易金额;

(2)该表中所统计的总比数、总金额明确反映了本日社区服务系统总共的交易量及金额,不需人工再去计算;

(3)根据每天交易情况,更直观地展现市民更喜欢使用哪种缴费方式来缴费,哪种方式交易量少,才能更好地优化系统。

4 数据挖掘安全机制

智慧矿区平台每天都要对大量的数据进行挖掘处理,数据的完整性和安全性对整个系统正常运行至关重要,对数据空间的规划、使用、清理、备份是实现数据完整性和安全性的主要途径。数据安全机制——数据备份是指将数据以某种方式加以保留,以便在系统遭受破坏或其他特定情况下,重新加以利用的一个过程。

业务系统实时保护。智慧矿区平台是以Web方式发布,所有数据实现内网和外网双层保护,当内网Web服务器出现故障后,外网Web服务器将实现接管业务系统,保证业务系统正常运行。为了保证内外网服务器的数据能顺利接管,实现业务级别的保护,对内外网服务器应用系统实现准实时数据的复制和交互。同时对重要配置文件及业务数据进行备份。

平台内原始数据、业务参数数据、系统参数数据、清单数据、统计数据、账务数据、错单数据等不同类型的数据其访问频度、管理要求不同,平台建设有完整的应对策略;备份功能既要保证系统数据的完整性,又要保证系统在资源使用方面的高效率。对判断过期的数据应进行准确的清理和完整的备份。

5 结语

数据挖掘技术改变了数据的地位,使各种数据从一种 “间接”辅助的手段转化为“直接”主要的方法。智慧矿区平台建设基于云计算、物联网和信息集成技术,结合数据挖掘技术,使居民信息、便民热线、缴费数据、医疗服务、社区安防等数据可以直接指导矿区服务整体职能。智慧矿区的整体构建加强和谐矿区的建设和管理、完善矿区功能、提升矿区服务水平,使矿区居民能够感受到科技的发展,有数字信息化与智能化的生活体验,拥有一个安全、舒适、温馨和便利的易居环境。

同时,数据挖掘技术可以辅助管理者监测平台状态、提高系统性能、隔离软件错误、分析平台缺陷、发现网路入侵和识别系统故障,让智慧矿区平台更好地服务于管理者及矿区居民。

[1] 陈玉涛.数据挖掘技术在油田企业生产中的应用[J].油气田地面工程,2014,33(4):53-54.

[2] 芦丹丹.面向社区智能服务的数据挖掘关键技术研究与实现[D].西安:西安电子科技大学,2013:41.

[3] Han J W,Kamber M,PEI J.数据挖掘:概念与技术[M].范明,孟小峰,译.第 3 版.北京: 机械工业出版社,2014:6-9.

猜你喜欢
统计表数据挖掘矿区
2020年部分在晋提前批招生院校录取统计表
探讨人工智能与数据挖掘发展趋势
加纳Amanforom矿区Ⅲ号隐伏金矿带的发现与评价
加纳Amanforom矿区Ⅲ号隐伏金矿带的发现与评价
湖北省保康县堰边上矿区发现超大型磷矿
广东省蕉岭县作壁坑矿区探明超大型铷矿
2019年提前批部分院校在晋招生录取统计表
神奇的统计表
上榜派出所统计表
基于并行计算的大数据挖掘在电网中的应用