刘绍培
(广东电网公司佛山高明供电局更合供电所,528522)
由于电力行业涉及到的领域非常广,因此其信息化建设的起步比其他行业要早,经过这么多年的共同努力,现在已基本实现了处理业务及日常管理的自动化目标,不同层次的领导及管理人员也能够第一时间掌握用电营业的销售情况,在很大程度上提高了日常工作及管理效率,其涉及到的系统主要有:电力营销管理信息系统、负荷管理系统、客户服务系统、自动抄表系统等等。这些主要的运行系统被统称为事务处理系统(OLTP),其主要进行的是对业务数据进行查询及修改等日常操作,这些工作为电力企业提供了进行决策支持时所需要的数据信息。
上述系统在建立伊始时,其主要依据是各自的业务需求,主要目的是为了满足业务操作的规范性、快速性以及及时性,但该系统也在统一标准接口规范处存在一定的问题,其主要表现为:第一、不同功能的应用系统,所使用的开发工具也各不相同,由于各个专业部门的数据都是以分散的形式存在于数据库中的,因此整体系统之间缺乏整合性,都是独立形式存在的,同时对那些不同专业不同时期的数据缺乏集中存放及管理的手段,这样就阻碍了进一步加工、分析和利用数据等工作的开展。第二、不同应用系统之间的格式各不相同,缺乏一致性的同时数据存在冗余性。此系统在单独使用时不会出现问题,然而一旦将不同时期不同部门之间的数据集中在一起时,就会出现所需数据并不齐全、不一致或者重复出现等问题。第三、这些大量的数据信息得不到充分的开发和利用,单个专业部门只是将本部门本专业内的数据汇总从而形成具有单一性、静态性的统计报表,然而这些数据基本都是以零散形式存在的,仅是较浅层次的统计,不成体统,缺少深入性的分析、提炼以及挖掘等,能够提供出的数据相当有限。总而言之,目前电力部门面临的一个严峻问题就是缺乏一套科学有效的数据整合管理系统,因此电力部门应对原有系统进行深入的研究,使各个独立系统实现对数据进行统一的组织和分析,并在数量巨大的数据中开发出有用的数据,将这些数据转换成有利于企业的信息之后,再将这些知识转化为真正可利用的知识,从而为企业领导提供有效的决策支持,使之成为电力企业的一个重要课题。
想要成功的建立一个基于数据仓库的电力营销决策支持系统,第一步所要做的就是以业务的需求为依据选择一个适宜的数据库管理系统作为开发系统的基础要素。这不仅能够决定所使用的数据库工具,也会对整个系统的性能及扩展起到决定性作用。这里主要介绍的Oracle数据库系统。该系统是一个大型的商业数据库系统,其主要特点有以下几点:第一、Oracle服务系统是一个真正以上的拥有多进程的数据库引擎,其可以很好的对不同的可执行程序进行加载从而来完成不同的任务。由于该系统对硬件的要求相对较高,因此可以在拥有多种处理机结构的情况下较好的完成任务。第二、该系统具有良好的移植性。该系统在不同硬件平台及操作系统中都可以运行良好,例如在大型的IBM机上,小型的DEC、HP以及各种PC机上都可以运行,对于市面上流行的各种主流操作系统都支持。第三、该系统可实现数据网络集中化,支持不同并发用户。以目前的形式看,Oracle系统是很稳定的,本身的优势更是高于其他产品。因此说,Oracle系统能够更好的满足营销管理信息系统在性能和开发等方面的要求。
决策支持系统进行分析处理应用系统的基础就是数据仓库,其所储存的都是分析型的数据。将一些历史数据储存在数据仓库中,再利用数据抽取程序将这些数据以拷贝或过滤的形式从联机事务处理系统中抽取出来,也可以对联机事务处理系统的数据进行变换或统计。一个典型的数据仓库系统组成如图表所示:
左边一层作为数据层,其主要包括数据的抽取、加载、转换、存储以及管理等功能,这也就是通常大家所说的数据仓库层;中间部分作为服务层存在,主要包括报表服务、数据挖掘服务等;靠右部分为展现层,这一部分也是直接面对用户的一层,这里主要是通过不同形式将数据表现出来,以便对数据进行更好的展现、分析、挖掘等工作。
第一、概念模型的设计。在原有数据库的基础上建立了一个比较稳定的概念模型。其所需要完成的工作主要是:对系统边界加以界定,以此确定主题域及内容。因此在设计电力营销数据仓库概念模型时要以主题域内的公共键码为分析基础,联系属性组,再对原有业务系统中的数据进行分析、组织、分布等,从而形成完成的关于主题域的概念模型。
第二、对当前任何一个要装载的主题逻辑进行定义,并把相关内容记录在原有数据中,其包含的内容有:划分粒度,对数据进行合理的分割策略,对表进行的适当划分,适宜的定义数据来源等等。在进行设计逻辑模型时,应注意以下几点工作:首先、通过对主题域的分析来确定所要装载的主题。在设计数据仓库时,通常都是一次性一个主题或者一次性多个主题来循序渐进的完成。因此,在分析概念模型中的基本主题域时,首先要选择将要实施的主题域。其次、确定粒度层次的划分。是否适当的对粒度层次进行划分是决定数据仓库中数据量和查询类型的关键。一般情况下,我们都是采取估算数据的方式进行层次划分的。
第三、选择数据分割策略。在进行这一步骤时,我们首先要考虑的因素就是数据量、实际处理数据的情况、简便的划分策略等。是否采取数据分割以及怎样进行数据分割的决定性因素就是数据量的大小,而对数据进行分析处理的要求则是选择数据分割标准的主要依据。
第四、关系模式。在电力营销决策支持系统中采取的数据库,不管是主题还是主题之间的关联,都是利用关系来表示的。数据仓库主题的逻辑实现就是不同主题之间所表现出来的关系模式的定义。例如:售电量分析主题的模式,其中心为实际表,其中包含了售电量所涉及到的各种售电量、收入、优惠电量等指标。
在设计数据库的理论中,逻辑设计显然是为了掌握数据和建立数据逻辑结构而进行的,而物理设计的目的则是为了业务的实现以及性能的提高。二者之间很多时候会以两种矛盾形式存,其一是数据库模式统一化方面的矛盾,其二是数据在存取性能上的矛盾。数据库的概念设计体现的是统一过程,遵循统一设计容易理解,容易维护原则,同时这种方式所需的代价也相对较高;而物理设计则体现的是分散理念,利用分散设计将多余的或者对一张表进行拆分,这样虽然在很大程度上提高了性能,但却加剧了数据不统一的危险,同时所需的成本也提高了很多。在这里需要注意的是:想要建立非归一化必须以对通盘的了解为基础,而且必须将提高性能作为实现目标,并在归一化的基础上实施,并不是一个漫无目的、杂乱无章的非归一化。进行非归一化的主要手段有:增加非源数据列、合理拆分与合并表、增加冗余字段等。
数据仓库系统并不是一个现成的商品而是一种解决问题的过程。数据仓库以现有的营销管理系统中的原始数据为基础,首先按照电力企业的主题要求建立基本数据层,而后按照综合决策的要求建立数据层。在时间推移的过程中,当前的基本数据层就会转变成历史数据层。在进行数据仓库开发的具体流程主要有以下几个步骤:
第一、准备启动工程。在开发之前一定要做好工程计划及工程目标,工程计划主要涉及到数据的范围、技术设备、提供者、对组员进行培训、明确责任、开发所用的资源以及技能、方式方法以及工程跟踪等详细的进度等。
第二、建立稳定的技术环境。在工程实施之前一定要选择好工程所需要的软件及硬件资源,其主要包含:网络通信、开发工具、开发所需的平台、中断访问工具等,并在此基础上建立服务水平目标。
第三、对数据主题的确立。根据决策需求来确立主题,在选择好数据源后进行逻辑结构设计。
第四、数据仓库中的数据库。以电力企业的需求为基础,重点进行主题开发,对数据仓库中的数据进行物理结构储存。
第五、数据的转换程序。对源系统中的数据进行抽取、清理、统一性格式化、装载以及综合分析等过程的设计以及重新编码。
第六、对元数据的管理。关键字、数据描述、物理结构、综合算法、安全要求等都是元数据,对这些数据进行表示及定义就是管理元数据。
第七、数据分析工具的选用以及数据仓库环境。经常使用到的分析工具有统计分析工具、数据挖掘工具、优化查询工具等,利用这些工具可以对数据进行分析从而实现对决策进行支持的目的;电力营销数据仓库系统也需要定期的进行数据更新,确保系统的工作环境,使系统一直处于正常运行状态。
电力营销的现状以及发展趋势决定了在系统组建过程中必须以促进业务流程,规范内部管理机制、创新营销理念为目的。该系统负责处理营销业务信息以及客户信息,并根据多方面的信息,对营销绩效、能力、效果、管理状态、市场情况以及工作质量等进行全面的分析,对当前电力市场的营销状况做到及时、准确、全面的掌握,在主题不同的数据基础上,建立优化模型,做成正确的、适时的营销决策。
电力营销系统一直在完善,将决策支持系统理论、数据仓库技术、数据挖掘技术三者同电力市场理论有机的结合到一起,对于研究电力营销决策支持系统有着重要的意义,从而可以更好的帮助决策者在复杂的环境下制定出最合理最科学的营销决策,从而促进电力企业的可持续发展和社会效益的实现。与此同时,这也是一项艰巨而长期的工作,我们必须在前进中创新,在创新中前进,只有这样才能真正的实现智能化决策支持。
[1]林希.基于数据仓库的用电营销决策支持系统[J].闽江学院学报,2013,01:37-39.
[2]刘全.基于数据仓库决策支持系统的研究与开发[J].物流工程与管理,2013,04:108-109.
[3]高倩颖,金玉.数据仓库在电力营销系统中的应用[J].中国高新技术企业,2013,14:41-42.
[4]洪冰.数据仓库技术在电力营销决策支持系统的应用[J].电工技术,2007,09:15-16.