基于智能信息流的智能报表分析系统研究

2023-01-30 13:11:28蔡金华张会军
中国农村水利水电 2023年1期
关键词:商业智能信息流报表

孙 卫,蔡金华,王 珩,钟 智,张会军,高 元

(1.华能澜沧江水电股份有限公司,云南 昆明 650214;2.南京南瑞继保工程技术有限公司,江苏 南京 211002;3.西安热工研究院有限公司,陕西 西安 710054)

0 引言

数据中心的客户越来越多,所涉及的过程也越来越多,范围也越来越广,报表数据具有广泛的、分散的、利用率低的特点,容易造成数据浪费。这样的环境下,每天报表的工作就变得耗时又费力。随着客户规模不断扩大,报表数据上报也因为机构层级变多而出现严重的报表延迟现象,与此同时,针对上一级决策部门的管理,受到复杂报表信息影响,无法为企业提供详细依据。而且,受到不同部门报表不一致工作统计口径影响,针对相同部分的报表填写工作,会出现填报信息重复输入的问题[1]。因此,设计一个分析系统来分析报表是非常必要的。杨志等[2]提出的电力数据报表模型,通过使用智能化生成技术,可将报表分为数据报表和属性报表两种形式,基于此,构造智能报表分析模型,并从报表动态分析角度分析模型可塑性,实现报表数据的交互共享;肖美玲[3]提出的基于纳税评估视角的财务报表分析方法,从税收评价的角度出发,构建一种基于税收理论的财务报表案例分析模型,并将其引入到财务报表分析系统中,确定了企业风险管理分析指标。然而,上述这两种方法很难实现信息的共享、相互集成和互操作,造成报表分析的效率低下。为此,本文提出了基于智能信息流的智能报表分析系统研究。

1 系统硬件结构设计

基于智能信息流的智能报表分析系统,基本框架结构如图1 所示。由图1 可知,体系结构主要分为三大部分,第一部分是接口的设计。用户通过接口界面,可以实现登录、管理用户日志、用户权限、连接数据库等操作;第二部分是报表展现。其主要包括操作日志的控制、用户所需数据源的获取、数据权限的控制,报表展现还具有行列变换、自动列扩展、报表钻取等功能;第三部分是报表的配置,该部分是决定报表质量高低的关键部分。其中包含报表条件、辅助功能、页面布局等信息,报表的实现界面部分与外部权限系统形成了完整的信息集成界面。报表配置特性是基础配置信息,使用统一的API,方便管理。

图1 基于智能信息流的智能报表分析系统基本框架结构Fig.1 Basic framework of intelligent report analysis system based on intelligent information flow

1.1 基于BI商业智能信息流的报表分析工具结构

以BI 为基础的报表工具将商业智能系统和报表系统完美地结合起来,提高了处理大量信息的工作效率。图2 中显示了基于 BI商业智能信息流的报表分析工具结构。

由图2 可知,商业智能平台的监控模块实时监控用户的请求,当监控到请求时,查看请求的具体内容,该内容通常包含需求和数据,然后将请求内容提交给数据处理模块,再由数据处理模块对请求数据进行分析与处理。将处理结果传递给备份模块,在备份的同时对请求的数据进行分析,并传送到报表显示部分,为用户提供所需的数据。该工具主要负责完成对报表的需求分析,并将分析结果传递到数据需求部分,该部分使用商业智能统计模块,统计后将结果返回报告系统予以显示。

图2 基于BI商业智能信息流的报表分析工具结构Fig.2 Report analysis tool structure based on BI business intelligence information flow

1.2 决策子系统

决策子系统采用基于数理统计的数学方法对运维工单的处理进行分析,并由此确定某一道工序工单处理效率以及详细步骤。运用BI技术,对运维管理过程的时效性行为进行了深入分析,以帮助决策者根据市场信息制定业务策略。根据特定的操作和人员情况,协助数据中心做出适当的决策,以提高运营管理效率。

1.3 系统数据库设计

数据库设计包括实体设计、关系设计和标准化设计,数据结构根据每个实体的具体情况,对各实体描述的不同字段进行识别和定义。通过对系统功能和未来使用情况的分析,确定各个实体的类型、长度等字段信息。在设计每个库表时,需要考虑需求中无法识别和定义的字段,例如记录ID 号、创建时间和最近的更新时间。每个实体并不是独立存在的,必须或多或少地与其他实体相关。对应用系统中大量的数据处理,通过编写大量的存储过程来实现数据的采集和操作,可以很好地改善数据库的性能,从而提高应用系统的整体性能。

2 系统软件部分设计

针对报表数据处理过程中出现的复杂问题,采用 BI技术作为处理工具,能够对数据库进行联机分析、数据挖掘、数据处理等步骤,并从不同的数据源中提取数据,对这些数据进行抽取、清洗、整理、归集,以保证数据的有效性[4]。数据转换和重构操作后,在数据库中存储数据,同时利用管理分析工具及时处理数据,将系统中已有的数据转化成决策信息,为企业决策提供智能决策工具。

2.1 基于BI商业智能信息流的报表数据整合与导入

以商业系统统计为基础,通过对“数据、信息、知识、行为、利益”的处理过程,将 BI 商业智能处理技术的信息整合为有序的信息。图3 显示了基于BI 商业智能信息流的报表数据整合过程。

由图3 可知,将商业智能系统的工作流程进行技术抽象处理,实现了智能化信息流报表数据的整合。整合过程是对不同来源数据进行统一采集、整理、清洗和转换的,能够为用户提供统一视觉界面。在对数据进行整合之后,通过数据集成与共享,将一个数据源和另一个源的数据匹配起来,并直接写到数据库中。

图3 基于BI商业智能信息流的报表数据整合过程Fig.3 Report data integration process based on BI business intelligence information flow

整合数据后进行数据导入,通过数据网格平台在导入模块导入数据时,需要进行数据导入控制。由于每个网格平台导入的数据可能有所不同,所以需要一些基本的导入数据作为引流,及时剔除不需要导入的数据,避免出现数据重复导入现象出现[5]。

通过使用 XML 技术,网格平台很容易地控制这些信息,为了控制导入的网格节点数据,系统管理员可以方便地编辑 XML文件来控制信息元数据。网格数据导入时序,如图4所示。

图4 数据导入时序Fig.4 Data import timing

从图4 中可以看出,数据导入时序包括用户、网格数据导入、网格资源创建和用户方位控制四个部分,对这四个部分的网格平台导入数据详细过程为:

步骤一:用户首先选择导入数据,然后再进行数据导入;

步骤二:将用户请求发送到导入模块后,向网格资源创建模块发送访问请求;

步骤三:通过用户访问控制模块获得输入数据的权限,通过访问网格资源列表得到需要导入网格平台的节点信息元数据;

步骤四:在收到网格平台节点资源信息后,访问网格数据请求模块,获取网格节点信息;

步骤五:收到数据导入请求后,网格资源创建模块为用户创建一个多线程更新数据库实例,然后为每个网格节点创建数据请求实例,通过调用数据请求实例,将各个网格节点的必要信息导入到中心备份服务器;

步骤六:所有导入中心备份服务器的信息,都需通过网格数据格式转换模块转换为统一格式;

步骤七:数据导入过程中,网格数据导入模块利用数据导入监控技术对各个网格节点的数据导入过程进行监控,让用户了解数据导入的详细过程,用户还可以在导入数据时临时添加新的网格节点来导入新的数据。

2.2 智能报表决策分析

应用 BI在线分析处理技术是一种支持复杂决策、信息管理决策的分析技术,具有多维数据结构属性,是事实数据表用于描述数据分类的有效依据。

2.2.1 报表格式迁移

对于报表信息的处理,部分数据库相对简单,不提供自定义功能,不容易更改报表的内容,也不会对报表进行简单的提取。为了解决这些问题,使用区域全面地迁移报告格式的模式,就没有必要添加更多的复杂步骤[6]。因此,设计了以下迁移途径:分析原有报表结构,获取详细报表查询SQL 语句,将所需的数据提取到报表上后,重新创建报表,并使所有数据整合到一个报表中。

基于已有系统的实际情况,生成了报告迁移的总体模型图,见图5。由图5 可知,构造报告迁移模板,在该模板中预先定义关键元素,依据该元素生成新的报表后,通过如下步骤实现报表格式迁移:载入XML 文件格式的RDL 模板文件;更新以报表形式存在的各种XML文件,在该文件中填入行或列的报告字段,并将其他相关报告存储在XML文件中。重新命名文件已经更新或修改的XML 文件,将RDL 作为主要节点(参数)的XML路径,由此迁移的报表合理性较强。

图5 报表迁移总体模型图Fig.5 Report migration overall model diagram

2.2.2 统计决策模式识别

从单元格中选取多维数据集,使与数据集相关联的每个维度信息都具有唯一的逻辑交集。对于迁移后的报表格式,需进行模式识别。基于BI 商业智能信息流的多维数据集统计决策度量值,指的是多维数据集中一列或多列数值。统计决策模式识别是智能报表决策分析的关键环节,能够为用户直接从数据库中挑选所需的数据。

统计决策模式识别的步骤如下所示:

步骤一:通过度量距离定义相似度;

步骤二:相似度指的是在同一阈值下,使统计决策模式具有一定相似性;

步骤三:将多种训练样本点组成相似区域,并由此确定各个决策子区域;

步骤四:用点距离作为样本相似度的依据,该值越小,说明两个样本越相似。相似度的度量不仅局限于距离函数,如果报表是扇形图案类,则可以将两个夹角的余弦定义为相似函数。

两矢量夹角之间余弦可表示为:

式中:a、c表示模式空间点;T表示统计决策周期。

使模式空间的3 个点作为度量样本,并对各维度进行归一化处理后,将如下距离函数作为判断条件:

结合式(2)可知,基于BI 商业智能信息流的多维数据集是由度量值、级别和组织单元组成,并不是每个单元的数据集都只包含一个数据值,没有数据值的数据集也可以有交集,即为空集。空集也经常出现在多维数据集中,对于每个交集,并非在都记录在数据库中。基于此,统计决策模式的精准识别能够智能化的分析报表。

3 案例应用

3.1 实验平台

对于基于智能信息流的智能报表分析系统研究,采用Java语言,后台使用代码语言、Eclipse 作为开发工具。通过使用工具系统自动生成的报表,具有多种不同的报表格式。实验平台的实现要求页面的改变不会影响表示层逻辑的开发,并尽可能减少嵌入页面程序的Java 代码,这样,应用程序表示层的开发、更新和维护就可以快速实现。将Servlet 和JSP 技术结合在一起,使用JSP显示内容,用Servlet处理数据来产生动态内容。

图6显示了实验平台示意图。通过图6可以看出,向Servlet控制器发送数据请求。通过Servlet 创建JSP 逻辑,该逻辑仅进行简单检索,将由Servlet 创建的构造注入预定义模板,并最终返回给用户。

图6 实验平台示意图Fig.6 Schematic diagram of experimental platform

3.2 水电厂智能报表数据模型

以水电厂为例,搭建了融合各类传感器采集数据、系统日志、监控告警等多源数据的整合分析展示,如图7所示。其中:

图7 水电厂智能报表数据模型Fig.7 Intelligent report data model of hydropower plant

(1)基础级数据通过时间维度上的汇总和统计分析,输出常量概览数据、运行日状态数据、小时状态数据、实时状态数据、原始数据等,为智能水电厂提供基于基础数据的日常运维管理支撑[7,8]。

(2)特征级数据是分析系统,对基础数据进行统计分析,提取出有规律性、时效性、和价值性的结论数据,可以反映出水电厂设备运行健康状况等。

(3)决策级数据是在基础级和特征级数据的基础上,通过故障诊断、特性辨识、设备评价、数据挖掘等方法,提取出支撑水电厂运行管理人员日常决策的关键数据。

4 结语

设计的基于智能信息流的智能报表分析系统,能够提供统一的统计口径和指标解释,使全公司数据统一,给分析人员一种启发式多维分析方法,让分析人员可以将数据进行任意组合。使用该系统打破了以往分析方法只能依靠固定报告分析的固定模式,使分析结果更容易地通过数据分析来发现数据中心运作中的问题,并使分析人员的工作更具有创造性。

猜你喜欢
商业智能信息流报表
基于信息流的作战体系网络效能仿真与优化
基于信息流的RBC系统外部通信网络故障分析
LabWindows/CVI中Excel报表技术研究
测控技术(2018年8期)2018-11-25 07:42:28
战区联合作战指挥信息流评价模型
从三大报表读懂养猪人的成绩单
什么是商业智能?它的定义和解决方案
关于实时商业智能的文献综述
消费导刊(2016年4期)2017-01-10 12:56:45
广东省高速公路联网综合信息商业智能系统
基于任务空间的体系作战信息流图构建方法
月度报表
中国纺织(2009年7期)2009-08-07 06:56:16