郭星明,祝俞刚,陈开军,何 勇
(1.浙江大学 杭州 310029;2.浙江经济职业技术学院 杭州310018)
云计算概念的提出和发展取决于两个显著的特征,一是海量数据存储的增长[1],二是挖掘分析需求的增长[2],与此相伴随,电子商务从原来的展览式、订单流,逐渐向智能化、决策化方向发展,企业大量的商务数据需要进行挖掘、分析和整理,从中发现有价值的信息,于是形成电子商务新的重要分支——商务智能系统 (business intelligence system,BIS)。商务智能系统是指利用已有的数据资源做出更好的经营决策,包括数据访问、数据和业务分析以及寻求发现新的商机[3]。在云计算和SaaS(software as a service)环境下,由于商务智能面向所有的用户需求并提供即时在线服务,其数据及各类软件服务全部在云端构建,因此它具有云计算的特征,同时商务智能是依赖于原始的海量数据提供智慧服务,又具有管理的本质特征。由于各个领域管理活动的多样性、动态性、非结构性和不确定性,管理活动需要进行本体解析与构造,形成需求制导、粒度恰当、动态重组、在线调用的管理信息本体中间件[4,5]。
商务智能本体云架构运用云计算技术,在云端进行管理信息本体需求及其中间件的设计与部署,使用户能够高效率地共享利用商务智能本体云资源,显著降低使用成本,提高开发速度。
商务智能系统雏形是基于事务的管理信息系统,后来出现了高级管理信息系统,在分析和处理综合性与复杂性问题的能力上有了进一步的提高。在管理信息系统(MIS)的基础上,又出现了决策支持系统,最终演变成商务智能系统。因此,商务智能系统是依赖于原始海量业务数据的,并对这些数据进行存储及加工处理的,可以为决策者提供智能服务的管理信息系统。它的核心仍然是数据仓库系统,需要先收集大量的数据并对其整理形成可供使用的数据,然后把这些经过预处理的数据进行加工转化成信息,形成的最终智慧产品用于指导商务实践[3]。IBM公司曾经提出过一个体系结构[6],主要有下面的几个组成部分:外部数据源、数据仓库建模和构造工具、数据管理、访问工具、决策支持工具、商务智能应用、元数据管理,相互间通过体系内的协作可以提供数据分析与管理、知识发现等功能。
众所周知,全球经济一体化格局下,商务智能系统越来越需要面向全球范围和全域视野的用户经营管理与辅助决策需求,随之而来,系统建设的硬件、网络资源耗费急剧增长,软件架构日益庞大,以知识与方法为核心的智库趋于复杂。因此,云计算技术将系统的软硬件资源全部构建于云端,使客户端实现“瘦身”,是新一代商务智能发展的重要出路。
定义1:商务云词汇U,是商务智能所涉及领域的本体知识及需求描述的集合,也称业务。
定义2:云表T,是二维关系表的集合,简称表。
定义3:云演算P,是针对云表T的谓词演算逻辑的集合,也称功能。
定义4:商务智能本体云,三元组S={U,T,P}是一个构建于云端的特殊商务智能系统,称作商务智能本体云,它由商务云词汇U、云表T及云演算P构成。
有别于一般的商务智能系统,上述定义实现了商务管理业务与功能的分离,使得多样化、动态、非结构性和不确定的商务智能管理需求可以转化为灵活的、可在线远程终端维护的、结构化的和明确的描述。
三元组S中,云表T是商务智能海量数据信息的载体,它的值域构成无限循环集合,为了有效平衡服务器载荷,云表T按照Google提出的BigTable技术进行构建[7]。
商务云词汇U是商务智能领域业务特征的直接体现,它的值域构成无限不循环集合,大量不确定的、经常变化的、模糊的甚至带有个性化的需求描述可借助本体云平台提供的制导棒进行定义与描述,本体云会在用户提交后自动调用相关构件进行必要的处理。
云演算P通过对云表T的静态描述(定义)和动态处理(执行)实现商务智能领域的本体需求,根据二元关系的定义,它是一个基于二元关系操作的有限集合,商务智能任何综合性和复杂性较高的问题都可以通过云演算序列加以处理和解决。
商务智能本体云是构建在云端的,它符合一般云计算的基本特征,由底层基础设计、中间件平台和前台软件调用几个层次组成,体现了基础设计即服务(IaaS)、平台即服务(PaaS)及软件即服务(SaaS)的思想。其总体架构见图1。
商务智能本体云要实现商业用途,需要云端的部署环境和落地应用的途径,在海量集群服务器、高速网络宽带及数据库的支撑下,本体云可以实现高效地运转,从而为全球的终端用户提供全方位的商务智能服务。
在商务智能本体云中,云表T是经过抽象的关于表的集合,在任何一个数据库环境里,云表按照BigTable框架进行多层次布局,其架构见图2。
从图2可见,环境字典相当于BigTable框架中的chubby,它存储着整个主数据资源的位置信息,业务元数据字典相当于root table,是商务智能本体云的第一个表,存储着所有表格元数据文件及其数据文件的位置信息,且不会被分割,表格元数据字典及其云演算元数据字典相当于metadata table,存储着众多数据文件的位置信息、格式信息及逻辑加工信息,而数据文件就相当于BigTable框架中的user table。当读取数据时,需先从业务元数据字典中读取表格元数据字典的位置信息,然后逐层往下读取,直至找到所需数据为止。实际使用中,为了平衡服务器的资源负荷,还会进行临时表的连接和回收。
云演算P将各个领域的商务智能处理逻辑归纳为有限的、可趋向饱和的功能集合,包括表的创建、描述、录入、打印、赋值、求和、排序、增删等,见表1。
从表1可见,其云演算命令与管理信息需求的描述能够一一对应,存在着直接的映射关系,在实际使用中,可以像自然语言一样,与云表T、云词汇U相匹配,反复使用,并被系统调用执行,这样就达到了用户需求驱动机制下的软件重用和复用。
表1 云演算命令集一览
云演算命令中,创建维护(即表的描述)命令(|M…;)是一个特殊的命令,它可以将领域的词汇加载到抽象的表上,形成符合商务智能需求的信息载体。比如,可以将2行2列的表,命名为“产品价格表”,2列的列名分别为“产品名称”、“产品价格”,诸如此类,还可以实现描述的逆运算,即将“产品价格表”逆描述为2行2列的表,其分别有第 1列、第2列、第1行、第2行。这种演算的过程,可以将用户的商务智能需求映射地转化为对表的行列的操作,具有极大的可操作性。
定义5:商务智能状态云,设有商务智能本体云S={U,T,P},称 R={U,T}奂S 为 S 的状态云。
R是S在运行过程中每一个断面的表示,除初始状态云Rs外,它一般是云演算P作用的结果。
定理1:商务智能本体云运行的过程,是一个由可重复的云演算序列 P1,P2,P3,…,Pt∈P,作用于初始状态云 Rs的过程,即用户需求结果状态云Re=P1·P2·P3·…·Pt·Rs。
证明:(用归纳法证明)
当 t=1 时,P1∈P 为录入云演算,可以实现 Re=P1·Rs;设t时已成立Re=P1·P2·P3·…·Pt·Rs;
则当 t=t+1,Pt+1∈P 为录入云演算,使得 Re=P1·P2·P3·…·Pt·Pt+1·Rs||。
这是一个很重要的定理,从状态云来看,商务智能本体需求总是从一个起始的状态云Rs,按照用户的需求,经有限步骤演算,实现了状态Rs向满足用户需求的状态云Re的转移。
云词汇是一系列具有明确领域,业务、任务或数据的描述,它是自然语言或书面语言、字母数据的集合,表2列出了一些代表的云词汇。
表2 云词汇集一览
上述云词汇可通过云演算描述云表及其商务智能处理过程,有的可用于表述表的名称,有的可用于描述表的栏目,有的可用于描述表的加工。商务智能本体云按需求制导原则响应用户的需求,用户动态、多变、模糊和不确定的商务智能需求需要在线得到响应,因此云表不仅要能够动态地建立指针链,还应为用户提供灵活的、可逐步逼近的、结构化的定义窗口,图3是基于BigTable技术的商务智能本体云云表存储结构,其中的各类云词汇是可以由用户在线定义的。
商务智能本体中间件平台已按本体云的架构进行了实证设计研究,如图4所示,总控模块构架为用户提供服务接口,它的主要功能有:
·业务与表格的登录设计;
·代码维护;
·系统容灾处理;
·日志查询;
·权限设置;
·封面设计;
·打印机设置。
其中业务与表格的登录设计能够根据用户需求的描述进行处理,用户一旦按元数据所标引完成描述,那么,就不再需要额外的系统开发工作,面向最终用户的中间件系统已自然而然地转换成一个领域的商务智能系统,实现了用户的全部需求。
除此以外,总控模块还具有在线调用表格设计、录入与检索、表格收发、代码维护、计算与校验和打印输出等其他重要的功能模块向用户提供商务智能服务。
一般认为,云计算可提供一种标准的、简化的、集中式的按需使用平台,具有自助服务、快速反应、弹性和可伸缩等特点。真正的云计算平台应该能实现以下5个特性[8]:
·以用户为中心;
·以任务为中心;
·易于访问;
·智能;
·可编程。
一个可在线调用和动态重组的商务智能本体中间件需求标引实例如图5所示。
因此,上述商务智能本体中间件平台将为商务智能本体云提供全方位的Web服务,其中业务登录、表格设计、打印、计算等模块中均设置了相应的自助服务标引,用户可以将自己的需求按标引所示逐个地输入,一般对经常变更的需求部分进行标引项设置。如果设置的静态标引项值太多,可以考虑设置较佳的缺省值,即所谓“高参数高缺省”。
已经定义完毕的需求保存在各个元数据文件中,本体云运行时系统按任务实施在线调用,并进行动态组装,完成用户的需求。由于用户定义的需求是动态、可变化的,因此,系统将逐步地逼近最佳状态。
商务智能本体云架构设计从商务智能本体特征出发,结合云计算的最新技术,对云端的设计与部署进行了探索,现已使用 VC++(API)、ASP.NET(C#)分别完成了支持HTTP和FTP协议条件的实证研究,具有灵活、简便、通用的特点,系统开发的效率高、见效快、成本低,取得了很好的效果。之后将通过云租用加强商务智能本体云商业化运行的研究。
1 刘树超.云计算的研究与探讨.煤炭技术,2010,29(9):224~225
2 赵华茗.搭建基于云计算的开源海量数据挖掘平台.现代图书情报技术,2010(10):76~81
3 穆向阳,缪宁,陈明等.云计算环境下BI对企业核心竞争力的影响.情报杂志,2010,29(6):50~53,43
4 郭星明,郭天晨,张三元.管理信息本体需求中间件平台模型.浙江大学学报(工学版),2008,42(8):1 286~1 293
5 郭星明,郭天晨,张三元.基于管理信息本体和需求功能构件的中间件平台.浙江大学学报 (工学版),2009,43 (5):844~848,951
6 陆泉,谭永丽,陈静.商务智能.武汉:武汉大学出版社,2006
7 Chang F,Dean J,Ghemawat S,et al.BigTable:a distributed storage system forstructured data.ACM Transactions on Computer Systems,2008,26(2):1~26
8 Miller M著,姜进磊等译.云计算.北京:机械工业出版社,2009