超市数据仓库模型的设计开发

2018-10-26 10:54高祎
科技资讯 2018年14期
关键词:数据模型年龄层数据仓库

高祎

摘要:当前各个超市数据库中都积累了大量的日常业务数据数据,要做到更好的销售业绩就要充分利用企业数据库中这些数据,并要建立多维数据集将这些数据更好的展现给决策者。本文介绍了数据仓库的基本概念、特点以及多维数据集的基本定义。然后介绍了PowerDesigner建模数据库工具,并利用数据库建模工具PowerDesigner建立超市销售多维数据模型。

关键词: 数据仓库,PowerDesigner,决策支持

中图分类号:TP-9 文献标识码:A 文章编号:1672-3791(2018)05(b)-0000-00

1.引言

现代社会市场变化莫测,零售业的竞争日趋激烈,超市要做到更好的销售业绩就要充分利用企业数据库中积累的大量日常业务数据。因此各大型超市都在建立自己的决策支持系统。

决策支持系统需要大量高质量,纯净并且集成的数据,但是传统的数据库只维护详细的原始数据,并且是分散的,为了能够把所需的信息从原始数据中分离出来,把分散的、难以访问的原始操作数据转化为集中统一、随时可用的信息需要建立数据仓库。

在建立数据仓库的过程中,PowerDeigner作为一款优秀的CASE工具不仅可以加速数据仓库的开发过程,提高工作效率,且对系统的扩展性重用性、易维护性均起到至关重要的作用。

2. 数据仓库介绍

数据仓库是面向主题的、集成的、随时间变化的、稳定的数据集合。

(1)进行数据仓库设计时,需要确定数据分析的各个主题。“主题”在数据仓库中是由一系列表实现的,可以用多维数据库方式进行存储。

(2)数据仓库是集成的(integrated)。数据仓库中存贮的数据不是原有数据的简单拷贝,而是根据决策分析的要求从原来分散的各个子系统中提取出来的,将多个异种数据源经过抽取、筛选、清理、综合等集成在一起,确保命名约定、编码结构、属性度量等的一致性。

(3)数据仓库是时变的(time-variant)。数据仓库中的数据随时间变化而不断更新,不断捕捉事务数据库中新的数据,统一集成后追加到数据仓库中。

(4)数据仓库是非易失的(nonvolatile)。数据仓库中的数据主要用于决策分析,因此存储的应该是相当长一段时间内的历史数据。使用该系统的用户只能通过分析工具进行查询、分析,而不能修改其存贮的数据。

3.PowerDesigner介绍

Power Designer 是Sybase公司的CASE工具集,目前已经发展到16.5版本。数据建模是业务需求和系统实现之间的桥梁。Powerdesigner具有非常强大的数据库建模能力,可以用来建立概念模型(CDM)和物理模型(PDM),其中概念模型独立于数据库管理系统,而物理模型和数据库厂商有很大联系,利用PowerDesigner还可以建立数据仓库的多维数据模型,或者从物理数据模型转换为多维数据模型。

4. 多维数据模型设计

多维数据模型通常以通常以星形或者雪花形结构进行存储,星形模型中,位于中央的表为事实表(Fact Table),与事实表通过外键联接的周围各个表称为维表,我们可以通过每一维的不同粒度来查询数据。雪花模型是星型模型的扩展。

本文中根据业务需求建立了销售分析、运费分析、采购分析三个大主题,其中销售分析中建立了时间维度,客户维度,供应商维度,以及员工维度。销售主题建立星型模型中事实表为销售事实表包括销售金额、销售数量、折扣三个度量,维表为时间维表、客户维表、产品维表以及员工维表,时间维表有时间、天、星期、月、季度、年等字段,客户维表中包括客户序号客户名称、客户性别、客户年龄层、客户城市、客户省份等字段,员工维表包括员工序号、员工姓名、年龄、年龄层等字段,产品维表包括产品序号、产品名称、供应商、产品类别、产品单价范围等字段。其中对于时间维表可以建立年、季度、月、星期、日、时等级别,并建立时间层次1:年----星期----天----时,时间层次2:年----季度----月----日----时。客户维度中可以建立客户、客户城市、客户省、客户年龄层等级别。客户层次1:客户----客户城市----客户省,客户层次2:客户----客户性别,客户层次3:客户----客户年龄层。产品维表可以建立产品类别、产品供应商、产品单价、产品名称等级别,产品层次1:产品序号----产品名称----产品类别,产品层次2:产品名称----产品供应商。3:产品名称----产品单价范围。员工维度中可以建立员工序号、员工名称、员工年龄层级别,员工层次:员工序号----员工名称----员工年龄层。

所建立的数据仓库模型如图1所示

总结

在超市决策系统中,并需要对大量的数据进行多维分析处理,并把分析结果以多维视图方式展现给決策者,决策者再做出相应的决策。在此本文采用优秀的数据库建模工具PowerDesigner建立了超市销售多维数据模型,可以通过该多维数据集所建立四个维度:客户维,产品维,员工维以及时间维来观测销售数据,达到了预期的效果。

参考文献

[1] 王珊等 数据仓库技术与联机分析处理 [M]科学出版社,1998-06

[2]鲍钰, 黄国兴, 张召. 基于OLAP 的上海社区服务网后台数据仓库的设计与实现. 计算机应用研究, 2003 20(4):144-146

[3]郭艳飞,宋丽华,战颖,罗攀.多数据仓库集成方案的设计与实现[J].信息技术,2017(07):14-18.

[4]谢星星,朱婵. Power Designer系统分析与建模实战[M].机械工业出版社,2015

猜你喜欢
数据模型年龄层数据仓库
基于区块链的微网绿电交易数据模型研究
基于数据仓库的数据倾斜解决方案研究
探究不同年龄层小儿发育性髋关节脱位股骨颈前倾角的临床特点及意义
关于PowerDesigner软件工程技术的研究
数据仓库系统设计与实现
ORM工具
中国劳动力的健康状况及差异分析
数据复用在存储数据仓库中的运用
数据仓库技术在档案管理领域的应用