基于Tableau的商业数据可视化分析

2018-01-04 12:02黄亮戴小鹏王奕
电脑知识与技术 2018年29期
关键词:数据可视化

黄亮 戴小鹏 王奕

摘要:人类利用形象思维获取视觉符号中所蕴含的信息并发现规律,进而获得科学发现。本文在Tableau软件作为可视化平台的基础上,借助于数据插值、数据拟合、SOM神经网络算法对可视化数据进行分析,利用某商场的全球销售数据对数据进行可视化研究,并根据可视化的结果得到相应的决策结论。

关键词:Tableau;SOM算法;数据可视化

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)29-0014-02

1 引言

数据可视化[1]于上个世纪五十年代左右出现,最出名的代表是计算机创造出了图形图表,1987年,布鲁斯·麦考梅克等撰写的《科学计算可视化》加快了可视化技术的发展,第一次将科学计算中的可视化称之为科学可视化。20世纪90年代初期,出现了信息可视化。目前将科学可视化与信息可视化都归为数据可视化。数据可视化是信息时代人们对于逻辑思维形象化需求的产物,在数据呈现爆炸增长,社会快速发展的潮流中,数据的处理是很重要的一个研究方向,其中数据可视化的研究是数据处理重要的一个方面,本文借助Tableau软件,利用某商场的全球商业数据进行可视化研究,为数据可视化的进程增添了部分理论依据。

2 数据可视化平台的选取

可视化工具产品从使用方法的角度来说,可以分为工具开箱即用与代码开发使用方式两种[2],下面举例说明几个常见的可视化工具[3]。

从上表的比较中,结合每一种数据可视化开发工具的优缺点,本文考虑到数据可视化研究的另外一个重点还有数据处理的部分,因此选择了简单易操作的Tableau软件来进行数据可视化,因为Tableau做数据可视化研究不需要太多的编程经验,编程人员可以集中到数据操作的模块。

3 数据可视化数据来源与分析

3.1 数据来源

数据的来源是利用某商场的全球销售的数据,这部分数据包含的字段多,数据量大,符合数据可视化研究的基本条件,因此选择商业数据作为数据可视化研究的基础数据。

3.2 数据处理与分析

Tableau软件对数据的处理之前需要对数据进行简单的处理,综合商业数据的数据特点,主要采用三种数据处理的方法,分别是数据插值、数据拟合和SOM算法。

3.2.1 数据插值

3.2.2 数据拟合

数据拟合是用连续曲线近似地刻画或比拟平面上离散点组所表示的坐标之间的函数关系的一种数据处理方法[5]。用连续的函数来分析离散的数据的一种常规的数据处理的方法,在科学研究或者实际生产过程中,可以把观测或者实验得到的数据对(xi,yi)(i=1,2,...,m),其中xi各不相同,对应的yi也各不相同,人们希望有这样一个函数能够经过实验所得的这些点数据,至少无限逼近这些点数据,从而达到一种拟合的效果,我们把这个通过这些点或者无限逼近这些点的这个函数成为拟合函数。得到拟合函数以后,可以对数据中的异常值或者缺失值进行剔除或者填充,这个数据处理的方法,在数据可视化的过程中显得尤为重要。

3.2.3 SOM算法

SOM[6-7]实现多维数据可视化的方法是把一个高维空间的数据信息通过降低维度的方法达到能够可视化的目的,SOM算法主要是实现降低维度的运算,低维数据的空间可以分为若干个规格网格部分,规格网格要表示高维数据的信息,为了实现着这个目标,可以假设低维空间的网格由大约M个单元构成,单元j都有一个与高维信息维数相同的原型矢量(protrdype vector)mj=[mj1,...,mjd],該单元在网格中的位置rj是固定的。SOM的训练过程实际是调整原型矢量数据的过程,可以通过训练得到原型矢量对应到低维空间,从而低维空间表示高维的信息。SOM算法是自组织神经网络的相关知识,在训练权值和阈值的过程中实现降维的对应法则,为数据可视化的维度变化提供算法支持。

4 数据可视化数据显示

本文利用某商场的全球商业数据进行数据可视化处理,图1是商品类别销售情况随地域分布情况的可视化研究,由图可以看出,非洲市场的销售量较低,因此可以得出非洲市场是该商场的潜在市场;图2是销售商品在一年中的销售变化趋势情况分析,从图中可以得出销售情况在四年中每一年的销售情况的基本分布为一到五月增长平缓,六月销售量有上升趋势,七月销售额有下降趋势,八月到十二月基本保持较高的销售额,因此该公司可以根据此变化趋势采取相应的措施,在五月开始增加储货量,为后续的销售提供充足的货源。

图3中以坐标图的形式展现了办公用品,技术和家具的利润随装运成本的变化趋势情况,其中从图中易得出无论是家具、技术还是办公用品,都有利润和装运成本较低的情况出现,且办公用品的分布相对集中,而技术的分布相对分散。图4是以地图的形式展现销售额和利润的地域分布情况,从图中明显可以得出无论是销售额还是利润,在西欧地区都有较大的数据量。

5 结束语

数据可视化[8]的研究在利用了Tableau作为软件平台,同时借助于数据插值算法,数据拟合算法,和SOM神经网络算法的基础上对数据进行可视化,可以从图片的形象化视角来理解抽象的逻辑化视角数据,用户可以通过图片、表格等直观明了的角度看待数据,及时为正确的决策提供有力的建议和指导,在一定程度上促进了经济的发展和社会的和谐稳定。

参考文献:

[1] 陈明. 大数据可视化分析[J]. 计算机教育, 2015(5):94-97.

[2] 曾悠. 大数据时代背景下的数据可视化概念研究[D]. 浙江大学, 2014.

[3] 任永功, 于戈. 数据可视化技术的研究与进展[J]. 计算机科学, 2004, 31(12):92-96.

[4] 吴健生, 王仰麟, 曾新平,等. 三维可视化环境下矿体空间数据插值[J]. 北京大学学报(自然科学版), 2004, 40(4):635-641.

[5] 伊晓东, 孙鹏. 基于小波分析的神经网络在遥感测温数据拟合中的应用[J]. 测绘与空间地理信息, 2017, 40(5):8-10.

[6] 芮小平, 张立强. 基于SOM的多维信息可视化研究[J]. 应用基础与工程科学学报, 2011,19(3):379-388.

[7] 陈万振, 张予瑶, 苏一丹,等. 贝叶斯正则化的SOM聚类算法[J]. 计算机工程与设计, 2017, 38(1):127-131.

[8] 姜玉哲. 农业传感数据可视化研究与实现[D]. 黑龙江大学, 2016.

【通联编辑:唐一东】

猜你喜欢
数据可视化
可视化:新媒体语境下的数据、叙事与设计研究
我国数据新闻的发展困境与策略研究
用户数据统计挖掘与展示