几种Tableau排序方法的应用介绍

2019-09-10 07:22:44刘晓伟
甘肃科技纵横 2019年11期
关键词:排序

刘晓伟

摘要:排序操作是数据分析中常见的操作之一,使用EXCEL以及常见的BI商业智能(Business Intelligence)软件都能实现。作为一款数据可视化分析软件,Tableau以其方便灵活、可视化展示功能强大的特点在众多BI软件中独树一帜,利用Tableau进行数据排序处理效率非常高,一般情况下,简单地拖放字段到相应的行、列区域就能很快获得直观的排序图形,再结合筛选器就能获得需要的排序结果。但由于对排序的需求不同以及隐性维度的存在,基本的排序操作方法可能无法达到操作目的,还需要结合相关函数创建字段,利用合并字段等方法进行处理。本文以Tableau Desktop版本自带的超市示例数据源为操作对象,从不同的需求角度出发对订单数据按照销售额进行排序,通过实例操作的方式详细讲解了使用Tableau进行排序的几种常见方法。

关键词:Tableau;排序;Rank; Index; 合并字段

中图分类号:TP393    文献标志码:A

在数据分析中经常要对分析对象进行排名或排序,比如对产品销量、产品利润排序,按特定度量找出前N名产品或客户等。在全球知名数据可视化分析软件Tableau中,有几种常见的方法可以进行不同需求的排序。下面以Tableau自带的超市示例数据源的订单数据为操作对象,详细介绍几种常见排序方法。

一、基本方法

基本方法就是把维度和度量直接拖放到行和列,再点击维度胶囊下拉菜单,选择排序命令后,进行相关设置完成排序。排序完成后,可以通过筛选器进一步过滤出需要的排列名单。按上述方法可以筛选出公司产品排前10的产品。具体操作如下:1.新建一个工作表;2.把“产品名称”字段拖放到“行”功能区,把“销售额”字段拖放到“列”功能区;3点击“產品名称”胶囊的下拉列表,再点击“排序”,4.在弹出的设置窗口里选择排序依据为“字段”,排序顺序为“降序”,字段名称为“销售额”,“聚合方式”为总和;5.把“产品名称”维度拖放到“筛选器”功能区,将弹出的对话框切换至“顶部”页,再点击 “按字段”,依次选择“顶部”“10”“销售额”“总和”,然后点击确定,得出全国范围销售额top10的产品数据与视图,该排序是把各产品在全国各地区不同月份的销售额求和之后进行的排序。

另外,对于记录数较少的维度,可以直接上下拖动轴标签或者图例标签进行简单的手动排序。在分析维度比较简单的情况下,基本方法能够实现常见的排序要求。

二、Rank方法

在上面的操作例子中,如要排列出每个地区的销量TOP10产品,再按基本方法,把“地区”字段直接拖放到“行”功能区,得出的结果将仍然是按照全国的销售TOP10产品序列在每个地区进行排列,因而是错误的。解决的方法之一是可以使用RANK函数新增一个计算字段,语句如下:“RANK(SUM([销售额]))”,可命名为“RANK”。接着在度量窗格中鼠标右键点击新增的RANK字段,在弹出的菜单中把它“转换为离散”类型。再把该字段拖放到行功能区,置于“地区胶囊”和“产品胶囊”中间。接着,右键单击“RANK胶囊”,在弹出的菜单中把“计算依据”改为“区(向下)”,最后,按住Ctrl键,把“RANK胶囊”从“行”功能区,拖放到“标记”功能区的LOD区域(详细级别区域),然后右键单击,在弹出的菜单中把数据类型改为“连续”,然后再次点击鼠标右键,选择“显示筛选器”,在面板右侧出现的筛选器选择栏,选择“1-10”,也可以选择任意范围,从而得到按RANK法操作的各地区销售额TOP10的产品排名数据与视图。

采用RANK方法的关键是掌握RANK函数的设置。RANK函数的标准表达式是:RANK(expression,[‘asc│‘desc]),其释意为:为分区中的当前行返回标准竞争排名,为相同排名分配相同的值,使用可选参数‘asc∣‘desc指定升序或降序,默认为降序。例如,使用RANK函数对数组(7,9,9,16)进行升序排名的结果为(1,2,2,4)。

三、Index方法

实现上述结果除了采用RANK函数设置新的计算字段方法外,还可以使用INDEX函数。INDEX函数的标准表达式为:INDEX(),意为放回分区中当前行的索引。例如,对于分区中的第10行,INDEX()的返回值为10。

使用INDEX函数进行排序操作具体步骤如下:1.在维度面板上点击鼠标左键,在弹出的菜单里选择“创建计算字段”2.输入计算字段内容为“INDEX()”,并把字段命名为index;3.把index字段拖放到“行”功能区,把数据类型改为“离散”型,置于“地区”胶囊和“产品名称”胶囊之间。4.在“index”胶囊上单击鼠标右键,在弹出的菜单中选择“编辑表计算”,在弹出的对话框中设置计算依据为“特定维度”,并选择“地区”和“产品名称”两个维度,所在级别选择“产品名称”,重新启动间隔选择“地区”,排序依据选择自定义,按照销售总和降序排序;5.右键点击“index”胶囊,选择“显示筛选器”,然后再在筛选器的选择栏把INDEX胶囊的数据类型设为连续,并将值范围设为0-10,从而得到按INDEX法操作的各地区销售额TOP10的产品排名数据与视图。

从操作的过程可以看出,INDEX法和RANK的相同点在于,都需要使用对应的函数创建计算字段;它们的区别在于,INDEX法需要编辑表计算,进行一系列的设置,操作相对复杂,如操作者对表计算原理理解不透,则容易设置出错,达不到预期效果。

那么,在进行表计算设置的时候,操作者应该掌握两个关键的要素,一个是计算方法,一个是计算依据。计算方法主要有:差异、百分比、百分比差异、合计百分比、排序、汇总等,操作者应该按照操作目的选择计算方法。计算依据也叫寻址和分区,可以理解为计算的路径。计算依据各选项归纳见下表一。

序号 计算依据选项名称 计算路径

1 表(横穿) 每一行从左到右依次进行计算,换行之后重新计算。

2 表(向下) 每一列从上到下依次累加,换一列重新计算。

3 表(横穿然后向下) 每一行从左到右依次计算,换行之后不重新计算接上一行的最后一个数据继续计算。

4 表(向下然后横穿) 每一列从上到下依次计算,换列之后不重新计算接上一列的最后一个数据继续计算。

5 区(向下) 区内每一列从上到下依次计算,换列之后重新计算,换区之后重新开始。

6 区(横穿然后向下) 与表(横穿然后向下)计算路径相同,但换区之后重新开始计算。

7 区(向下然后横穿)

8 单元格 计算各个单元的数字,单元格里可以是一个数据或多个数据。

9 特定维度 根据选择单各维度或多维度组合进行计算

表一:表计算的计算依据选项

建议操作者通过实例一一对上述表计算的各种情况进行设置,然后对比结果,深入理解表计算的原理,尤其加深对特定维度的理解。

四、合并字段方法

在介绍合并字段方法前,首先,使用基本方法按总和销售额对产品名称进行降序排列,然后再加入地区维度进行降序排列,前后对比操作结果,可以发现产品列表顺序是一样的,这说明,虽然在产品名称维度前加入了其他维度进行排序,但程序仍然只按照产品维度进行排序,并没有改变排序结果,而且在每个地区下面的产品都会重复一样的排序,这个排序的结果明显不是按照各地区的产品销售额来进行的排序结果。原因在于地区维度并没有与产品维度进行自动关联。这个问题可以用“合并字段”来解决。合并字段就是把在逻辑上存在关系的两个或者两个以上的字段进行合并,搭建这些字段之间的关系,软件程序能对这些关系进行智能判断。具体操作步骤如下:1.按住Ctrl键选择“地区”维度和“产品维度”,再单击鼠标右键,在弹出的快捷菜单中选择“创建”-“合并字段”;2.把该合并字段拖放到“行”功能区中,置于“地区”胶囊和“产品名称”胶囊之间。3.右键点击合并字段胶囊,选择“排序”,设置按照“销售额”总计进行降序排序4.该排序为隐形排序,起辅助作用,并不需要显示出来,可以在合并字段胶囊上点击右键,将“显示标题”选项勾掉。从而得到按合并字段法操作的各地区销售额TOP10的产品排名数据与视图。

从操作结果可以看出,对地区和产品名称进行字段合并后,程序按照不同地区的销售额对产品进行了排序,因而每个地区的产品排列顺序都不一样,反映了各地区产品不同的销售情况,达到了分析目的。

最后,从上述关于Tableau的四类排序方法的案例操作介绍中可以看出,比较容易的操作是显性排序(排序的依据和结果在面板上直接展示出来,能看到),而要进行隐性排序(排序依据的维度或字段未显示出来)则相对难度大。显性排序用基本方法一般就能达到分析目的,隐性排序则需要基本方法与其他方法的结合才能达成目标。

参考文献:

[1]高云龙,孙辰. 大话数据分析-Tableau数据可视化实战[M].中国工信出版社

[2]黄亮; 戴小鹏; 王奕.基于Tableau的商业数据可视化分析[J].电脑知识与技术,2018(10)

[3]赵景.信息的可视化框架表达与建构实现—以TableauDesktop为例[J].新媒体研究,2019(06)

[4]陈佳艳. 基于Tableau实现在线教育大数据的可视化分析[J].江苏商论,2018(2)

[5]高屹. 信息可视化技术研究分析[J] 科技創新与应用. 2016(01)

[6]杨月.Tableau在航运企业航线营收数据分析中的应用[J].集装箱, 2018(8)

猜你喜欢
排序
排排序
排序不等式
作者简介
名家名作(2021年9期)2021-10-08 01:31:36
作者简介
名家名作(2021年4期)2021-05-12 09:40:02
作者简介(按文章先后排序)
名家名作(2021年3期)2021-04-07 06:42:16
恐怖排序
律句填空排序题的备考策略
节日排序
刻舟求剑
儿童绘本(2018年5期)2018-04-12 16:45:32
作者简介(按文章先后排序)
名家名作(2017年2期)2017-08-30 01:34:24