网络交易数据可视化研究综述

2021-02-04 08:02张楠
中国商论 2021年2期
关键词:交互设计可视化

张楠

摘 要:网络交易数据可视化是一个新兴研究领域,它将抽象的交易数据转化为可视图表展现,能够更直观地分析交易数据特征,揭示交易数据内涵,增强分析或决策人员的洞察力。本文广泛调研了网络交易数据可视化研究,首先对文献中网络交易数据可视化呈现进行了细致梳理及分类;其次对网络交易数据特性进行了归纳总结;最后对未来发展趋势提出展望。

关键词:交易数据;可视化;时序数据;交互设计

中图分类号:F124.3 文献标识码:A 文章编号:2096-0298(2021)01(b)--06

随着网络交易的飞速增长,产生了大量的交易数据。如何理解和分析这些网络交易数据,又如何将原始数据转化为有价值的信息,成为各大商家关注的焦点,同时也是学者和科研人员的研究热点。

目前,对网络交易数据分析多采用统计分析或数据挖掘的定量方法,即对数据关系分析研究,认识和揭示数据之间的规律,或者是利用自动算法,根据已有数据构建出相应模型,通过对模型进行研究,用户可以从中提取出分析结果和蕴含的知识。就研究方法而言,统计分析或者数据挖掘在一定程度上可以反映出数据的特征,但无法直观显示,且缺乏交互性。

网络交易数据可视化是一个新兴研究领域[1]。它利用人眼的感知能力对商业数据进行交互的可视表达以增强认知的技术,将原始多维数据间的复杂关系、潜在信息以及发展趋势通过图形、符号、颜色、纹理等可视化呈现,增强数据识别效率,传递有效信息,为数据分析任务提供更直观的途径。

本文主要对网络交易数据可视化研究进行综述。首先,根据可视化呈现角度不同,对已有研究成果进行分类,并阐述了代表性可视图形技术;其次,归纳了网络交易数据的特性;最后是总结及展望。

1 交易数据可视化图形分类

国内外学者已经提出一定数量的网络交易数据可视化方案,根据文章出现的先后顺序,我们将网络交易数据可视图技术分为两类:单视图和多视图,如表1所示。单视图是熟知的、简单图形,包括柱状图、像素柱状图、值-单元格柱状图以及热图。多视图是单视图组合,能更多反映交易数据维度信息。

1.1 單视图

1.1.1 柱状图

图1是最简单的统计图形,通常使用柱形和颜色来编码数据的属性。柱状图的一个坐标轴表示比较的类别,另一个坐标轴表示对应类别的统计值。在商品交易中,柱状图,纵坐标表示商品销售数量,横坐标表示12个月[2,3]。

1.1.2 像素柱状图

像素柱状图由柱状图衍生而来,其基本思想是直接显示数据值,而不是将数据聚集。在像素柱状图中,单个像素表示每个数据项,每个数据项的一个属性的详细信息被编码为像素颜色。像素柱状图的一个重要问题是:如何排列每个柱状图中的像素。Keim提出:首先使用一个或两个属性将数据分布在各个柱状图中,其次使用两个其他属性在柱状图中排序,最后其他属性使用颜色来映射。因此,像素柱状图可以看作普通柱状图和x-y图的组合。像素柱状图的基本形式如下:划分属性(用于划分像素柱状图)、排序属性(用于像素柱状图内部像素排序)、着色属性(像素着色)。像素柱状图被分成五元组:<像素对象,划分属性,X轴排序属性,Y轴排序属性,着色属性>。

在消费者交易案例中,一个像素对应一位顾客来可视化交易数据。图2显示了利用像素柱状图可视化电子商务交易数据。在图2中,像素柱状图用商品类型作为划分属性,时间(月份)和商品价格作为x和y排序属性,图内颜色分别表示时间(月份)、商品价格、访问量和商品数量。在时间(月份)属性图2(a)中,第12个月(面积最大)客户数量,而第2个月(面积最小)的客户数量最少。在商品价格属性图2(b)中,2月、3月、4月和5月价格最高。在访问量属性图2(c)中,从3月、4月、5月和6月中的颜色分布看出,这几个月的客户比其他几个月的客户回访的频率更高。在商品数量属性图2(d)中,均分布在整个一年中,表明大多数顾客购买不止一件商品。

通过像素柱状图的比对,商家能分析出消费者购买的规律,找出最有价值的消费者。但是像素柱状图的维度有限,随着时间的推移和数据量增加,像素柱状图无法展现大量用户信息和交易信息。

1.1.3 值-单元格柱状图

值-单元格柱状图[4]被用来可视化任何类型的交易数据。这些交易数据集通常是大量的多属性数据集,包括类别型、标称型以及数值型属性。类别型或标称型属性用于将数据划分为柱状图,而数字型属性用于确定柱状图的高度。为显示在常规柱状图中未显示的单个交易值,将所有柱状图划分为值-单元格。一个单元格代表一个值,并在视觉上显示为固定大小的小矩形(不一定有边框)。值单元格大小由柱状图的总值,柱状区域,单元格值和柱状图内X轴方向上的单元格个数共同定义。

在商品交易实例中,使用42,074个交易数据构建了一个值-单元格柱状图,显示了销售价值分布,如图3所示。柱状图的尺寸代表一个月的总值,商品交易值离散到一个或多个单元格中。红色和深红色的区域表示交易额高于$ 1,000。与绿色和黄色区域中的低交易额相比,红色和深红色的区域占据更多空间,说明它们对总销售额的贡献更大。每个月都有高价值交易,尤其是第4个月。但在第12个月中,低于$ 500的低交易额(蓝色,绿色和黄色区域)对销售的贡献要大于高于$ 1,000的高交易额(红色和深红色区域)。

值-单元格柱状图用以可视化交易日志的整体概括和细节信息,从而发现对交易金额和交易数量贡献大的用户。但值-单元格柱状图未考虑与用户购买行为相关的用户特征和商品特征。

1.1.4 热力图

热力图被用来表达二维数据,数据常以矩形形式整齐排列,数据值大小用颜色来表示。Hayashi[5,6]采用热图与时间轴来可视化商品交易信息,如图4所示。基本思想是将绘图空间划分为网格,将时间变量分配给X轴,将另一个变量分配给Y轴,根据需要为网格空间着色相应记录的数量。图4(a)显示了商品交易概况,其中X轴表示天数,Y轴表示店铺ID。此图表明:周末或节假日在多家商店中始终有很多交易(如两个红色圆圈所示),商品交易在几个商店中定期增加(图4(a)中的红色箭头所示)。图4(b)显示了应用基于聚类的过滤并可视化特定聚类的内容。从图4(b)可看出,聚集中的商店在最后一个周末的商品交易活动相对较多(图4(b)红色箭头所示)。 图4(c)绘制了异常值和非异常值项;异常项目为亮粉红色。图4(c)表明:交易额度较大的商店始终具有大量交易,而其他商店则在一个月的下半月的特定日期或周末交易量急剧增加。从图4(a)中发现这种趋势并不容易,但是由于离群值检测和颜色重新计算,可以轻松发现它们。

布局維度是用来表示事件组之间的关系,决定时序数据以何种布局方式进行排布。如图10第三行所示,包括统一布局、多面布局、分段布局和多面+分段布局。统一布局是单个时间线。多面布局是通过属性分成多个时间线。分段布局是根据有意义的时间划分时间线,例如按月、周、天进行分段。

2.2 时序特性

交互特性用以响应用户的交互操作,交易数据可视化系统提供了一系列交互设计[12],包括过滤(数据筛选)、编码(颜色映射)、关联(协调多视图)、概述和详细(时间切换)。

(1)过滤(数据筛选):用于设置约束条件实现信息查询。例如,在交易数据可视化系统中的数据筛选,使用预定义关键字和其他条件过滤数据,以提高系统的接受度。

(2)编码(颜色映射):用于改变数据元素的可视化编码。例如,在交易数据可视化系统中的颜色控制,使用极值映射和规律映射两种颜色映射方法,同时还可调节结点的透明度。

(3)关联(协调多视图):用于显示数据对象之间的联系。例如,在交易数据可视化系统中的协调多视图,单一视图不能满足所有要求,也不能显示所有必要数据。协调多视图系统允许用户查看不同的数据,同时能够轻松理解视图之间的联系。

(4)概述和详细(时间切换):用于有限条件下显示总体和细节。例如,在交易数据可视化系统中的时间切换,在概述中查看一年、一月、一周和一天中所有交易数据的汇总视图,详细是选定单个交易数据信息。

3 总结及展望

网络交易数据可视化是将电子商务数据分析和可视化技术有机结合起来,通过图形化的交互工具,提高数据分析师的理解力,使分析师更深入地了解用户的需求。从文本梳理可以发现,网络交易数据可视化已经取得了丰硕的研究成果,但是随着网络交易的多变性,研究者们还面临着诸多的挑战:

一是目前使用的网络交易数据均来自于各个网络交易公司的离线记录数据。但实时数据对于数据分析更为重要,如何实时显示网络交易数据可视化对数据分析及图形绘制提出新的要求。

二是目前使用的网络交易数据均来自于PC端的传统网站。随着我国移动互联网用户数量的全面提升,网络交易数据也来自于移动网络。但移动网络环境多变且移动设备屏幕有限,如何提高网络交易数据的环境稳定性,解决移动设备屏幕受限的问题,这将是研究人员所需要解决的关键问题。

三是目前网络交易数据可视化系统都有交互设计,但为了能更好地分析交易数据,更加深入地理解用户的需求,需要加强用户实测模块方面的深入研究。

参考文献

陈为,沈则潜,陶煜波,等.数据可视化[M].北京:电子工业出版社,2019.

DANIEL K, MING H, JULIAN L, et al. Pixel Bar Charts: A new technique for visualizing large multi-attribute data sets without aggregation, Hewlett-Packard Laboratories Technical Report, HPL-2001-92, March 2001.

HAO M C, LADISCH J, DAYAL U, et al. Visual mining of e-customer behavior using pixel bar charts [C]. Proceedings of the ACM KDD. 2001: 1-7.

DANIEL K, MING H, UMESHWAR D, et al. Value-cell bar charts for visualizing large transaction data sets [J]. IEEE Transactions on visualization and computer graphics, 2007, 13(4): 1-12.

HAYASHI A, ITOH T, NAKAMURA S. A visual analytics tool for system logs adopting variable recommendation and feature-based filtering [C]. Proceedings of the 17th International Conference of Information Visualization, 2013: 1-10.

HAYASHI A, KOHJIMA M, MATSUBAYASHI T, et al. Regularity measure and influence weight for analysis and visualization of consumers attitude [C]. Proceedings of the 19th International Conference on Information Visualization, 2015: 290-299.

CHANG R, GHONIEM M, KOSARA R, et al. WireVis: Visualization of categorical, time-varying data from financial transactions [C].Proceedings of the 2007 IEEE symposium on Visual Analytics Science and Technology, 2007:155-162.

LIU Z, STASKO J,SULLIVAN T. SellTrend: inter-attribute visual analysis of temporal transaction data [J]. IEEE Transactions on Visualization and Computer Graphics. 2009, 15(6):1025-1032.

XIE C,CHEN W,HUANG X X, HU Y Q, et.al. VAET: a visual analytics approach for e-transactions time-series. IEEE Transactions on Visualization & Computer Graphics [J]. 2014,20(12):1743-1752.

贾若雨,曾昂,朱敏,等.面向在线交易日志的用户购买行为可视化分析[J].软件学报,2017,28(9):2450-2467.

BREHMER M, LEE B, BACH B, et al. Timelines Revisited: A design space and considerations for expressive storytelling [J].IEEE Transactions on Visualization and Computer Graphics.2017,23(9): 2151-2164.

SHNEIDRMAN B,PLAISANT C.Designing the user interface: strategies for effective human-computer interaction[M].Boston:Addison-Wesley,2005:40-50.

猜你喜欢
交互设计可视化
数据可视化设计在美妆类APP中的应用
画图:数学思维可视化的有效工具
思维可视化
基于GeoGebra的高中物理可视化教学研究
复变函数级数展开的可视化实验教学
复变函数级数展开的可视化实验教学
复变函数共形映射的可视化实验教学
复变函数共形映射的可视化实验教学
浅谈交互设计流程中的视觉因素
超数字化:网络体育新闻传播的发展趋势