杨丽君
摘要:当前对于数据有效的处理和分析研究逐渐受到重视,而数据可视化又是数据分析中一项最重要的方法。对此,基于图形语法的优势提出一种新的数据可视化方法设计,通过对数据的转换及图形标记、图形可视化编码以及标度及坐标系变换,实现对数据可视化的转换。通过对比实验验证,该方法与传统数据分析方法相比具有更高的交互率,可以为数据分析提供更加快速的可视化帮助。
关键词:图形语法;数据;可视化;交互性
中图分类号:TP311.5 文献标识码:A
文章编号:1009-3044(2020)13-0277-02
数据可视化是一种借助于人类眼睛的快速视觉感知以及人类大脑的智能认知能力的技术,利用数据可视化技术可以有效地传递、交流清晰的数据。目前已经存在的数据挖掘方法和数据统计分析,对于海量、复杂的数据进行处理往往是对数据的简化,只会造成数据的传递出现偏差。而数据可视化则是对数据中所有的结构及细节进行还原,提高数据处理的精度。图形语法是可以让用户通过结构简单的语法搭建出众多不同类型的数据可视化图像或表格,并且在图形语法当中还包含了众多用于统计和分析的工具,支持坐标系的构建,让使用者可以自主的构建需要的图像或表格。
1基于图形语法的数据可视化方法设计
本文设计的基于图形语法的数据可视化方法是以数据到图形空间的映射为基础,利用图形语法完成有数据转换为图形的过程,从下至上,由最基础的数据元素生成更高级的元素嘲。基于图形语法的数据可视化方法的具体思路为:首先利用图形语法对数据转换为图形的形式,再对图形进行标记,最后对图形进行可视化的编码实现数据可视化,根据不同用户的需要还可对其进行相应的标度和坐标系变换处理。下文将对上述基于图形语法的數据可视化方法的过程进行详细的说明。
1.1基于图形语法的数据转换及图形标记
从图形语法的角度出发,一个统计的图形就可以看作是由数据到几何图形转变、映射得来的。通过图形语法将数据的统计进行转换,最终根据实际需求绘制在特定坐标系当中,通过多个不同的数据组合成不同的子集图形,最终构成完成的数据可视化图形。数据可视化图形当中最核心的部分是可视化的数据部分,其次是通过数据在变化过程中产生的相应图形属性的映射。对于数据的转换,首先要将海量的数据信息输入到同一个数据框架当中,在数据框架中包含了数据的屙l生以及相应的数值,图1为数据框架的集合结构组成。
数据框架当中的每一条数据都包好了其自身的属性以及数值,将数据转换为数据框架的形式,其中每一行都可以表示为一条记录内容,在图形语法当中数据框架中的每一列都代表一个变量,想要表示多维度的数据可以通过多列叠加的方式处理。数据框架本身是一个通过数据列存储的数据格式,因此对数据的转换操作更加方便。数据向数据框架转换关系具体可表示为:在计算机当中输入相应的数据属性及数值,通过转换后只需输入相应的数据属性即可得到相应的数据属性数值。在数据框架当中还包含大量的数据操作,方便使用在根据具体需要对数据进行转换,转换操作包括:映射、过滤、排列、集合、分组等,从而完成对数据到图形的转换。
在对数据进行可视化转换过程中,还需要对转换后的图形进行标记,通过图形的标记可以直接决定最终生成的图形或图表的类型。基于图形语法的规范性图像转换没有特定的图形或图表要求。因此,在对图形进行标记时只需要利用更加细小的粒度实现对图像的标记,通过不同图形标记的组合得到多种不同类型的数据表达含义。将图形和图表看作是图形标记集合的标记对象,在图形语法当中没有对特定的图形进行定义,因此本文为图形标记与传统图表之间的关系进行如表1所示的定义。
在实际操作过程中,本文基于图形语法的数据可视化方法的图形标记定义只需要用到表1中的前六种图形标记类型即可完成对绝大多数数据的可视化处理。
1.2图形可视化编码
完成对数据额转换及图形标记后,还需要通过对图形进行可视化编码,从而实现对数据的可视化映射图形的建立。由于人们在对可视化的感知是通过人的视觉完成的,因此,本文在对数据可视化方法进行设计时,首先基于人类视觉感官的编码原则对数据进行可视化元素映射。通过图形可视化编码可以是海量数据信息更易被用户理解,数据本身的含义也更加生动、直观的表现。本文提出的可视化数据图像编码是由图形和视觉属性共同构成的通道,利用图形语法实现由数据维度到数据可视化元素的映射,可以隔年直观且有效的表现出数据本身的性质及信息。再通过控制图形语法的视觉通道使数据的维度能够在图形的视觉属性上得到映射,可以更加准确地反映出数据属性中的定量信息,通过两种不同作用的通道实现对海量数据信息的完整可视化表达。
利用图形语法实现对不同数据类型的图表的表达可通过不同的图形标记实现,由于图形在绘制的过程中会产生不同的形状,因此通道中与图形相对应的数据属性映射方法不同时,最终生成的图形形状也不同。
图形标记点可以直接用三角形、圆形或矩形表示;图形标记线可以用折线、曲线以及虚线表示;图形标记多边形可可以用实心的多边形,也可以用只有边框轮廓的空心多边形表示。通过构建对应关系,形成了具有特定意义的图形标记,通过形状的选择决定了各个视觉通道当中的图形属相的映射,通过图形形状确定应该选择图形标记。
本文基于图形语法的数据可视化方法的图形可视化编码实际上是利用表现能力更强的视觉通道实现对数据中重要属性及数值的可视化编码。视觉通道中的性质类型决定着不同数据所应用的不同通道,根据数据实际包含的含义选择适当的视觉通道可以对海量数据信息更加完整的表达,从而实现对海量数据信息的可视化。
1.3标度及坐标系变换
完成对图形的可视化编码后,基于图形语法的数据可视化方法基本完成,但还可根据企业当中对数据信息的实际需要对图形进行标度和坐标系转换。标度是指从定义领域向数值领域映射的函数处理方法。利用相应的方法构建输入的数据数值向可视化数据转变的映射函数,从而方便用户根据具体内容对数据进行可视化展现。标度作为由数据领域向图形领域过渡的桥梁,主要负责对初始数据信息到区间[0,1]的转化作用,由初始数据向区间内继续转化的过程称之为归一化操作。在转化的过程中,标度的类型是随着数据的类型不断改变的,对于数据的分类大致可分为两种,一种是离散型的数据,一种是连续型的数据,其中离散型数据又可分为有规律的和无规律的两种。
在本文设计的数据可视化方法当中的坐标系与传统意义上的坐标系不同,在图形语法中坐标系主要用于描述数据信息是如何通过映射方式转化为图形的,在本文方法中用到的坐标系为极坐标、地图投影以及笛卡尔坐标三种。其中地图投影坐标系需要用户将数据中带有地理坐标的数据以本文上述方式转变为二维空间中的坐标。在三种坐标系当中都包含对图像的平移、旋转和镜像的操作,用户可进行自由的操作实现对数据全方位的可视化,提高了数据的多样性和灵活性。
2实验论证分析
为了详述本文提出的基于图形语法的数据可视化方法,下面将通过对比实验的形式,完成本文数据可视化方法与传统数据分析方法交互性验证的实验。
2.1实验准备
首先建立两个初始状态完全相同的分析模型,其中一个添加本文设计的数据可视化方法,并将其设置为实验组;另一个添加传统数据分析方法,并将其设置为对照组。分别在两个分析模型中添加相同的数据信息,并模拟用户对数据的使用以及数据的展示效果。通过两个分析模型的不断迭代输出最终的实验结果。
2.2实验结果及分析
分别将两个分析模型的实验结果进行记录,并通过结果计算出两种数据展示方法与用户之间的交互率,并绘制成如图2所示的实验结果对比曲线。
通过进行60次的迭代后,从图2中可以明显看出,实验组的交互率整体呈现出上升的趋势,而对照组在完成20次迭代后交互率呈现出了明显的下降趋势。因此,通过对比实验的形式进一步证明了,本文提出的基于图形语法的数据可视化方法具有更高的交互性,可以更加完整地向用户展示数据中包含的所有信息,将其应用到企业的实际运行当中,更有利于企业的发展。
3结束语
本文针对目前数据信息对企业发展的重要性,提出了一种基于图形语法的数据可视化方法,通过对比实验进一步验证该方法具有更高的交互性。随着图形语法本身的不断发展,在未来还可以用于解决更多的数据问题,在后续的研究中,还将针对图形语法实现对数据动态可交互的可视化图形生成方面进行更加深入的研究。