浅析信息可视化原理及其技术

2018-08-30 02:14曾潇潇

艺术与设计·理论 2018年9期

曾潇潇

（华中科技大学，武汉 430070）

一、人类的感知特性

在人类所有的感官中，视觉被认为是一种主要的、强大的输入通道。它吸收了我们周围的一切事物，并将这些信息传递给大脑，以便对它的含义进行即时分析。在视觉与认知的密切联系下，学习和创造视觉设计的第一步是通过理解人类视觉感知的工作方式。视觉感知是相对的，不断地扫描，不断调整焦点，不断适应。我们的视觉将信息传递给我们的大脑，我们的大脑负责处理所看到的信息，人类的视觉和认知进行特定的相互作用。更重要的是，人类视觉的复杂和神秘的本质，它为视觉设计师创造了大量的机会来利用人类的视觉感知，因为它与信息可视化有关。在所有独特的视觉特征中，两种感知特性在信息可视化中被普遍应用：前意识的处理和格式塔法。

（一）前意识的处理

在感官记忆中进行的前意识的视觉处理，是创建视觉表征的基础。在没有意识干预的情况下，观众可以瞬间感知到前意识关注的视觉属性。信息可视化研究的关键问题之一是研究人类视觉系统如何处理和分析图像，这项研究的一个重要的初步结果是，少量的视觉特性可以被“低级”视觉系统快速而准确地检测出来。这些特性被称为“前意识”，因为它们的检测似乎是在集中注意力之前。要充分认识到这一观点的价值可能是困难的，但理解前意识的处理对于可视化设计是很重要的。特别是，通过开发前意识的处理能力，可以回答几个重要的设计问题，例如，可以立即感知到什么？哪些视觉特性是好的鉴别器？是什么误导观众呢？怎样才能设计出这样引人注意的信息?

来自北卡罗来纳州立大学的Christopher G. Healey创建了一个网站，以展示关于信息可视化体验的前意识处理方法。图1中给出了他的一个例子：该图显示了如何根据颜色差异搜索目标圆——在所有较亮圆圈中较暗的圆会凸显出来。这是前意识处理的基础却普遍使用的用法。前意识设计中也会使用其他一些基本工具包括长度，宽度和强度，还有更高级的符号，包括照明和运动方向。

（二）格式塔组织法则

格式塔组织法则也被称完形法则，描述如何在图形显示中安排视觉符号，以优化图像达到一个更好、更有效的可视化效果。这些法则关注的是人们如何解读世界，提供有关知觉组织的相关原则。格式塔法最早是由德国心理学家在20世纪初提出的，它们的主要目的是帮助理解感知模式，同时也提供对许多基本感知现象的清晰描述。心理学家称他们为法则，这些原则更像是启发式，是解决问题的思维捷径。

> 图1 Christopher G. Healey运用颜色差异搜索目标

> 图2 Chernoff Faces

> 图3 用平行坐标表示汽车变量的关系

一个著名的格式塔定律被称为“花瓶”图，这幅图画出了图形组织和边缘分配的关键要素，以及它对形状感知的影响。人们可以注意到，在花瓶画中，感知到的形状取决于被分配的黑白区域的边界。与其相反，物的认知可以被认为是识别物体的基本知觉行为的一部分。必须承认格式塔法在信息可视化中起着重要的作用。这些法则适用于图形的创建以避免其相互干扰。具体来说，根据格式塔法则，可视化设计应该避免不加标记，使用感知有效的编码，而不是分散观众的注意力。用真实的信息创建有效和富有表现力的视觉设计是信息可视化的重中之重。

二、信息可视化与认知

在信息可视化的一个定义中，有必要说明“使用计算机支持的交互式数据可视化来放大认知”强调信息可视化与人类认知的紧密联系。图形的一个显著优点是通过人类视觉帮助简化任务完成所需要的信息。尤其是为了使知识具体化，仅当数据无法轻易提供信息时，使用信息可视化可以提供帮助。视觉辅助的认知是由于它增加了记忆和资源的处理，通过前意识的属性、格式塔定律，和许多其他的知觉属性。通过简化对信息的搜索并增强对模式的识别，可视化可以实现感知推理操作。

Edward Tufte爱德华·塔夫特是《纽约时报》的“数据达芬奇”（The da Vinci of data）的作者，他用简洁的文字和巧妙的插图书籍显示了数据的视觉效果。除了在信息设计方面的著述，Tufte也是该领域的先锋。通过他的作品，他提出了视觉化设计的关键原则，为展示信息提供了实质性的和重要的见解，以达到最大的效果。

Tufte的原则的一个后果是通过信息可视化实现卓越的图形化能力。根据Tufte的说法，图形化的卓越是“精心设计的有趣数据的展示——实质、统计和设计的问题。”知道优秀的图形是由复杂的想法（图中没有歧义或混乱）、精确性（真实的结果和不失真的演示）和效率（极少量的图表“垃圾”）组成的，这是一个关键的问题。卓越的图形能力将使观众在最短的时间内获得最多的创意，并且在最小的空间内使用最少的笔墨。这样的图形化的优秀通过两个目标来实现：（1）通过图形完整性原则来说明数据的真实性；（2）通过设计原则实现的清晰和精确的可视化。

图形完整性原则涉及具有清晰，详细和彻底的标签，可用于防止图形失真和模糊。Tufte还将“谎言因素”定义为“描述图形中显示的效果大小与数据中显示的效果大小之间关系的值”。具体地说，数字的表示，就像在图形本身表面上测量的那样，应该与所代表的数量成正比。Tufte介绍的另一个设计原则是“数据墨水比”。Tufte将数据墨水称为“非可擦的图形核心”，非冗余墨水是为了响应数字的变化而排列的。从定义上说，非数据墨水是不传递信息的墨水，而是用于衡量尺度、标签和边缘。为了进一步扩展，数据墨水比率是“用于提供实际数据的墨水比例，与整个显示器使用的像素总量相比。”所有这些细节和目标的教训是，好的图形应该只包括数据墨水；应尽可能删除所有非数据墨水，以避免在演示文稿中引起注意力分散、无关的内容。其目标是设计一个具有最大可能的数据——墨水比率的显示器，而不会消除有效通信所必需的内容。

非数据墨水的概念也导致了避免“图表垃圾”的讨论。图表垃圾是图表和图表中的所有视觉元素，对于观看者来说，没有必要去理解图表上的信息，或者转移观众对这些信息的注意力。不需要的元素的例子包括重的或暗的网格线，不必要的文本，或不适当的复杂字体。有趣的是，有研究表明人们接受这种“极简主义”的信息可视化方法。与Tufte所写的不一致的研究表明，在某些情况下，图表垃圾被认为是有用和有效的。这些信息可视化学者认为，精化并非都是坏事，视觉修饰可能还有其他好处。特别是当使用图的目的是说服或演示时，它们应该被设计成帮助提供数据的可记忆性的特定目标。通过对现有研究的评价，支持数据图形必须引起读者的兴趣，这是通过使用图形图像来实现的。

三、信息可视化技术

当涉及到信息可视化时，有很多技术可以被利用。这些技术包括简单的图表，如条形图和线形图，以及更高级的技术，如热图和散点图矩阵。有些技术是为特定目的而创建的，因此很难对它们进行分类。在本节中，主要重点将介绍几种常用的信息技术。

（一）多变量数据

让我们从定义多变量数据开始，因为它是许多技术中常用的术语和概念。多变量数据指的是三维以上的数据。换句话说，在数据集中每个案例中有三个以上的变量。

可视化多变量数据的第一种方法是通过多个视图。使用这种技术，如果一个人不能在一个图中显示所有的维度数据，你可以尝试在多个图形中显示它们，每个图形都传递一个特定的信息。思想的逻辑进展是确定一种更直观的方式，使每个变量都有自己的显示，每个变量得到一个图并显示在对应的轴上，将多变量数据表示划分为数个子图，子图再将数据映射到二维平面上。虽然这种可视化技术易于实现和直观，但存在一个直接的缺点：随着变量数量的增加，每个变量所需的子图的数量也会增加。这增加了一次有太多子图的风险，这增加了影响判断的因素，使信息的理解和处理具有挑战性。

一种更复杂的可视化多变量数据的方法是使用散点图矩阵。散点图矩阵是可视化设计人员所钟爱的图形工具之一。散点图会呈现一个视觉显示，以捕获一对变量之间的相关性。给定一组n个变量，有n个选择2对变量，因此有相同数量的散点图。这些散点图可以被组织成一个矩阵，使得在一个地方可以很容易地表示和观察所有的成对关联。

另一种有趣的视觉形象被称为Chernoff Faces。赫尔曼·切尔诺夫是一位应用数学家、统计学家、物理学家和教育家，他发明了切尔诺夫脸谱，用人脸的形状来显示多变量数据。Chernoff在美国统计学会杂志上发表的论文中他建议简化，卡通形式的面孔形状能够代表数据集中的许多变量。如图2通过映射数字头偏心，眉形、眼大小，眼睛偏心率、瞳孔大小，鼻子大小，鼻子宽口曲率、口宽度，和嘴开放，能够达到视觉理解。Chernoff的脸谱帮助观众更快更准确地检测出模式、分组和相关性。这一理论建立在这样一个事实基础之上：人类的大脑有能力识别面部特征的细微差异，同时也能同时吸收许多面部特征。

当数据集由纯分类数据组成时，就会使用一种流行的可视化工具——马赛克图。镶嵌图让分析师可以检验两个或更多的分类变量之间的关系。马赛克图以长度为1的正方形开始，然后根据与第一个分类变量相关联的概率的比例水平划分。然后，每个水平的横条根据第二个分类变量的条件概率的比例，在垂直方向上进一步分裂。可以使用第三和第四个变量，等等。

类似马赛克图的可视化技术是treemap。Treemaps是理想的情况，在这种情况下，需要可视化大量的树结构（或层次结构）数据。treemap的空间首先被分割成矩形，这些矩形的大小和顺序都是基于一个数量变量。通过可视化嵌套的矩形来捕获treemap的层次结构。例如，代表一个国家的矩形可能包含代表该国的多个矩形。表示状态的每个矩形依次包含代表这些状态中的城市的矩形。可以使用许多不同的算法来确定treemap中矩形的大小和顺序，并考虑到treemapping的一般规则。一般来说，在treemap中，矩形的大小是:最大的矩形将被放置在左上角，最小的矩形将被放置在右下角，中间的所有东西都放在treemap的中间部分。当矩形被嵌套时，层次结构被呈现。

（二）平行坐标

另一个被广泛采用和有用的可视化技术是平行坐标。平行坐标是最著名的可视化技术之一，也是最常见的可视化学术论文主题之一。虽然一个人对平行坐标的最初印象可能是令人困惑的，一旦他们理解了，就很容易理解为什么他们是理解多维数字数据集的强大工具。如何通过一个例子更好地解释平行坐标的作用。图3显示了一个平行坐标的例子，其中包含了汽车变量的关系，包括每加仑（MPG）里程、气缸数、马力、重量，以及它们被引入的年份。在这个可视化中，每个汽车变量都被映射到一个垂直轴上。因此，每一个数据值都在直线上的某个位置上，并被缩放到位于底部的最小值和顶部的最大值之间。对于行中的每一个情况，数据点都是连通的，并构成折线。可以从这个可视化中获得有用的见解。例如，圆筒轴是值得注意的，因为它只有几个不同的值。由于柱体的数量只能是一个整数，在这个例子中只有8个值，所以所有的线都要经过一小部分点。在MPG和气缸之间的空间中，可以看出，八缸汽车的里程一般比六缸和四缸汽缸低。

线条的“外观”即它们如何交叉以及如何折叠，可以说明的不仅仅是数据。例如，线路的过度交叉是反向关系的指标；例如，汽缸越多，里程越低。在气缸和马力之间也可以发现类似的相关性：气缸越多，马力越大。还有一些交叉线表明，更多的汽缸并不总是意味着更多的权力；然而，总体趋势显然存在。在马力和重量之间，情况是相似的：更大的马力意味着总体上更重的汽车，但是在价值上存在一些差异。人们也可以看到，只有一个很轻的高马力八缸汽车是个例外。最后，重量和年份之间的界线十分交叉，这意味着多年来汽车变得更轻。

结论

经过几十年的信息可视化的快速变化，创造引人注目、视觉刺激的内容的能力比以往任何时候都要大。通过专门的努力，研究人员、学者和实践者已经开发出可视化的理论、技术、软件工具和应用程序，它们可以用于各种各样的目的，并且可以以一种引人注目的方式面向目标受众。为了最大限度地利用这些发现和技术，可视化学习者要思想开放，不断地寻找新的知识和技能，同时跟上潮流和变化这是很重要的。■