王怡人
摘要:本文首先对对大数据时代的数据可视化概念进行解读、辨析和研究,在理解了大数据与信息可视化的概念之后,阐述了国内外研究现状,总结现在已有的呈现方式、评估方式、技术手段和工具,提出了大数据时代下可视化所面临的挑战。
关键词:大数据;信息可视化;用户
数据信息可视化是近年来不断发展的交叉学科,是艺术和科技的融合。在如今信息爆炸的时代,人们接受数据的要求是快速、高效、准确的。设计师在设计一个好的数据可视化时,在符合信息真实性的同时,将大量的数据通过图像等手段将抽象难以理解的数据整理成受众方便理解的形式,涉及到计算机科学、统计学、艺术设计等各种学科领域。笔者在阅读了国内外多篇文献后将它们的各种理念,方法等总结如下。
1数据的含义 数据(Date),是用来描述科学现象和客观世界的符号记录,是构成信息和知识的基本单元。数据是没有进行加工处理的事实,也就是说单个数据之间互不相关,独立存在,人们用一定的方式将其排列或表达就使之间有了意义,供专业人员进行交流、描述、解读。
大数据是具有4个特点的数据——数据量大(Volume)、变化速度快(Velocity)、数据类型多样化(Variety)与价值密度低(Value)。从计算机技术的角度说,大数据是结构复杂、数量庞大、类型众多的数据集合。通俗来说,大数据就是海量资料。在效率至上的时代,其规模巨大而人工无法在较短的时间内采集、管理、处理、分析并整理出通俗易懂的内容。从而又孕育出大数据技术——处理、管理等大数据技术。
可视化,不仅仅是可以看见,更多的是指易于理解。是把复杂的、不直观的、不清晰、难于理解的事物变得通俗易懂,一目了然。以便于传播、交流和沟通,以及进一步的研究。可视化不限于视觉层面,除了结合国标、文字、表格、录像等形式、也可以结合听觉、嗅觉、触觉等感觉,并加入交互处理的技术,理论和方法,让用户易于理解。可视化注重视觉表达、交互方式和人类的心理感知,通过对心理学、图形设计等知识等合理运用来展现数据并有效传达其隐含意义。
2国内外研究现状
纵观最近几年的国内外大部分数据可视化的著作和论文资料,可视化在学术界的优秀成果,可以涵盖城市数据可视化科学可视化、图可视化、高维数据可视化、人机交互(HCI)、AR/VR、数据叙事、可视分析等多个方面。
数据可视化是从Date Visualization翻译而来。从Ben Fry的著作《可视化数据》,Nathan Yau的著作《鲜活的数据——数据可视化指南,Julie Steele和Noah lliinsky的著作《数据可视化之美》和Tufte、Few、cCandless等作家的可视化入门书籍中可以得到,如何发现问题、数据收集、可视化的分类和步骤、可视化工具的选取和应用技巧方面来对数据可视化技术的实际操作进行指导。国内的很多资料也都是从国外的网站、文献翻译而来的。含金量较高的学术论文往往是提出最新的高效算法和对其他相关技术的研发。在具体的可视化实现方面,在各个领域包括传统的医学、天文学等,新兴的社会媒体、人机交互、ARNR等领域,国内外都研究在逐步地深入研究。
随着时代与技术等发展,可视化是一个高度综合的交叉型领域,深度和广度都在不断的扩展。大量的研究专注于搜集和分析过去和现在的事件,研究如何利用现在科技更好的展示数据,优化人机的互动,较少有利用这些信息,来寻找未来可能发生的事情。除了让用户获取已有的信息,帮助用户及时发现之后发生的事情,对未来事件的识别和描述,让用户未雨绸缪,及时准备,应该是一个新的研究方向。
从最近的几场可视化研讨会上,我们可以了解到可视化前沿技术的发展状况,了解现在研究者的各种看法与观点。现在的研究内容,可以包括大规模科学数据可视化、城市数据可视化、灵活构建可视化、新闻数据可视化、生物医学领域数据可视分析、文化遗产应用数据可视化、理解和诊断深度学习模型等多种方向。
3呈现方式
可视化除了传统的桌面呈现方式之外,近年来,学术界又提出了多层次的可视化、富交互多角度探索,以及通过故事叙事的形式表现分析目标。
多维度可以表现在解释数据关联趋势的多种手段,而这些手段可以是地图、图表、图像、动画、标签云等。运用这些手段可以使可视化的过程更加直观化、关联化、艺术化,增加了用户与数据之间等交互性。现在,多变量可视化的研究,大量是平行坐标,散点图矩阵。研究同时还会伴随时空或层次的信息,表现这些层次上还需要努力。
富交互多角度方面,用户不仅可以在数据可视化平台上更加容易的理解数据所传达的信息,用户也成为改进优化的一种因素。了解数据可视化的人群不只限于数据可视化的用户,还有相当多的关注结果的观众。用户既是数据的提高者也是优化结果的观众。
随着技术的发展,交互技术和新的展示方式的发展,数据可视化已经不再局限在平面或桌面上。AR、VR领域的研究飞速发展,越来越多的可穿戴设备让人们可以身临其境的感受数据,深入理解数据。由此,也有一些研究人员开始研究更多自由度的交互和沉浸式的表现。
通过故事叙事的形式表现分析目标,将数据转化为视觉共享的故事。在可视化数据故事和一般数据可视化之间绘制一条线,缩小视觉数据故事的范围,从而促进通过数据可视化的讲故事讲解技巧进行更好的结构化讨论。考虑到将数据转换为视觉共享的故事以及更加集中的定义的整个过程,我们认为可以扩大视觉数据故事的研究范围。通过在视觉数据讲故事过程中追求这些新的研究途径,可视化可以使数据更加有效的讲故事。故事除了前面提到的线性叙述,更多的是非线性的叙述。是跳出时间先后顺序的叙事技巧。这种技巧多运用在文学、戏剧、电影、小说和电子游戏中。设计师需要多去研究交叉学科的知识。
动态图可视化,就是动态展现信息的图表,用户能与之交互的圖表。用户用手点一点,就可以看到自己想要了解的数据,并用动画的方式呈现出来。这样的图表,前期需要整理数据之间的相互关系程度,逻辑思想,现在有的分析方法可以分为small multiples和animation两类,当然还有其他的方式。实现震撼人心的视觉效果,也有不少工具可以使用——Processing,Ocam,Adobe premiere,Adobe effecto