基于数据相似度的多维海洋数据交互式集成可视化

2015-03-22 02:36聂俊岚陈贺敏张继凯郭栋梁
海洋通报 2015年5期
关键词:对虾条带可视化

聂俊岚,陈贺敏,张继凯,郭栋梁

(1.燕山大学 信息科学与工程学院,河北 秦皇岛 066004;2.燕山大学 河北省计算机虚拟技术与系统集成重点实验室,河北 秦皇岛 066004)

随着海洋探测手段的不断进步,人类获取的海洋数据规模正在呈指数级增长,数据复杂性也越来越高。探索海量多维相关数据的内在联系已成为知识发现、信息认知和信息决策过程的必要步骤。作为一种有效的抽象信息展现手段,多维数据可视化技术被广泛应用到海洋可视化领域。并且,针对多维海洋数据的表达,探究多维要素之间的相互关系将成为今后的研究方向(刘健等,2014)。

近年来,在多维海洋数据可视化信息挖掘方面,国内外学者进行了大量研究,主要集中在数据模型的提出(Liu et al,2010;Song et al,2010)与可视化系统的建立(覃如府等,2009;Zhang et al,2011;李新放等,2012)等方面。另一方面,Dennis 等(2005)采用数据特性映射的方式将多种数据属性分别映射为不同的视觉特征(如色彩、亮度、大小等);类似地,陈超等(2012)采用多重纹理映射技术将海底底质纹理映射到地形模型上。两者均实现了多维数据元素以不同的形式同时展现,便于从整体上把握各维数据的分布情况。更进一步,为了实现登岛作战中的登陆地域可行性评估,张立华等(2009)将海底的坡度、底质以及海流海浪等地理要素进行综合考虑,实现各要素数据的集成可视化,对数据信息进行更深层次的挖掘,从而为分析过程提供了可靠的理论依据。

在多维数据的集成可视化中,是否具有良好的交互手段往往是衡量一种可视化形式的重要标准。平行坐标(Inselberg et al,1990)可将高维数据集映射到平面的一系列平行坐标轴上,成为表现多维数据时最常用的一种可视化工具。近两年,郭翰琦等(2011;2012)借助平行坐标,并将基于多维尺度的维度投射嵌入其中,完成多维传递函数的设计,实现了多种多变量体数据的可视化。在进行体可视化时,Kuhne(2012)在颜色混合过程中如何尽量保留基础色调的问题上进行了深入研究,提出一种数据驱动的色调保留颜色混合算法,并将其应用到条带式平行坐标中,使得颜色条带的层次得到很好地保留与呈现。然而,在大多数基于平行坐标的实际应用中,比较看重的是各条带所承载的数据信息的表达,而并不是条带的展现层次。鉴于基于平行坐标的多维海洋数据集成可视化研究旨在数据信息的有效表征,所以承袭Kuhne 等人对条带重叠部分进行颜色处理的思想,并对其方法进行简化和扩充,选择基于alpha 混合的迭代方式对重叠颜色进行混合,并引入数据集相似度的概念,通过重叠区域的颜色亮度改变实现其可视化,以细化信息展现层次,提高可视化结果的信息承载量。

1 迭代式alpha 颜色混合

从各维数据的交替显示到依靠不同视觉编码的叠加呈现,再到按需进行的集成可视化,这一过程体现了针对多维海洋数据可视化研究的层层深入和数据信息挖掘的层层递进。本文的研究则建立在集成可视化层次,以平行坐标作为数据集选择工具,以不同的颜色条带分别代表不同的选择结果,并通过对重叠区域做颜色处理,利用得到的混合色表征该区域的实际数据含义。

平行坐标作为集成可视化过程的交互接口,用于感兴趣数据集的选取与展现。由于其中的各个条带都具有不同的坐标范围,与之对应的实际空间数据也就有一定的实际含义。当两条或多条条带发生重叠时,该重叠部分可能具有更深层次的实际意义,例如代表两个数据集的交集,即同时满足两组选择条件的数据集。

但是,当重叠区域是由如图1 所示的部分维度相交所产生时,该区域的意义就会产生二义性,既可表示数据集1 中前3 三个维度满足数据集2 的部分数据,还可表示与此相反的意思。因此,为了避免该二义性,本文对每个数据集赋予一个唯一的优先级,令条带重叠部分的数据集具有如下特点:(1)完全属于相关集合中优先级最高者;(2)只有部分属性满足其他集合。

图1 平行坐标中条带部分属性重叠示意图

在传统的平行坐标中,各条带间的颜色渲染是通过固定图形管线进行处理,其生成的混合色总是与后绘制条带的颜色比较相近,如图2(a)所示,所以当条带较多时很容易产生颜色混淆,无法实现不同数据集的有效区别表征。为了能从混合色中同时看出各基础颜色,同时考虑优先级顺序,展现条带叠加的层次性,本文提出基于式(1)的迭代混合方式:

迭代算法的具体实现伪代码如下所示:

Function 计算某一像素点的颜色值

设颜色Cr=vec4(0.0,0.0,0.0,0.8);

For i=1 to n-1 (n=经过该像素点的条带数)

(Ci和αi分别表示第i 条条带的颜色值及不透明度)

End For

像素点的颜色为Cr

End Function

按照优先级从高到低的次序,红、蓝、绿三基色经过迭代式alpha 颜色混合处理后的效果如图2(b)所示。可以看出,采用本文方法生成的混合色,能与基础色有效区分的同时还体现出数据集的优先级别,即混合色总是偏向相交数据集中代表优先级较高者的条带颜色。如此,不仅能够实现不同数据信息的区别表征,并且还能很好地展现数据集之间的相互关系。

图2 颜色混合结果

2 数据集相似度表征

2.1 数据集相似度形式化定义

在数据的集成可视化中,多个数据集间可能出现重叠和相交,为了对这种关系进行量化和表征,引入数据相似度概念。数据集相似度在聚类问题中比较常见,并且通常将空间距离考虑其中,在一些文献中也可以找到有关相似度的定义(谢明霞,2012;邓冠男,2013)。通常,具有相似属性的个体会存在较大的关联。掌握了数据集的相似度,不仅能够推测两者的关联程度,并且还能据此快速找到同时考虑各种情况下的最佳解决方案,从而帮助决策者从众多信息中迅速找到感兴趣的信息,并作出正确的决策。

本文的数据集相似度是从数值上进行考量的,仅与数据集间的相交维数以及每一维的相交比例有关,且应具有如下规律:

(1)在相交区域比例不变的情况下,相交维数越高相似度越高。

(2)在相交维数不变的情况下,相交区域比例越大相似度越高。

(3)相交维数对相似度的影响因子大于相交比例。

按照以上规律,本文对数据集相似度做出如下定义:

定义1.定义SD 表示两数据集的相似度,并且令

其中,N 表示数据维数,xi3和xi4表示两数据集在第i 个属性上并集范围的阈值,而xi1和xi2则表示两数据集在该属性值上交集范围的阈值。

2.2 相似度表征算法

为实现多维数据集成可视化的同时体现出所选数据集的相似程度,通过多种亮度级别的一系列颜色对其进行表征,随着条带间相似度的增大,重叠部分的颜色亮度逐渐变低。以两条相交条带i 和j为例,表征其相似度所用颜色值的具体计算过程如下述伪代码所示:

Function 计算用来表征数据集相似度的颜色值

设两条带经过上述颜色处理后的混合色为Cij

For i=1 to N (N 为平行坐标中坐标轴的数目)

计算每维属性的相似度

其中函数RGBtoHSL(r,g,b)表示将RGB空间的颜色值转换为HSL 空间的颜色值,而HSLtoRGB(h, s, l) 则反之。通过颜色空间RGB 与HSL 之间的相互转换,在保留混合色色相与饱和度的情况下,完成基于数据集相似度的颜色亮度改变,生成一系列不同亮度的混合颜色以实现相似度的表征,从而丰富了可视化结果,有效提高了其信息承载量。可视化效果如图3 所示。

图3 数据集相似度的可视化效果

3 实验结果及分析

本文在Windows7 操作系统下使用OSG 三维图形引擎以及GLSL 着色语言进行多维要素数据的交互式集成及其相似度表征。所用硬件环境为Intel i7-4770k 3.5GHz,16G RAM,显卡为NVIDIA GTX780TI。本文选取全球海洋某一时刻的温度、盐度、溶解氧、表观氧和饱和含氧量这五维作为实验数据,经度范围为180°W-180°E,纬度范围为90°S-90°N,分辨率为3 600×1 800,实验中的所有数据都被规范化至[0,1]。

在结果显示方面,本文方法将各维海洋数据分别保存成二维纹理传入GPU 中进行并行计算,并通过基于矩形网格的坐标变换实现可视化结果的球面显示。而在交互方面,用户通过鼠标拖动,既能改变坐标轴排列次序,又可以根据鼠标所在点实时显示的属性值确定各条带的范围,以实现各属性区间的选择。

3.1 颜色混合结果分析

采用迭代式alpha 颜色混合方法对平行坐标中条带重叠区域的颜色进行处理后的效果如图4(b)所示。图4(a)并没有对平行坐标中条带重叠部分的颜色进行处理,只是由固定管线混合而成,没有考虑其实际含义,在地理空间上也并未进行映射显示。与其相比,本文方法除了能够使用不同颜色条带表示满足不同标准的数据集,还能够通过新生成的混合色表示同时满足两种标准的数据集,即两颜色条带的重叠部分所代表的含义,在有效提高可视化结果信息承载量的同时,还能够辅助任务分析或决策人员在综合考虑各种问题标准的情况下得到最佳的解决方案。

图4 颜色混合前后的效果对比

3.2 数据集相似度表征结果分析

为了细化信息展现层次,进一步提高可视化效果的信息承载量,本文引入数据集相似度的概念,并对其进行了表征,效果如图5 所示。其所展示的是两数据集在不同情况下的相似度大小及其表征。图5(a)表示有两个属性相交时的相似度,图5(b)表示相交属性数增为4 的情况,而图5(c)是在图5(b)的基础上改变数据集相交面积比例后的相似度。可以直观看出,图中从(a)到(c)相交区域的颜色亮度依次降低,这表示随着相交维度的增加和相交面积所占比例的增大,数据集的相似度均会增大。如此,通过不同亮度的一系列颜色对数据集的相似度进行表征,能够给用户留下直观的印象,方便其掌握所需数据集相似度情况,为相关工作的开展提供可靠的理论指导。

图5 相似度表征结果对比

3.3 案例—影响海洋生物分布的多维地理因素可视分析

此案例研究的是温度、盐度、溶解氧和PH 值这四维地理因素对海洋生物分布的影响。中国对虾、日本对虾以及斑节对虾这3 种生物对这四维要素的要求如表1 所示。而其集成可视化结果则如图6 所示。其中,红色(1)、蓝色(2)、绿色(3)标识的空间分别表示适合中国对虾(A)、日本对虾(B)、斑节对虾(C)生存的区域,而由红色和蓝色混合而成的4 号色表示适合A 和B 共同生存的区域,红绿色混合而成的5 号色代表适合A 和C 共同生存的区域,红蓝绿混合而成的6 号色则表示3 种对虾可以共同生存的地域。

表1 不同生物种类对相关因素的要求

可以看出,在只考虑温度、盐度、溶解氧和PH 值四种环境因子的情况下,中国对虾除了中国沿海地区,在南半球的大陆沿海地区也可以生存,并且中国东海和南海也分别有一定的区域范围比较适合日本对虾和斑节对虾生活;日本南部海域的环境能基本满足3 种对虾共同生存条件;三者之中,中国对虾与斑节对虾的生活环境更为相似。

如同此案例的分析方式,在实际应用研究中,通过本文方法,可以将多维抽象数据以集成的方式直观展现,能充分挖掘出数据中的隐藏信息,并且随着数据维度的增多,所呈现的区域信息会越来越准确,为实际问题的解决提供了一种快速、有效的分析手段。

4 结论

本文在基于平行坐标的多维海洋数据集成可视化过程中,以颜色条带的方式表示感兴趣数据集,并对条带重叠部分的颜色进行迭代式alpha 颜色混合处理,通过生成新的混合色将重叠部分所代表的特定含义表征出来,在扩展平行坐标展现信息能力的同时对数据中的隐藏信息进行了更深层次的挖掘。在此基础上,为了细化信息展现层次,引入数据集相似度的概念,并同样通过数据实时传递及信息映射实现其可视化,使得所展现的数据信息更加细致、全面,进一步提高了可视化结果的信息承载量。

图6 海洋生物分布的集成可视化结果

本文方法只考虑了标量场数据,适用范围还存在一定的局限性。接下来,将引入风场、流场等矢量数据进行研究,拟将场强大小映射为平行坐标中的坐标轴,并将矢量场的流线可视化结果融入进来,通过平行坐标控制流线的颜色,实现多维标矢量场数据的交互式集成可视化,以扩展该方法的适用范围。另外,该方法要求用户具有一些关于颜色混合的先验知识,未来将继续探究更加直观的颜色混合方法,尽量满足更多用户的需求。

Dennis B,Kocherlakota S, Amit S, et al, 2005. Designing a visualization framework for multidimensional data. Computer Graphics and Applications,IEEE,25(6):10-15.

Hanqi G,He X,Xiaoru Y,2011.Multi-dimensional transfer function design based on flexible dimension projection embedded in parallel coordinates.PacificVis,IEEE,19-26.

Hanqi G,He X,Xiaoru Y,2012.Scalable Multivariate Volume Visualization and Analysis Based on Dimension Projection and Parallel Coordinates.Visualization and Computer Graphics,IEEE Transactions on,18(9):1397-1410.

Inselberg A,Dimsdale B,1990.Parallel coordinates:a tool for visualizing multi-dimensional geometry.Visualization'90.,IEEE,361-378.

Kuhne L, Giesen J, Zhang Z, et al, 2012. A Data-Driven Approach to Hue-Preserving Color-Blending. IEEE Transactions on Visualization and Computer Graphics,18(12):2122-2129.

Liu J, Zhang X, Jian X, et al, 2010. Research on marine environmental data management in China digital ocean prototype system. IGARSS 2010,IEEE,2318-2321.

Song Y, Gong J, Zuo Z, et al, 2010. Data integration and visualization:Dealing with massive and multi-dimensional marine spatial data.CISP2010,4:1620-1623.

Zhang F,Li H,Liu J,et al,2011.Research and realization of visual digital ocean system.Marine Science Bulletin,(1):87-96.

陈超,王文珂,王怀晖,等,2012.一种海底地形与底质的三维融合可视化方法.系统仿真学报,(9):1936-1939.

邓冠男,2013. 聚类分析中的相似度研究. 东北电力大学学报,(Z1):156-161.

李新放,刘海行,周林,等,2012.基于OpenSceneGraph 的海洋环境三维可视化系统研究.海洋科学,(2):54-58.

刘健,姜晓轶,范湘涛,2014.海洋环境信息可视化研究进展.海洋通报,33(2):235-240.

覃如府,叶娜,许惠平,等,2009.GIS 系统中多维海洋数据可视化研究.同济大学学报(自然科学版),(2):272-276.

谢明霞,郭建忠,张海波,等,2010.高维数据相似性度量方法研究.计算机工程与科学,(5):92-96.

张立华,刘雁春,朱庆,等,2009.基于多元要素集成的登陆地域可视化评估方法.火力与指挥控制,34(3):33-35.

猜你喜欢
对虾条带可视化
对虾养殖弱势群体的管理
基于CiteSpace的足三里穴研究可视化分析
对虾吃料慢的原因分析和处理
思维可视化
对虾免疫增强剂研究进展
对虾常见环境性疾病的防治
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
华北地区地震条带的统计分析
采用变分法的遥感影像条带噪声去除