基于平行坐标的地理空间元数据可视化检索研究

2015-03-28 06:11宋国民吴军珂黄丽华徐少坤
测绘工程 2015年5期
关键词:坐标轴检索可视化

宋国民,吴军珂,黄丽华,徐少坤

(1.信息工程大学,河南 郑州 450001;2.61512部队,北京 100088;3.61175部队,江苏 南京 210049)

近年来,得益于互联网、地理信息系统等技术的推动,人们对于地理空间信息的需求不断增大。对于地理空间信息的描述,通常使用地理空间元数据,其大多为专业知识的文本或数字的抽象化表示,非专业人员难以理解文本或数字背后隐藏的丰富信息,更无从知晓海量地理空间信息之间在特征、语义、内容等方面的关联关系。1989年,Robertson,Car d和 Mackinlay在科学可视化的基础上提出信息可视化的概念[1-2],目的在于利用计算机支撑的、交互的、对抽象数据的可视表示,来增强人们对这些抽象信息的认知[3]。目前,基于信息可视化的数据检索研究已经广泛展开,在信息检索、数据挖掘、数字图书馆等方面都取得较快的发展。本文通过引入信息可视化技术中的平行坐标方法,探究基于平行坐标实现地理空间元数据可视化检索的方法,以期提高数据检索和服务效率。

1 相关概念

1.1 地理空间元数据

地理空间元数据是用于描述地理空间数据集相关信息的数据,它可以对地理空间数据集的空间、时间、属性等信息以及数据集的获取、处理、使用等信息进行详细描述。基于地理空间元数据,用户可了解数据集的名称、质量和组织方式等详细信息,为实现地理空间数据的共享提供基础数据支撑。

地理空间元数据有两个特点:一是抽象性,即数据的表现形式为数字或文本,表现形式不直观;二是多维性,即元数据描述内容多样,其可以描述数据集的空间位置信息、数据生产信息、数据质量信息等等,要完整描述一个数据集往往需要几十甚至几百条元数据。如何基于抽象的、多维的地理空间元数据进行高效的数据检索服务,一直是实现数据共享待解决的问题。

1.2 多维信息可视化

信息可视化是将抽象信息用可视的形式表示出来,用于揭示抽象信息之间的关系和信息中隐藏的特征[4]。信息可视化结合诸多学科的理论和方法,可获取绝大部分具有非几何属性的抽象信息间的复杂关系。数据探索是信息可视化的核心,目的在于形象化地表达信息,发现新知识,识别信息在结构、模式、非规则、趋势等方面的规律[5]。当前,信息可视化的研究主要集中在层次信息可视化、多维信息可视化、文本信息可视化和Web可视化等方面[6]。

在信息可视化中,绝大部分的抽象信息是3维以上的多维信息。如何将多维度、多属性的信息以直观的形式加以表达是多维信息可视化的根本任务。多维信息可视化通常可采用平行坐标、散点矩阵、星状图和Chernoff脸谱图等方法[7]。其中,平行坐标已经成为多维信息可视化领域主要使用的方法之一,其可以很好地解决维数增加的问题,满足多维信息可视化的基本要求,目前已经被广泛应用于该领域。

1.3 平行坐标

平行坐标是一种在二维空间中采用多条等距离、垂直的平行坐标轴表示多维空间,通过平行坐标轴上的取值表示对应数据维属性的可视化方法(见图1)。平行坐标中数据关系的表达非常直观,易于理解,且信息量丰富,有助于发现大规模数据中多维属性之间复杂的关系[6-7]。平行坐标可用于高维、多元数据的可视化,如地理空间元数据。

图1 平行坐标

在地理空间元数据检索中,平行坐标将用户关注的元数据属性项映射为平行坐标轴,根据元数据属性项的关注程度设置相应的坐标轴顺序。检索结果以各个坐标轴上属性值的连线显示。用户可交互式地添加或删除元数据属性项对应的坐标轴,以对检索结果进行过滤筛选。当检索结果数据量比较大时,坐标轴之间的连线可能比较密集,要素间的关系会模糊不清,可对连线进行半透明化处理,连线颜色的深浅可反映元数据的趋势特征;当数据量较少时,平行坐标有利于用户快速查找所需的数据[8]。

2 技术实现

2.1 可视化方法

平行坐标属于几何转换技术的一种,是对传统坐标系统的扩展。其原理就是对多维数据集的属性进行几何映射,使其转换成二维平面或三维空间可以表达的形式,采用的是一种数据降维的思想[9]。

平行坐标的实现思路如下:在具有X轴和Y轴的二维平面中,等间隔放置n条垂直坐标轴Y轴,分别记为x1,x2,x3…xn,每个Y 轴上放置一维属性项,各Y轴的取值范围是对应属性项的最小值到最大值,各属性值均匀分布在对应的Y轴上。这样,每一条数据记录都可以用一条折线表示到n条平行坐标轴上。假设一条地理空间元数据记录有n个属性项(n个维度),其属性值为(C1,C2,C3…Cn),则其在平行坐标上的表示如图2所示,折线可表示为P(C1,C2,C3…Cn),其n个顶点分别位于xi轴上的(i-1,Ci)。图3是基于平行坐标绘制的10条6维(6个属性项)地理空间元数据记录的效果。

图2 平行坐标绘制原理

2.2 交互技术

平行坐标的基本思想是将多维信息映射到二维平面上,解决多维信息的显示问题,加以设计合理的交互方式,可以方便用户根据需要在检索结果的基础上挖掘更多的信息。应用于平行坐标的交互技术主要有刷取技术、维数控制、维度缩放、坐标轴交换等。

2.2.1 刷取技术

图3 多维地理空间元数据可视化效果

刷取技术是一种突出显示某个数据子集的可视化技术。其根据用户的操作,动态地更新交互结果,其中图形重绘是主要的方式,且图形重绘要及时并且使重绘后的结果更加直观[10]。例如,图形的高亮显示是平行坐标中常用的交互方式,当鼠标移至某条记录数据的折线时,折线会变粗或者改变颜色以突出显示该条记录。刷取技术可以使用户更清晰地了解局部数据的变化规律,着重分析用户所关注的内容。

2.2.2 维数控制

如果用户不关注某些属性项,可忽略表示这些信息。在平行坐标中,可以通过控制数据属性项的数量,即控制平行坐标轴的维数,只将用户关注的属性表现出来,这样既可以减小平行坐标的复杂度,又可以减少不重要数据对显示结果的干扰,使用户更容易对数据进行分析[11]。

2.2.3 维度缩放

当用户关注的属性项过多或较少时,平行坐标的坐标轴(即相应的维度)会相应地增加或减少,出现坐标轴过于密集或分散的情况,这会影响可视化的效果。维度缩放是用户通过鼠标拖拽,对坐标轴之间的距离进行适当调整的人机交互方式,这种交互可以使视觉效果更加明显[12]。

2.2.4 坐标轴交换

坐标轴交换是指用户通过人机交互操作,调整各属性项对应坐标轴之间的顺序关系。通过坐标轴交换,可以将用户重点关注属性项的坐标轴前移,或把用户认为属性关系较密切的坐标轴相邻,更好的呈现属性间的关系,方便用户挖掘更多的信息。

2.3 特点分析

平行坐标相较于传统的地理空间元数据的可视化方法有着明显的优势。其优点主要有:

1)平行坐标与传统直角坐标相比最大的优点是对维度无限制。在传统的可视化方法中,当数据维度较多时,就会出现视觉混乱,可视化的效果会大大降低。平行坐标则十分直观,不会因为数据维度的增加而无法显示。

2)平行坐标具有良好的数学基础。坐标轴的对称性可以确保各数据维度的均匀分布,由多维到二维的独特映射让用户关注的每项数据都能充分显示,适合进行可视化的数据分析。

3)可视化的图形简单明了,易于理解。每条数据记录以折线的形式显示,折线与坐标轴的交点即为数据项在该轴上的属性值。

与此同时,平行坐标也存在一些需要解决的问题:

1)当用户关注的数据维度(属性项)较多时,容易导致垂直坐标轴之间距离较近,辨认数据项的结构和关系时会比较困难。另外,当查询检索得到的记录较多时,会出现图形重叠、层次不清的情况,使用户难于识别,如图4所示。

图4 检索记录较多时的平行坐标效果

通常可采用维数控制调整用户关注属性项的数量,或采用维度缩放技术调整用户关注属性项的坐标轴距离,并通过分层方式组织数据集,解决多维度、多记录信息可视化的效果问题。

2)折线的意义较单一。各平行坐标轴之间的连线只是简单的折线,除了能表示一条数据记录之外,无法承载更多的含义,这样往往会导致用户因为折线的波动而影响对数据的分析和理解。

3)从整体的角度分析数据方面有所欠缺,也不能反映出局部的变化趋势。

3 原型系统设计与实现

3.1 检索流程设计

基于平行坐标的地理空间元数据可视化检索原型系统的检索流程如图5所示,其主要步骤包括:限定检索范围及关键词(元数据属性值)、可视化要素选择(选择关注的元数据项)、可视化映射、交互操作、得到检索结果(地理空间元数据或数据集)。

图5 原型系统检索流程

3.2 系统环境

利用Microsoft Visual Studio 2010编译平台,结合 WPF(Windows Presentation Foundation)开发包,构建基于平行坐标的地理空间元数据可视化检索原型系统。原型系统的框架如图6所示,系统主要由3部分组成:①数据检索窗口;②可视化要素选择窗口;③检索结果绘制及交互窗口。实验数据为我国1∶100万、1∶25万矢量地图的元数据信息。

图6 原型系统界面及实验结果

4 结束语

平行坐标是一种用于表达多维空间中点的几何投影方法。多维地理空间元数据的数据集是由多维空间中多变量函数的多个取值点构成的数据集合。平行坐标可以把多维地理空间元数据的数据点映射到二维空间中,而且不受维数的限制,可有效解决多维地理空间元数据可视化的问题。

[1] ROBERTSON G,CARD S K,MACKINLAY J D.The Cognitive Co-processor for Interactive User Interfaces[A].ACM SIGGRAPH sy mposiu m on User interface soft ware and technology[C],New Yor k.1989:10-18.

[2] 董士海,王坚,戴国忠,等.人机交互和多通道用户界面[M].北京:科学出版社,1999.

[3] 周宁,张玉峰.信息可视化与知识检索[M].北京:科学出版社,2005.

[4] 刘庆元,易柳城,刘莉.基于diamond square算法的数字地形模型构建与三维可视化研究[J].测绘工程,2014,23(2):1-4.

[5] 袁国明,周宁.信息可视化和知识可视化的比较研究[J].科技情报开发与经济,2006,16(12):93-94.

[6] 徐少坤.地理空间元数据可视化研究与实践[D].郑州:信息工程大学,2013.

[7] 徐少坤,宋国民,王海葳,等.基于信息可视化技术的地理空间元数据可视化研 究[J].测绘工 程,2013,22(3):83-87.

[8] 徐少坤,宋国民,陈令羽,等.多维可视化技术在地理空间元数据检索中的应用研究[J].地理信息世界,2013,20(1):46-50.

[9] 钟志文.基于平行坐标的关联规则挖掘技术可视化研究与实现[J].常州工学院学报,2012,25(2):29-33.

[10]周晓峥,刘勘,孟波.多维数据集的平行坐标表示及聚簇分析[J].计算机工程,2002,28(1):94-95.

[11]董军凯.基于平行坐标法的可视化数据挖掘技术研究[D].北京:北京工业大学,2008.

[12]路燕梅.基于平行坐标的可视化多维数据挖掘的研究[J].现代计算机:专业版,2011(20):16-19.

猜你喜欢
坐标轴检索可视化
基于CiteSpace的足三里穴研究可视化分析
思维可视化
用坐标轴平移妙解斜率和(或积)为定值问题
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
专利检索中“语义”的表现
巧用仿射变换妙解高考解析几何题
国际标准检索
国际标准检索
数学问答