徐少坤,宋国民,王海葳,陈令羽
(1.信息工程大学 地理空间信息学院,河南 郑州 450052;2.75719部队,湖北 武汉 430074)
地理空间元数据有助于用户从海量数据中快速、准确地发现、访问、获取和使用所需的数据。元数据的自动搜索方法可以提高数据的使用效率,但也存在以下不足:搜索的结果通常以列表的形式显示,用户还要在搜索结果中进行“二次检索”;当用户不能准确描述所需信息时,无法获得数据的整体概况。提高元数据搜索的可用性和有效性已成为一个突出问题。
信息可视化将元数据集的空间、属性和时间的外部形式和内部特征等抽象数据,以人能感知的形式表现出来。用户可以选择合适的元数据要素来探索和比较不同的数据集,同时改变参数来浏览所有可用的元数据资源,提高检索效率。
信息可视化(Information Visualization)是将抽象数据用可视的形式表示出来,用于揭示抽象信息之间的关系和信息中隐藏的特征[1]。Card等人提出了信息可视化的参考模型(见图1),将可视化概括为从数据到可视化形式再到人的感知系统可调节的映射[2]。数据检索是信息可视化的核心,目的在于形象化地表达信息,发现新的知识,识别信息在结构、模式、非规则、趋势等方面的规律。
图1 信息可视化参考模型
信息可视化作为可视化研究的新领域,广泛应用于知识发现、信息检索、数字图书馆和信息理解等方面。综合起来,其研究主要集中在以下几个方面。
1)层次信息可视化。层次信息可视化最直观的形式是树型结构。其研究重点在于既要获得整体层次结构,又要便于快速查找所需节点,并用更多的可视空间来显示用户关注的信息。应用广泛的有圆锥树、双曲线树、圆形嵌套[3]等。
2)多维信息可视化。将多维度、多属性的信息映射为直观的形式是信息可视化的重要目标。特别是在数据仓库和信息挖掘中,一般采用坐标变换、嵌套以及多视图等技术将多维信息映射到二维平面或三维空间中[4]。代表性的有散点图、平行坐标和自组织映射[5]等。
3)文本信息可视化。利用可视化技术快速地从海量文本信息中获取所需的内容和知识,也是信息可视化关注的目标。根据文本内容的大小,文本信息可视化分为单文档可视化和大型文档集合可视化。
4)Web可视化。Web信息空间呈网状结构,Web可视化的研究内容包括信息搜索的可视界面、网页导航和布局以及网络节点的动态显示和交互控制[6]。根据网站的规模,Web可视化可分为单网站可视化和网站集合可视化。清华大学网站可视图是比较典型的Web可视化例子[7]。
地理空间元数据是指地理空间数据集和相关信息资源的描述信息,是对空间特征的概括和抽取[8]。许多国家、研究机构都制定了相关的元数据标准,代表性的有美国联邦数据委员会起草的CSDGM和国际标准化组织制定的ISO/FDIS 19115。
大部分的元数据服务仅作为一个功能模块集成在各种GIS平台上,只提供简单的数据查询与显示服务。将可视化应用于地理空间元数据服务是一个新思路,国内在这方面的研究较少。应用成熟的有“香港赛马会滑坡防治与咨询中心”项目,该项目将元数据信息以图的形式表达出来,使用户提前知道所需数据的存在状况[9]。
国外的地理空间元数据服务发展比较成熟,在理论模型、可视化技术和应用工具等方面已进行深入研究。Card等人认为:“元数据与其他知识结构中的复杂数据,都是高维多变量的,信息可视化技术可以辅助其发现规律”[10]。Kraak和Ormeling提出地理空间元数据的可视化环境体现在3个方面:地理可视化、多元可视化及设计以人为中心的可视化[11]。Yang,Ward和Rundensteiner等提出交互式层次显示技术将是海量数据显示的有效工具[12]。
在地理空间元数据可视化设计过程中,任务需求、用户和元数据规格参数是影响数据搜索的3大因素[13]。
1)地理空间元数据可视化的任务需求。用户不同的任务需求,对元数据的关注点和要素的选择也不尽相同。在元数据的搜索过程中,这会影响可视化表现形式、可视化应用模式和搜索精度。用户在评价某一数据集是否满足需求时,需要权衡多个准则进行判断,不同的任务需求,决定因素和要素的权重值也各不相同[14]。比如,以研究分析为目的,会注重于数据的现势性和真实性;以量测为目的,会注重于数据精度和空间准确性;数据的管理则更关注管理成本和用户权限。
2)地理空间元数据服务的用户。大部分的元数据用户也是GIS应用程序的用户,这些用户涵盖从商业程序的最终用户到新环境、新语言的研究者。另外,程序和软件开发者、数据管理者、数据生产商也会使用元数据。针对各种类型的用户,分析其需求和关注点,以满足其不同层次、不同阶段的服务需求。
3)地理空间元数据的规格参数。为满足广泛的应用需求,地理空间元数据标准制定了详细的元数据要素。但并不是所有要素都有明确的意义,都值得用户去关注。要根据用户类型和任务需求,结合元数据的规格参数,分析用户可能关注的元数据要素,并提供相似的要素满足其潜在的需求。
地理空间元数据的可视化技术,根据元数据要素的个数可分为单要素可视化和多要素可视化。
2.2.1 单要素可视化技术
地理空间元数据单要素的可视化,可以采用传统的信息可视化方法,如条形统计图、柱状图、折线图、饼图、散点图、颜色编码等。
对于简单的二维数据,散点图(scatterplot)是比较常见的可视化方法。例如,2个元数据要素,可以映射为二维坐标上的一系列点,进而获得数据的整体趋势。柱状图是数据比较的有效形式,能直观地显示单一要素的分布情况,不同颜色的柱状更利于数据的快速选择和整体趋势的有效反映。
单要素可视化形式多样,结构简单。可通过分析各种形式的特点,对元数据单要素采用合适的表现形式;同时可将多种可视化形式组合起来,为用户提供潜在的、相关的信息。
2.2.2 多要素可视化技术
地理空间元数据多要素可视化一般是指3个或3个以上元数据要素的可视化,其表现形式要求既能清晰地反映大数据集的整体趋势,又能快速查找所需的元数据。可应用于地理空间元数据可视化的技术主要有以下几种:
2.2.2.1 多维可视化技术
1)散点图矩阵。对散点图进行适当的改进,可用于元数据多要素的可视化表达。其中一种方法是把元数据的每个要素,用不同的图形、颜色、纹理等表示在二维坐标上。
散点图矩阵(见图2)也是一种有效的可视化方式。它将元数据多个要素两两组合作为矩阵中的一个元素,在每一矩阵中绘制相应要素的散点图,从各个要素属性的两两比较中得到隐含的信息。散点图矩阵是区别元数据整体趋势和局部特征的简单方法,能直观地解释所有任意2个要素之间的关系,而不受数据集大小和要素个数的限制[5]。
图2 散点图矩阵
2)平行坐标。平行坐标(见图3)是在二维空间中采用等距离、竖直多条平行坐标轴表示多维空间,坐标轴取值范围从相应数据维属性的最小值到最大值均匀分布。平行坐标中数据关系的表达直观,易于理解,有助于发现大规模数据之间复杂关系。
图3 平行坐标
平行坐标将用户搜索的元数据要素映射为平行坐标轴,根据关键词的重要性设置相应的坐标轴顺序。搜索结果以各个轴之间的连线显示,用户可交互式地添加或删除要素。当数据量比较大时,坐标轴之间的线可能比较多,要素间的关系会模糊不清,可对线进行半透明化处理[15],其颜色的深浅反映元数据的趋势特征;当数据量较少时,平行坐标有利于用户快速查找所需的结果。
散点图和平行坐标的结合可以获得整体趋势和局部特征的优化形式。在平行坐标轴之间显示散点图,轴之间的直线变成穿过散点图的曲线,这样既保持了平行坐标里的连接关系,又能用散点图表示平行坐标里无法表现的数据趋势[16]。
2.2.2.2 图标显示技术
基本思路是用多个可视特征图标来表示多维信息,图标每一个可视特征表示多维信息中一维,该方法适合为数不多并且在二维平面上具有良好展开特性的数据集[5]。常用的图标显示技术有Chernoff面法和星绘法。Chernoff面法中面部表情不适合量化分析,并且容易干扰用户对数据的理解,所以Chernoff面法在元数据可视化方面应用较少。
1)星绘法。星绘法(见图4)是从一点向外等角度地绘制发散的线段,线段的长度表示要素属性值的大小,连接各条线段的终点形成星状的图形。元数据多要素可视化时,将要素的属性值对应为辐条的长度,数据集以相应的星状图表示。星状图越完整,形状越大,表示数据越符合设定的需求。
图4 星绘法
Elena,Fanea等提出了Parallel-Glyphs方法[17],将星绘法与平行坐标结合起来,取得了较好的可视效果。
2.2.2.3 层次可视化技术
对于海量数据的表达,层次可视化技术是显示不同层次、大规模数据的有效工具。层次可视化技术可以为某个主题的要素属性提供相关信息的整体概览,并将更多的可视空间分配给用户关注的部分分支。应用比较广泛的有空间树和双曲线树。
1)空间树。空间树(见图5)是采用点—线形式和收缩—展开方法来实现层次结构的可视化技术[3]。当用户点击相应分支时,就展开下一级分支信息,可用颜色和形状标记焦点和根节点之间路径。
图5 空间树
2)双曲线树。双曲线树(见图6)是一种利用双曲平面布局和“焦点+上下文”的可视化技术,将用户关注的细节显示在平面中心,保证整个层次结构的完全显示。例如,对“延坪岛炮击事件”进行可视化,可将延坪岛作为根节点,其海岛地理位置、地形状况和周边海域水文状况等都可以作为其子节点,子节点可继续扩展到军事设施分布、数据更新时间、数据来源等下一层次信息。用户点击相应节点可使其显示在中心位置,获得放大的局部信息。
图6 双曲线树
地理空间元数据可视化应用流程可以描述为“先总体浏览,再移动和过滤,最后放大所需信息”。如图7所示,图7中a表示用户在使用地理空间元数据库时,首先会限定搜索范围,如用户输入感兴趣区域的名称或在地图上选择特定的位置或范围。在搜索结果中,用户可根据需要在界面上选择关键的元数据要素,确定优先考虑的选项(见图7中b)。系统会根据用户选择的要素,绘制所需元数据要素的可视化视图,其中图7中c显示了星绘法和平行坐标法2种可视化形式。用户可以交互式地刷新和选择元数据视图,也可以根据需要打开或关闭不同的可视化视图,直到找到合适的数据集,并在地图上研究其地理内容。数据集的内容以图像和文本元数据的形式提供给用户,图7中d显示了地图和元数据要素列表两种形式。
图7 地理空间元数据可视化应用流程[13]
随着测控技术和互联网络的发展,人类获取的空间信息数量呈几何级增长,丰富的空间信息资源促进基础地理信息建设和元数据服务的日益完善。因此,面对海量数据,高效、准确的空间数据检索将是影响数据服务和信息共享的重要因素。
信息可视化技术作为揭示抽象信息之间关系和特征的有力工具,有助于提高元数据服务的有效性和可用性。元数据服务的发展趋势将以信息可视化技术为基础,结合地理空间元数据的特点,分析元数据可视化的影响因素和应用流程,为不同类型、不同需求的用户,提供高效可靠的解决方案。
[1]冯艺东,汪国平,董士海.信息可视化[J].工程图学学报,2001(2):324-329.
[2]Card S,Mackinlay J,Shneiderman B.Readings in information visualization:using vision to think[R].San Francisco:Morgan Kaufmann,1999.
[3]肖卫东,孙扬.层次信息可视化技术研究综述[J].小型微型计算机系统,2011(1):137-146.
[4]程时伟,孙守迁.信息可视化研究综述[J].中国科技论文在线.http://www.paper.edu.cn
[5]孙扬,封孝生,唐九阳,等.多维可视化技术综述[J].计算机科学,2008,35(11):1-7,59.
[6]张驰,罗铁坚,王相根.基于Web的信息可视化系统的设计与实现[J].计算机系统应用,2009(12):324-329.
[7]周宁,吴佳鑫,张少龙.基于图的Web信息可视化探析[J].情报学报,2008,27(5):714-720.
[8]汪小林,罗英伟,丛升日,等.空间元数据研究及应用[J].计算机研究与发展,2001,38(3):321-326.
[9]李军.地球空间元数据的使用研究[J].地球信息科学,2000(9):8-13.
[10]Lbertoni,R,Bertone.Knowledge extraction by visual data mining of metadata in site planning[C].Proceedings of Ninth Scandinavian Research Conference on Geographical Information Siences,Espoo:5-166.
[11]Aula Ahonen-Rainio.Visalization of geospatial metadata for selecting geographic datasets[D].Helsinki University of Technology,2005.
[12]Yang,J,Ward,M O.Rundenstein.Interactive hierarchical displays:ageneral framework for visualization and exploration of large multivariate data sets[J].Computers&Geosciences,2003(27):265-283.
[13]J Dykes,A M MacEachren,M J Kraak.Towards Multivariate Visualization of Metadata Describing Geographic Information[M].Exploring Geovisualization,2005.
[14]Potjo Tsoene.Visualizations of metadata in a GDI environment[D].International Institute for Geo-information Science and Earth Observation.2004.
[15]Chad Jones,et al.An Integrated Exploration Approach to Visualizing Multivariate Particle Data[J].Computing in Science &Engineering,2008,10(4):20-29.
[16]Xiaoru Yuan,et al.Scattering Points in Parallel Coordinates[J].IEEE Transactions on Visualzation and Computer Graphics.2009,15(6).
[17]Fanea E.An Interactive 3D Integration of Parallel Coordinates and Star Glyphs[R].IEEE Symposium on Information Visualization 2005.