陈云波,王健,王勤珍
(昆明市测绘研究院,云南 昆明 650051)
随着遥感技术与计算机技术的迅猛发展,现代遥感技术能够动态、快速、准确地提供多种对地观测数据。遥感数据以几何级数的速度增长,数据越积越多,如何管理海量遥感数据,能够从海量数据源中迅速地检索到感兴趣的区域,怎样更好地为实际应用服务,是影像管理的热点问题。
经有关资料表明[1],目前遥感影像数据管理方式主要有:①基于文件的管理方式;②基于文件与数据库技术混合的管理方式;③关系型数据库管理方式;④基于扩展对象关系型数据库的管理方式;⑤面向对象数据库管理方式。
这几种建库方式各有优缺点。基于文件的管理方式的缺点就是针对多用户的数据共享与并发控制较为困难,同时很难保证数据的安全性。而基于文件与数据库技术混合的管理方式较基于文件的管理方式在效率和存储上有了一定程度的补偿,但其缺点是元数据与文件备份分离,容易造成数据不一致,数据恢复较为困难。目前遥感影像最常用的就是关系型数据库,但其无法实现基于内容的查询。对象关系数据库不仅有关系数据库的特点,同时也能有效管理复杂数据,可以支持基于内容的查询。面向对象数据库管理不仅支持对象语义查询,而且支持基于内容的查询,但是由于影像数据本身的复杂性和系统开发的复杂性,因此使得这种数据库管理技术较为困难。
遥感影像的尺度因子包含空间分辨率、光谱分辨率、时间分辨率等。昆明市测绘研究院有2005年的2.5 m的SPOT5的影像,2008、2009、2010年的 0.6 m的QuickBird影像、2011年的 0.5 m的GEOEYE影像以及2011年的 0.2 m的航飞影像数据,这里多尺度指的是空间分辨率。
由于在获取的时候采用的传感器不同,因此在很大程度上就形成了遥感影像的多样性。目前,昆明市测绘研究院拥有的高分辨率的影像就有SPOT5,QuickBird,WorlDView,GeoEye以及数字航飞等不同影像源。
遥感影像的时空性包含统一传感器在不同时期采集的影像,也包括不同传感器在不同时期的遥感影像。昆明市测绘研究院的2005年~2011年期间的影像数据都是不同时期的数据。同时2008年、2009年的QuickBird影像就属于不同时期统一传感器的获取的数据。遥感影像的时空性特点可以用来检测整个城市发展的节奏、可以用它提供城市在不同时期发展的相关统计数据。
遥感影像含有几乎所有地球表面地物的光谱信息,信息量很大。就遥感影像数据本身而言其数据量是很大的,因此,整个遥感影像的处理过程就是对海量数据的处理过程。昆明市测绘研究院拥有覆盖整个昆明市域的2005年 2.5 m SPOT5影像共 2.1万km2,2008年昆明市 0.6 m的QuickBird影像 3 800 km2,2009年昆明市的 0.6 m的QuickBird影像 2 100 km2,2010年安宁市QuickBird影像 2 664 km2,以及2011年昆明主城的 0.5 m的GeoEye影像 999 km2。2011年其他地州的 0.6 m的 QuickBird影像共2万km2。同时还有0.2 m的航飞影像数据 1 748多km2,其数据量比0.6 m、0.5 m更大。在实际工作中一个县1 600多km2的 0.6 m的QuickBird正射影像数据量就达78 G,可见将遥感数据称为海量数据一点都不过分。
由于遥感影像的数据量巨大,因此在建库时必须首先应考虑采用哪种压缩技术,既不损失影像分辨率,同时又能保证操作效率高。最常见的压缩格式有*.jp2,*.sid,*.ecw等几种。这几种压缩技术比较如表1。
几种压缩格式比较 表1
压缩后影像效果如图1~图4所示。
通过图1~图4及表1可以看出,当*ecw压缩比为1∶20时,影像分辨率损失最低,同时数据量最小,因此,选择*.ecw格式的压缩技术。
图1 Tiff格式
图2 压缩后jp2格式
图3 压缩后Sid格式
图4 压缩后ecw格式
一般来讲,创建金字塔模型会增加约30%左右的存贮空间,但是对于 500 M以上的大数据量的遥感影像来讲,建立遥感影像金字塔后数据的读写速度明显提高,就目前的存储技术,用这种牺牲空间存储来提高运行效率的方式还是可取的。建立遥感影像金字塔,可采用分级建立金字塔。
整幅影像在数据库中应进行分块处理,这样可以减少数据库交互访问的数量,提高数据加载和操作的效率。数据库中同类型的影像应划分成大小相同的影像块,影像块的大小决定计算机性能。影像块不能过大也不能太小,太大,增加了不在查询范围内影像的数量,太小,在某种程度上虽然减少了冗余数据的读取,但与此同时增加了读写操作的次数。因此在选择影像分块大小时应适中。据有关资料表明[2],用512×512作为块大小,可以在普通的电脑上运行。
同时针对昆明市测绘研究院现有的遥感影像资料特点,在分块时采用分级对待。对SPOT5影像、Quick-Bird影像以及 0.2 m的航飞影像数据应分类对待,分辨率不同的影像分块的大小可以不同,但每块影像的数据量要基本一致。
由于昆明市测绘研究院具有自2005年 2.5 m的SPOT5,2008、2009、2010、2011 年的和0.6 m 的 QuickBird影像以及部分 0.5 m的WorldView影像和 0.2 m航飞影像数据。拥有ArcGIS 9.2全套软件以及Oracle 9i等相关软件。因此在这里考虑选择基于中间插件ArcGIS软件的ArcSDE实现关系数据库管理遥感影像数据。ArcSDE是用 Geodatabase 的概念来管理空间数据[3,4]。
(1)应用的数据结构
ArcSDE将栅格数据分解成几个数据表。在ArcSDE中,遥感影像数据也分为元数据和影像数据本身。其中元数据存放在一组元数据标准,而遥感影像数据存放在二进制对象影像数据表中。
(2)数据存储方式
ArcSDE有三个表来存储遥感影像数据,即栅格数据块表存贮原始数据,栅格波段数据表存储波段元数据,栅格数据描述表存储影像的描述信息,通过特定的字段将这几个表联系起来。
(3)影像数据的检索方式
ArcSDE采用的是格网索引技术,将研究区划分为若干块,对每一格网进行编号。根据查询对象的空间位置和形状来判断在那一格中。再根据屏幕的视野范围来确定读取金字塔数据,进而实现影像的检索、查询等操作。
格网索引算法[2]如图5所示。
图5 格网索引算法
其中 P1,P2,P3,P4 为当前视窗顶点,且P2,P3 的坐标分别为(PX2,PY2),(PX3,PY3),影像左下角的坐标为(XL,YL),影像分块的大小为512×512,则格网索引的公式为:
行方向的起始块号=(PX2-XL)/512;
列方向的起始块号=(PY2-YL)/512;
行方向的终止块号=(PX3-XL)/512
列方向的终止块号=(PY3-YL)/512;
有上面公式可得视窗内所包含的数据块,从而确定所查询的数据块,数据库进而读取相应的数据块显示。
(4)数据库的运行与维护
ArcCatalog软件实现对栅格数据进行索引、金字塔的建立、格式转换、数据压缩等操作。
本文详述了遥感影像管理面临的关键技术,结合单位实际情况提出来基于ArcSDE的中间件建库是目前该单位较为适合的影像管理方式。同时得出以下几点结论:
(1)遥感影像建库必须解决海量数据能够高效读写;
(2)遥感影像库后期的维护才是重点,由于遥感影像数据量本身很大,在后期的维护、数据库的备份将存在很多不可预见的问题。
[1]李宗华,彭明军.基于关系数据库技术的遥感影像数据建库研究[J].武汉大学学报(信息科学版),2005(2).
[2]黄杰,刘仁义,刘南等.海量遥感影像管理与可视化系统的研究与实现[J].浙江大学学报(理学版),2008(6).
[3] 欧立业.遥感影像数据建库技术比较研究[J].江西测绘,2007,增刊.
[4]张畅,刘强,戴昌礼等.大规模影像数据库的设计与实现[J].测绘科学,2010,35(3).
[5]Zeiler M.Modeling Our World.Redlands:ESRI Press,2000.
[6]ESRI.Understanding ARCSDE:The RDBMS and GIS Itegration.Redlands:ESRI Press,2000.