俞 童,邓术军,钱海忠
(信息工程大学 地理空间信息学院,河南 郑州 450000)
基于城市POI的遥感影像渐进压缩技术
俞 童,邓术军,钱海忠
(信息工程大学 地理空间信息学院,河南 郑州 450000)
传统栅格影像均采用简单的、由低分辨率到高分辨率的像素级渐进压缩模式,较少考虑到用户需求特征和知识,因此,文中利用POI数据特点及图像感兴趣区编码特性,提出一种基于城市POI的遥感影像渐进压缩思想:首先根据大量的POI数据分析挖掘用户关注的热度信息,建立兴趣场,并以此确定遥感影像的感兴趣区域,然后综合SPIHT算法与Maxshift算法对遥感影像进行渐进压缩编码。实验结果表明,该方法在低码率下仍可以高质量保留图像所含重要信息,能够很好地满足用户的需求,实现了知识层级的遥感影像渐进压缩,有效提高图像压缩编码的实用性和优越性。
POI;图像压缩;感兴趣区域;SPIHT;Maxshift;Kriging插值
随着空间科学技术、计算机技术、网络技术、通信技术的迅速发展,人们可以从不同层面、不同现象对地球进行观测,并对海量的观测数据的分析处理及应用的能力日益强大。高性能新型传感器的出现让遥感影像的时间、空间、辐射和光谱分辨率不断提高,同时,人们对于高精度遥感数据的要求也越来越高,这对海量遥感影像数据的存储容量和传输速率提出了极高要求。
传统的图像压缩方法不能兼顾图像细节信息和压缩效率,为此,图像渐进压缩方法应运而生。对一幅图像而言,人们会根据具体应用需求去着重关注图像中的某些区域,通常这些区域被称为感兴趣区域(Region of Interest, ROI),而这些区域之外的图像区域则被称为背景区域(Background, BG)。因此,一幅图像可以分割为若干个感兴趣区域和一个背景区域。为了保证图像感兴趣区域在压缩过程中不丢失重要信息,并且能优先优质传输,可以根据用户不同信息需求,对不同的区域采用不同的压缩编码策略,对ROI区域采用无损或是近似无损压缩的方法,并进行优先编码,而对BG区域采用压缩比较高的有损压缩方法[1],这样,既能提高感兴趣区域的图像质量,又可以高效地压缩海量数据。因此, 实现具有高效压缩性能、支持感兴趣区编码并适合渐进传输的图像压缩编码方法是当前研究的热点[2]。
目前,大多数学者都从人眼视觉的角度对遥感影像渐进编码进行研究,主要根据影像的灰度、颜色、纹理等特征进行图像分割,划分感兴趣区域,如周大伟提出了一种基于人眼视觉特性的ROI渐进图像传输算法[3];姚军财提出了一种基于人眼对比度敏感视觉特性的图像自适应量化方法[4]等。然而这些方法都是以遥感影像自身性质为主导,较少考虑实际应用中广大用户群体的真正需求和兴趣所在,缺乏一种以用户兴趣为主导的感兴趣区域划分方法。
近年来,大数据技术备受关注,其中位置数据是大数据中的一个重要组成部分[5],它不仅能够记录人类的真实活动情况,而且能够反映出人们对于地理位置的感兴趣度。通过对位置数据中POI数据进行深入挖掘与分析,能够得到反映社会现象、广大用户兴趣的地理空间分布规律和特征知识,可应用到感兴趣区域划分当中,为遥感影像渐进压缩研究提供了一条新的思路与解决办法。
本文提出一种基于城市POI的遥感影像渐进压缩思想。首先,对POI数据进行挖掘与分析,根据其位置信息与热度信息建立研究区域的兴趣场模型,并以此划分感兴趣区域;然后,利用SPIHT算法与Maxshift算法相结合的方法对遥感影像进行压缩编码。实现在有限的存储空间和传输带宽下,对大众用户感兴趣区域进行优先优质压缩编码,较好地保留了用户关注度高的图像区域,实现一种矢栅数据集成的、由重要到次要的层次渐进编码传输技术。
1.1 POI数据
目前,Web2.0、全球定位系统(GPS)、基于位置的信息服务(LBS)等技术飞速发展,为GIS提供了许多重要数据源,能够支撑城市发展与规划、社会经济结构、社会行为心理分析、环境监测等方面定量化研究,并在地理信息服务、数据融合与知识发现、室内外导航等领域实现了成功应用[6]。兴趣点(points of interest, POI)是地理空间信息的一个重要组成部分,是地图服务中一种重要的矢量化表达形式,与面向大众的基于位置服务密切相关。它描述了人们日常生活中最常见地理实体的空间信息和属性信息,如实体的名称、类别、地理坐标等。POI最主要的特征是具有与位置相关的信息,通过这个位置信息可以提供与该位置相关的面向大众用户的应用、产品或服务。POI可以引起用户的关注,在地图服务中承载着地理目标的查询、属性查看、路径规划及辅助定位等功能,用户利用这些功能找到感兴趣目标的地理位置及其相关的属性信息。POI数据在提供丰富属性信息的同时,可以反映出用户对于地理兴趣点的关注热度和地理区域的感兴趣度。因此,通过对POI数据进行深入挖掘分析,可以建立用户兴趣模型,得到用户较为关注区域,为进一步图像压缩奠定基础。
本文的实验数据是利用网页爬虫在百度地图网站抽取的1 000个郑州市区POI数据。所得的POI数据包含类型编码、名称、经度、纬度、Hot(热度值)、邮政编码和地址等字段,具体数据格式如表1所示。
表1 POI数据格式
1.2 空间兴趣场
大众用户对地理实体的兴趣表现为经常查询访问感兴趣的地理位置,或利用与其相关的空间媒体数据如地理标签、文字、图片等对该地理位置进行描述。这些地理实体连续分布在地球表面,因此,用户的兴趣也是连续分布于整个地理空间中。本文提出一种空间兴趣场的概念,描述用户对地理实体的兴趣度空间分布特征。
空间兴趣场是由位置数据及用户兴趣信息共同构成的覆盖整个地理空间的一种场模型,兴趣场信号的强弱描述用户对地理实体的感兴趣度。该模型是将用户兴趣在地理空间中进行定位,进行空间化表示,能够客观反映出用户在地理空间中的兴趣特征、空间分布及兴趣变化趋势规律。
本文通过利用POI数据包含的位置信息进行定位,以相应的POI热度属性信息作为该地理位置的场强,根据这些离散的POI反演得到整个地理空间的用户兴趣,构建空间兴趣场模型。该兴趣场中每个POI的访问查询次数多、访问人数多,热度值越大,在兴趣场中场强越大。通过对该空间兴趣场的研究,可有效挖掘用户兴趣,实现以用户为主导、数据驱动的研究方法。
1.3 空间兴趣场模型的构建
POI数据是以离散的点状要素的形式存在于地图中,具有准确的空间位置属性,可通过大量离散POI数据的空间插值来反演获得整个研究区域的热度信息,建立空间兴趣场模型。
本文采用Kriging插值方法进行空间插值。Kriging插值是通过一组利用已知地理特征离散点,推求整个观测区域的未知点,使测量数据转换为连续的数据曲面,进而构建更接近真实环境的地理空间模型的过程。Kriging法具有对区域变化量估计的无偏性,可以反映变量的空间结构,能够计算出每个估算值方差,从而得到估计精度[7-8]。
假设与空间变化有关的随机变量(区域变化量)为z(x),xi(i=1,2,…,n)为区域上的一系列观测点,则z(xi)(i=1,2,…,n)为相应的观测值。区域变化量在x0处的估计值z*(x0)可利用x0周围相邻的观测点进行加权求和所得,可采用以下公式计算:
(1)
其中λi为观测值的加权系数,选取λi要求满足z*(x0)是z(x0)的无偏估计和观测值的估计方差最小的两个条件。公式如下:
(2)
假设z(x)不满足二阶平稳,而满足内蕴(本征)假设时,则用变差函数表示的普通Kriging方程组如下:
(3)
其中γ(xi,xj)为观测点xi与xj之间的变异函数值,μ为拉格朗日常数。
根据此方法可利用一系列观测点由式(3)解出加权系数λi,再代入式(1)求得该研究区域其他的未知点的值。
本文采用Kriging方法对获得的1 000个郑州市POI散点数据进行空间插值,将POI点的热度值作为观测值,其坐标数据作为区域变化量,对郑州区域的热度值进行估计。根据插值后获得的郑州市的热度信息,得到整个郑州区域的空间兴趣场(见图1),模型效果图中,以高低程度表示用户兴趣度大小,以特殊高亮的形式和颜色变化显示用户兴趣分布及变化情况,红色表示用户兴趣度较高,在兴趣场模型中场强较强,黄色次之,绿色表示兴趣度较低。
图1 郑州市部分地区感兴趣场模型效果图
1.4 用户兴趣空间分布分析与ROI的确定
POI数据的空间分布往往受到所在环境以及人类活动的影响,POI承载着用户的兴趣,对POI的分布特征进行分析,可以获得用户对地理空间兴趣的分布特征,为进一步的城市规划、商业布局、选址等领域提供重要的信息服务[9]。核密度分析是对空间点数据空间分析的一种常用方法,可以描述点数据的空间分布格局及变化趋势。通过核密度分析,将POI数据进行二维表达,得到POI点的聚集状况。核密度分析中,考虑到离POI点越远,该空间位置受POI的兴趣度影响越小,其核密度随中心点向外辐射影响的距离增大而缩小。核密度的计算公式如下:
(4)
其中:f(x)为空间位置x的核密度函数;h为带宽或阈值;n为与空间位置s的距离小于带宽的POI个数;k为空间权重。根据距离衰减效应,落入中心点ci邻域范围内的点具有不同的空间权重,靠近中心点ci的点被赋予较大的权重,随着与中心点距离的加大权重降低,直至达到阈值h,此时核密度降为0。
对POI数据进行核密度估计,其结果如图2、图3所示。
图2 郑州市ROI密度图
图3 郑州市商圈图
由图2、图3可知,郑州市POI的空间分布特征:①POI在整个地理空间中分布不均匀,各个区域的POI分布密度有明显差异。②郑州市POI分布情况与空间兴趣场分布情况大体吻合,都主要集中于二七、火车站、碧沙岗、大学路、郑东、花园农业路、郑汴路等商业区域。③POI分布较密集区域,对应空间兴趣场中用户兴趣度较高;POI分布较稀疏区域,所对应空间兴趣场中用户兴趣较低。
根据兴趣场的分布特征,将兴趣范围选择的阈值设定为127,则热度值大于127的区域为ROI区域,热度值小于127即为背景区域。则所得郑州市部分地区ROI区域如图4所示,白色区域为ROI,黑色区域为BG。
图4 郑州市部分地区ROI
2.1 ROI系数的提升
JPEG2000标准提出了两种ROI编码的标准方法:一般位移法(General Scaling Based Method)[10]和最大位移法 (Maxshift Method)[11],两种方法均是按比例移动ROI的小波系数,使其位于较高的位平面上。一般位移法仅仅适用于具有规则形状的ROI,而最大位移法可用于不规则形状的ROI。
如图5所示,在一般位移法中,选择一个合适的位移因子s(尺度缩放值)来描述ROI与BG之间的相对重要比例,使全部ROI小波系数的位平面提升s位,则ROI系数最重要的位平面高于BG系数的所有位平面,使其位于码流的前部,从而在编码过程中 ROI系数可以被优先编码和传输,保证了解码端重构图像ROI的质量。
图5 ROI系数缩放
最大位移法就是当一般位移法中位移因子s满足以下条件:
(5)
其中max(Mb)是BG系数的位平面的最大值,即ROI区域的最小系数要大于BG的最大系数[12]。因此,ROI系数提升到更高的位平面,使得ROI系数全部大于BG系数的最大值,即ROI与BG系数位平面完全没有重叠。
2.2 SPIHT算法
分层树集合分裂算法(Set Partitioning in Hierarchical Trees, SPIHT)[13]是A. Said和W. A. Pearlman在嵌入式零树小波编码算法(EZW)的基础上提出的一种压缩效率更优越、重构效果更佳的方法。SPIHT算法是利用图像固有的自相似性进行小波分解的图像压缩算法,它能够生成嵌入式位流(embedded bit stream),使接收到的位流可在任意位置中断,进行解压和重构图像,具有良好的渐进传输特性。该算法对EZW算法的小波系数零树结构进行改进,采用了空间方向树( Spatial Orientation Tree,SOT)、节点集合O(i,j)、所有子孙集合D(i,j)和非直系子孙集合L(i,j)等,更有效地表示系数结构,精简了集合的表示,从而提高了图像编码和压缩的效率[14]。与EZW算法相比, SPIHT算法压缩后的重构图像具有较高的峰值信噪比(PSNR),计算复杂度较低,位速率更容易控制[15]。
在编码过程中,SPIHT算法使用了3个有序表,对位平面集合进行划分,即不重要系数表LIP(the list of insignificant pixels)、重要系数表LSP(the list of significant pixels)和不重要集合表LIS(the list of insignificant sets)[16]。在解码时,按编码时有序表存放数据的顺序重新对其构造。
SPIHT算法编码过程如下:
1)阈值和有序表的初始化。对图像进行小波变换,计算变换后小波系数的比特最大位
则设阈值为T=2N,若系数大于等于阈值,则为重要系数,否则为不重要系数。
有序表的初始化为
LSP=∅;
其中,LIP表和LIS表中小波系数(i,j)的排列顺序与EZW算法的扫描顺序相同。
2)排序扫描。对当前位平面的重要系数进行编码。扫描LIP表中的每一项,顺次检查LIP中所有的小波系数(i,j)并判断其重要性,若为重要系数,则输出“1”及Ci,j的符号,并将该系数移到LSP表中;若系数不是重要的,则输出“0”。再对LIS表中每个节点(i,j)判断其重要性,若是重要的,输出“1”,并对集合D(i,j)和集合L(i,j)分别采用不同的处理方法;若不是重要的,则输出“0”,转到下一个集合。
4)更新阈值指数。将阈值指数N减1,返回到2)进行下一级编码扫描。
SPIHT算法解码过程如下:
编码器读取编码过程中输出的码流文件, 以及相关的解码信息(初始值及LIS、LIP、LSP的初始化信息),解码端即可恢复原图像的小波系数排序信息;与此同时,解码器进行重构图像,其过程是编码的逆过程。
2.3 感兴趣区域编码
本文利用SPIHT算法与Maxshift算法结合的方法对感兴趣区域进行压缩编码,其步骤如下:
1)输入遥感影像,根据空间感兴趣场划分感兴趣区域。
2)对图像进行小波变换,生成ROI掩膜。
3)经过小波变换后,采用Maxshift算法,对不同子带的ROI的系数左移s位(位移因子s为背景区域系数的最高比特数,相当于对ROI对应的小波系数乘以位移因子2s),使ROI系数高于BG系数。
4)采用SPIHT算法对经过提升后的小波系数进行编码。
解码过程是上述过程的逆过程,图像经SPIHT解码后,确定感兴趣区域,对ROI系数右移s位,将ROI系数的位平面降低,再对小波系数进行小波逆变换,最终获得重构图像。
为验证本文方法的有效性,本文通过网络爬虫获取大量的百度地图POI数据,并利用Kriging插值方法反演整个研究区域的用户兴趣度,然后根据位置数据及用户兴趣度建立空间兴趣场模型,划分感兴趣区域,再采用SPIHT与Maxshift混合算法对ROI区域编码,辅助遥感影像进行渐进压缩。
实验数据是采集的1 000个郑州市POI数据及其所对应区域的LANDSAT-TM影像(见图6),图像压缩质量效果采用峰值信噪比PSNR来判定。
根据上述算法,得到压缩结果如图7所示,图中(a)、(b)、(c)、(d)4幅图像分别码率为0.2 bpp,0.5 bpp,0.7 bpp,0.9 bpp的重构图像,从整个图像来看,在低码率下,背景区域已经虚化,而根据POI数据所选取的ROI图像依然清晰,可达到人眼可接受的效果。随码率的增加,ROI区域在保持较高质量的同时,细节也逐渐丰富,背景区域逐渐清晰。
通过表2可看出,随着码率的增加,分配给ROI和BG的比特的增多,ROI、BG以及整个图像的PSNR都随着码率的增大而增加。虽然本文算法压缩后BG和整幅图像总的PSNR相比于SPIHT算法要低,并不占优势,但本文算法的ROI部分的PSNR要远高于SPIHT算法,当码率为0.05时,ROI区域的PSNR即达到了25.33 dB,说明在低码率下,ROI区域图像就可以具有较高的质量。这是由于ROI系数位平面被提升,即使低码率下ROI区域获得较多的码流,并优先编码,因此重构质量相对较高,主观视觉效果较好,而且,随着码流不断增加,ROI的图像质量比较稳定。因此,本文算法性能较好,所得的压缩效果要优于传统的SPIHT算法,尤其在低码率下,本文算法能够很好地将图像中人们关注的重要信息进行高质量保留,满足了人们的实际需求。
图6 原始遥感影像
图7 本文算法在不同码率下的重构图像
表2 不同码率压缩下重构图像质量的评价
本文提出的基于城市POI的遥感影像渐进压缩思想,通过研究区域的大量POI矢量数据及用户兴趣度挖掘,建立空间兴趣场,并以此划分感兴趣区域,再采用Maxshift对感兴趣区域的小波系数进行提升,利用SPIHT算法进行遥感影像的渐进压缩编码。实验结果表明,该方法根据海量网络数据挖掘用户感兴趣地理信息,并在压缩过程中,图像中人们关注的重要信息能够高质量的保留,并且优先编码,提高ROI的峰值信噪比,增加了图像压缩编码优越性和实用性,有很好的主观视觉效果,支持遥感影像的渐进传输,有着实际的研究意义与应用价值。但由于用户群体具有多元性和复杂性,对兴趣场的建立还需进一步研究,因此在下一步工作中还需要对用户兴趣信息进行更深层次挖掘,对不同类别的用户群体以及不同应用需求进行深入讨论,以及可以划分更多兴趣层次采用不同编码策略,优化渐进传输的效果。
[1] 陈雨时.基于光谱特性的高光谱图像压缩方法研究[D].哈尔滨:哈尔滨工业大学,2007.
[2] 卓力,沈兰荪,LAM Kin-man.基于感兴趣区的图像编码与渐进传输[J].电子学报,2004,32(3):411-415.
[3] 周大伟,耿金玲,郑继明.一种基于人眼视觉特性的ROI渐进图像传输算法[J].计算机应用,2007,27(7):1654-1656.
[4] 姚军财,刘贵忠.一种基于人眼对比度敏感视觉特性的图像自适应量化方法[J].电子与信息学报,2016,38(5):1202-1210.
[5] 刘经南,方媛,郭迟,等.位置大数据的分析处理研究进展[J].武汉大学学报(信息科学版),2014,39(4):379-385.
[6] 杨敏,艾廷华,卢威,等.自发地理信息兴趣点数据在线综合与多尺度可视化方法[J].测绘学报, 2015,44(2): 228-234.
[7] 曾怀恩, 黄声享. 基于Kriging方法的空间数据插值研究[J]. 测绘工程, 2007,16(5):5-8.
[8] 陈锡超,宁芊.基于Kriging方法的动态地形反向多级细化研究[J]. 计算机工程与应用, 2013,49(9):171-175.
[9] 禹文豪, 艾廷华, 杨敏,等. 利用核密度与空间自相关进行城市设施兴趣点分布热点探测[J]. 武汉大学学报(信息科学版), 2016, 41(2):221-227.
[10] ISO/ISC JTC 1/SC 29/WG 1 (ITU-T SG8)JPEG2000 PartⅡFinal Committee Draft Version 1.0[S]. Dec, 2000.
[11] ISO/ISC JTC 1/SC 29/WG 1 (ITU-T SG8)JPEG2000 PartⅠFinal Committee Draft Version 1.0[S]. Dec, 2000.
[12] 孙武,王有钊.JPEG2000感兴趣区域编码技术浅析[J]. 计算机工程与应用, 2003(24):67-68.
[13] SAID A, PEARLMAN W A. A new, fast, and efficient image codec based on set partitioning in hierarchical trees [J]. IEEE Transactions on Circuits & Systems for Video Technology, 2001, 6(3):243-250.
[14] 汤敏,陈秀梅,陈峰.基于Contourlet变换和SPIHT算法的彩色医学图像压缩[J].计算机科学,2014,41(1):303-306.
[15] 王立国,孟凡旺,张文生.遥感图像感兴趣区域压缩算法的研究[J]. 仪器仪表用户,2009,16(2):17-19.
[16] 钱剑,戚玉松,夏良正.小波图像编码技术SPIHT的改进算法[J]. 东南大学学报(自然科学版), 2003,33(S1): 82-85.
[责任编辑:刘文霞]
Remote sensing image progressive compression based on city POI
YU Tong, DENG Shujun, QIAN Haizhong
(School of Geospatial Information, Information Engineering University, Zhengzhou 450000, China)
The traditional raster image is a simple pixel level compression mode from low resolution to high resolution without considering much about users’ requirements. With the characteristics of POI (points of interest) data reflecting user needs and ROI coding, a method for remote sensing image progressive compression based on city POI is proposed. First, the application and importance of a great deal of POI data are analyzed from rich attribute information, position characteristics and user interest. A concept of space interest field is put forward. Then SPIHT algorithm and Maxshift algorithm are integiated to encode with compression for the remote sensing images. The experimental results show that the important and users’ interested information of remote sensing image can be retained with high quality when the bit rate is low, and can well meet the needs of users. The method realizes remote sensing image progressive compression by knowledge hierarchy, and also improves the practicability and superiority of image compression.
POI;image compression;region of interest; SPIHT;Maxshift; Kriging interpolation
引用著录:俞 童,邓术军,钱海忠.基于城市POI的遥感影像渐进压缩技术[J].测绘工程,2017,26(4):58-63,69.
10.19349/j.cnki.issn1006-7949.2017.04.011
2016-06-07
国家自然科学基金资助项目(41571442)
俞 童(1992-),女,硕士研究生.
P23
A
1006-7949(2017)04-0058-06