丁 凯 孟,朱 长 青
(1.南京师范大学虚拟地理环境教育部重点实验室,江苏 南京 210023;2.金陵科技学院网络与通信工程学院,江苏 南京 211169)
基于金字塔模型的遥感影像感知哈希认证算法
丁 凯 孟1,2,朱 长 青1
(1.南京师范大学虚拟地理环境教育部重点实验室,江苏 南京 210023;2.金陵科技学院网络与通信工程学院,江苏 南京 211169)
针对遥感影像数据量较大的特点,提出一种基于金字塔模型的遥感影像感知哈希认证算法。首先,在原始遥感影像基础上通过重采样建立不同分辨率的影像层,并根据认证的粒度要求对各层影像进行格网划分;然后,通过分块DCT变换提取各格网单元的内容特征,进而构造格网单元的感知哈希序列,最终得到原始遥感影像的感知哈希序列。影像认证端可以认证不同分辨率影像层的内容完整性,也可以验证初始影像的内容完整性。实验与分析表明,该算法能够实现不同尺度下的遥感影像内容完整性认证,并对篡改区域进行定位。
遥感影像;感知哈希;金字塔模型;完整性认证
遥感影像是获取地表环境、资源等地学专题信息的重要载体,在国民经济发展中具有重要价值。但遥感影像处理技术的发展、计算机网络的开放性及其固有的缺陷等,使得遥感影像在传输与使用过程中易遭受各种无意或有意的篡改攻击。如果遥感影像的完整性、真实性受到质疑,则其使用价值将大大降低。与此同时,遥感影像获取技术的飞速发展,使得遥感影像的空间分辨率越来越高,数据量也越来越大。采用分层分块策略的金字塔模型在影像浏览和显示等方面有着独特的优势,已得到广泛应用[1]。然而,现有针对影像金字塔的研究大多侧重于金字塔的数据组织和应用模型,安全方面的研究相对较少。因此,遥感影像的认证技术研究具有重要意义。
传统的认证方法主要采用Hash函数实现数据的认证。但Hash函数(如SHA1和MD5)对数据的变化过于敏感,即使数据发生1 bit的改动,都无法通过认证。然而,遥感影像在使用过程中,经过格式转换、水印嵌入等操作之后,其内容并没有改变,变化的只是遥感影像的信息载体。这种情况下,Hash函数不能很好地认证遥感影像。感知哈希(Perceptual Hashing)为遥感影像的认证提供另一种可行的解决方法。感知哈希与Hash函数的显著区别是:数据经过格式转换等不改变有效内容的操作,感知哈希散列不发生变化或者变化很小。本文针对海量遥感影像数据的认证问题,研究基于金字塔模型的遥感影像感知哈希算法。
1.1 感知哈希
感知哈希是指一个多媒体对象的感知特征通过压缩生成的简短摘要,即将具有相同感知内容的多媒体数字表示唯一地映射为一段数字摘要,并满足感知鲁棒性和安全性[2]。根据多媒体对象的不同,感知哈希可分为图像感知哈希、音频感知哈希、视频感知哈希等。图像感知哈希算法具有如下特征[3]:鲁棒性,指内容相同或相近的图像生成的感知哈希散列应相同或相近;唯一性,指内容不同的图像应产生差异较大的感知哈希序列;安全性,从感知哈希序列中得不到图像的有效内容信息;复杂度,要求感知哈希算法具有较低的计算复杂度。此外, “篡改定位”也逐渐在许多感知哈希算法中实现。其中,鲁棒性是感知哈希与密码学Hash函数最大的区别。
目前,已有诸多学者展开图像感知哈希的相关研究。Fridrich等提出一种基于低频DCT系数的稳健哈希算法[4],该算法利用了低频DCT系数对图像内容有重要影响的特性产生感知哈希序列,能够抵抗JPEG压缩、滤波攻击等,但是不能抵抗几何攻击。Monga等[5]提出一种基于特征点的感知哈希算法,该算法使用Morlet小波变换捕获线性结构的拐点作为图像特征点,可以表征重要的视觉感知成分,具有很好的鲁棒性,但计算复杂度较高。刘兆庆等[6]提出一种基于SIFT的图像哈希算法,该算法选择SIFT特征向量进行压缩生成感知哈希序列,对几何攻击具有很好的鲁棒性。Tang等[7]提出一种用于彩色图像的感知哈希算法,将图像从RGB颜色空间转换到HSI和YCbCr颜色空间后,提取每个图像分块的统计特征生成感知哈希序列。Sun等[8]提出一种基于压缩感知和傅立叶-梅林变换的感知哈希算法,有效压缩了图像的特征信息。
但是,针对遥感影像(尤其是海量遥感影像)的相关研究并不多。相对于普通的图像数据,遥感影像具有数据海量性的特点,往往可以达到数G甚至数十G,因此现有的图像感知哈希算法无法直接应用于遥感影像。此外,遥感影像常用于空间定位、地物提取等,对量测精度有很高要求。现有图像感知哈希算法针对图像全局进行特征提取,直接应用于海量遥感影像的认证,将无法有效检测其局部细微变化,因此不能满足遥感影像对认证精度的要求。
1.2 金字塔模型
金字塔模型是一种多分辨率的层次结构模型[9],能够满足海量遥感影像实时显示与渐进式传输的要求。遥感影像,尤其是海量、高分辨率遥感影像的特征表达具有鲜明的层次性[10]。遥感影像在分析与使用过程中,不同地物的识别存在着很明显的分辨率差异,所使用的影像也存在明显的分辨率差异。例如,植被分布识别的影像分辨率可以远低于城市建筑物识别的影像分辨率;同一分辨率的影像中,水域的识别相比于城市建筑物的识别也更为容易。所以,同一种数据特征,在不同尺度下的描述可能并不相同。这里,尺度是地学数据的重要特征,一般指数据所表达的空间范围的相对大小和时间相对长短[11]。单一分辨率的影像并不能满足所有的分析与应用,而多尺度的分析方法可以形成具有层次结构的特征集合,可以获取更为精确、客观的信息。基于多尺度策略设计感知哈希算法,可以增强算法鲁棒性,并扩展其应用。但是,现有的图像感知哈希算法大多针对固定分辨率的图像提取内容特征,无法满足遥感影像多尺度的认证需求。
影像金字塔的构建是一个迭代变换的过程[12]:原始大数据量的影像作为金字塔的底层,对一幅原始影像首先按照不同分辨率进行分层,再对各层影像进行分块,建立一系列范围相同、但分辨率不同的影像。其中,原始影像分辨率最高,重采样得到的影像分辨率则随着金字塔层数的增加而降低。构建金字塔模型常用的重采样算法包括最近邻插值、双线性插值、立方卷积算法等[13,14]。
本文算法的总体流程如下:首先,构建影像金字塔,得到不同分辨率的各级影像,并对每一级影像进行格网划分;然后,针对每个格网单元,采用DCT变换的方式生成其感知哈希序列;最后,得到原始影像基于金字塔模型的感知哈希序列。在数据接收端,用户根据实际需求,对相应分辨率的影像层进行完整性认证,并对可能的篡改进行定位。
2.1 构建影像金字塔
首先,构建影像金字塔,并对每层进行均匀格网划分。具体步骤:1)初始影像作为金字塔的底层,即第0层,并对其进行格网划分;2)在第0层基础上,通过双线性插值,构建长、宽各为原始影像1/2的像素矩阵,即影像金字塔第1层,并对其进行格网划分;3)在影像金字塔第1 层的基础上,采用相同的方法,构建影像第2层,并对其进行格网划分;4)依次类推,构建上一层影像,最后形成一个多层次的影像金字塔。
影像层进行格网划分的粒度越细,篡改定位的精度也就越高,且算法能够感知影像层更细微的变化。但是,格网划分的过细,将会消耗更多的计算时间和存储空间。所以,格网划分的粒度应当根据计算效率、影像大小及篡改定位粒度等因素决定。为了满足遥感影像对认证精度的要求,同时兼顾效率,格网单元应在128×128~256×256之间为宜。每个格网单元可由坐标(level,x,y) 进行唯一标识,其中,level表示格网单元所在的层,x和y分别表示格网单元所在的行和列。
2.2 生成感知哈希序列
感知哈希的关键在于内容特征的提取。现有感知哈希算法中,DCT变换是感知哈希常用的特征提取方式,能够很好地满足鲁棒性、摘要性、唯一性等要求。图像经过DCT变换之后,部分较大的AC系数保持着大量能量和纹理信息,可以很好地反映原始图像的内容特征。所以,本文算法采用DCT变换生成格网单元的感知哈希序列,具体步骤如下:1)预处理,将格网单元转变为255阶的灰度图,并通过重采样将分辨率调整为m×m(实验中m=32)。2)将m×m灰度图分割为n×n(实验中n=8)的分块,每个分块进行DCT变换,并选取每个分块的DC系数和3个低频AC系数。该过程忽略了高频AC系数,能够增强哈希序列对噪声的鲁棒性。3)将提取的系数量化为二值序列。DC系数的量化规则为:首先计算各分块DC系数均值,DC系数大于均值时置为1,否则置为0。AC系数的量化规则为:计算各分块对应位置的系数均值,系数大于对应的均值时置为1,否则置为0。4)加密量化后的二值序列。加密算法可以选择主流的对称加密算法(基于密钥长度灵活性的考虑,本文采用RC4算法)。加密后的字符串就是格网单元的感知哈希序列,记为PH(level,x,y),其中,level、x、y的意义等同于格网单元的坐标。
为便于影像的认证,将每层影像的格网单元感知哈希序列串联,记为PHlevel;串联各层影像的PHlevel得到原始遥感影像的感知哈希序列,记为PH。
2.3 多尺度的完整性认证与篡改定位
(1)
其中:h1和h2为长度是L的感知哈希序列。两个感知哈希序列的归一化Hamming距离越大,说明相应的影像内容差别也就越大。如果两个感知哈希的归一化Hamming距离低于设置的阈值Th,说明相应的区域没有发生能够感知的差别,可以认为内容上保持不变;反之,说明相应的区域内容发生较大变化,也就是遭到了某种可能的篡改。阈值Th的设定能够调节算法鲁棒性和篡改敏感性间的矛盾。
对不同的影像层进行完整性认证,篡改定位的粒度也不同。对影像的第0层,也就是原始影像进行完整性认证,得到的认证精度最高,如果发生篡改,那么篡改定位的粒度也最细。但对第0层进行认证不仅时间消耗最大,而且也不必要。如果某一影像层的内容被确认篡改,那么原始影像相应区域的内容也遭到了某种篡改。
本文选用Tiff格式遥感影像(图1,见封2),数据大小约为380M,空间分辨率为10 000×10 000。实验硬件平台为:3.1GHz主频的CPU,可用内存2.99G,软件开发平台为VisualStudio2010和C。
构建原始影像的金字塔。初始影像作为金字塔的第0层,并对其进行64×64的均匀格网划分;在第0层基础上,通过双线性插值,构建影像金字塔第1层,其长、宽分别为5 000,并对其进行32×32均匀格网划分;依次类推,构建影像第2层、第3层和第4层,大小分别是2 500×2 500、1 250×1 250、725×725,并分别进行16×16、8×8、4×4的格网划分,形成5个影像层的金字塔。然后计算每个格网单元的感知哈希序列,实际是长度为64的0~1序列(可用8个字节表示)。
在影像接收端进行完整性认证与篡改定位。用户根据实际情况选择影像金字塔的不同影像层进行完整性认证。其中,阈值Th通过实验设定为0.02。图2为影像局部被篡改后,不同影像层的相同区域的格网单元对比实例。图2e所示的格网单元相对于图2a和2c的格网单元,包含的范围更大,分辨率也更低。图2b、图2d和图2f分别为篡改区域在不同影像层的格网单元。
图2 篡改格网单元示例
Fig.2 Tamper grid examples
表1所示为图2所示的格网篡改之后与原始格网单元的归一化Hamming距离对比。由表1可知,越底层的影像层,篡改识别能力逐步增强。但是,如前文所述,篡改识别能力的提高将会增加计算开销。
相同的篡改在金字塔不同影像层的篡改定位粒度也不相同。图3(见封2)分别为第0层、第1层和第2层的篡改定位结果,虽然3个影像层均能检测到篡改,但第0层的篡改定位粒度最为精确。
表1 不同影像层的瓦片篡改对比示例
Table 1 Tamper comparison of the grids at different layers
归一化Hamming距离格网单元(2,14,14)篡改前后0.031250格网单元(1,28,28)篡改前后0.046875格网单元(0,57,57)篡改前后0.109375
在渐进式网络传输过程中,用户往往先收到分辨率较低的影像,然后收到分辨率逐步提高的影像。如果收到的低分辨率影像已经检测到篡改,可能没必要接收后继的高分辨率影像层。
本文算法的安全性依托于RC4算法的安全性,在加密密钥安全的情况下,算法有足够的安全保障。
本文针对遥感影像的数据海量性特点,提出一种基于金字塔模型的遥感影像的感知哈希算法。该算法在原始遥感影像基础上建立不同分辨率的影像层,每层影像进行格网划分后,通过DCT变换提取各格网单元的内容特征生成感知哈希序列。本文算法在多个尺度下提取影像的内容特征,符合人类对影像数据从整体到局部的感知过程,也为多尺度的遥感影像分析方法奠定基础,同时为海量影像的渐进式传输提供了可行的认证方法。实验与分析表明,本文算法能够实现海量遥感影像不同尺度下的内容完整性认证,但本文算法存在着认证信息数据量较大的不足。影像特征更为有效的压缩与摘要化的表示方法将是下一步研究的重点。
[1] 程承旗,张恩东,万元嵬,等.遥感影像剖分金字塔研究[J].地理与地理信息科学,2010,25(1):19-23.
[2] 牛夏牧,焦玉华.感知哈希综述[J].电子学报,2008,36(7):1405-1411.
[3] 张维克,孔祥维,尤新刚.安全鲁棒的图像感知哈希技术[J].东南大学学报(自然科学版),2007,37(1):188-192.
[4] FRIDRICH J,GOLJAN M.Robust Hash functions for digital watermarking[A].GOLJAN M.Proceedings International Conference on Information Technology:Coding and Computing[C].2000.178-183.
[5] MONGA V,EVANS B L.Perceptual image hashing via feature points:Performance evaluation and tradeoffs[J].Image Processing,IEEE Transactions on,2006,15(11):3452-3465.
[6] 刘兆庆,李琼,刘景瑞,等.一种基于SIFT的图像哈希算法[J].仪器仪表学报,2011,32(9):2024-2028.
[7] TANG Z,ZHANG X,DAI X,et al.Robust image hash function using local color features[J].AEU-International Journal of Electronics and Communications,2013,67(8):717-722.
[8] SUN R,ZENG W.Secure and robust image hashing via compressive sensing[J].Multimedia Tools and Applications,2014,70:1651-1665.
[9] 马琪,谢忠.海量栅格地理数据的组织与调度[J].地理与地理信息科学,2009,24(6):39-41.
[10] PARKER J A,KENYON R V,TROXEL D E.Comparison of interpolating methods for image resampling[J].Medical Imaging,IEEE Transactions on,1983(1):31-39.
[11] 徐磊,吴立新,车德福,等.面向数据集成的城市空间数据内涵与特征分析[J].地理与地理信息科学,2005,21(6):25-28.
[12] 邹勤,贾永红.一种基于形态金字塔的遥感影像融合方法及其性能评价[J].武汉大学学报 (信息科学版),2006(11):971-974.
[13] 万元嵬,程承旗,宋树华.大数据量遥感影像快速显示剖分组织方法研究[J].地理与地理信息科学,2009,25(3):33-36.
[14] 孙显,付琨,王宏琦.高分辨率遥感图像理解[M].北京:科学出版社,2011.
A Perceptual Hash Algorithm Based on Pyramid Model for Remote Sensing Image Authentication
DING Kai-meng1,2,ZHU Chang-qing1
(1.KeyLaboratoryofVirtualGeographicEnvironment,MinistryofEducation,NanjingNormalUniversity,Nanjing210023;2.CollegeofNetworkandCommunicationEngineering,JinlingInstituteofTechnology,Nanjing211169,China)
In the light of the massive characteristic of remote sensing image,a perceptual Hash algorithm based on pyramid model for remote sensing image authentication is proposed.Firstly,multi-resolution image layers are build based on the original remote sending image by resampling,and the image layers are divided into grids in accordance with the authentication requirement.Secondly,the feature of the grid is extracted by block DCT transform to generate the grid perceptual Hash,and then the perceptual Hash value of the remote sensing image is gotten.At the authentication end,the content integrity of the remote sensing image or the image layer with different resolution can be verified through the
Hash value.The experiments indicated that the algorithm can authenticate remote sensing image at different scale and locate the tampered area.
remote sensing image; perceptual Hash algorithm; pyramid model; integrity authentication
2014-08-23;
2014-10-14
国家自然科学基金项目(41301413);国家社科基金重大项目(11&ZD162);江苏省自然科学基金项目(BK20130903)
丁凯孟(1985-),男,博士研究生,主要研究方向为地理数据安全。E-mail:dingkaimeng@foxmail.com
10.3969/j.issn.1672-0504.2015.02.004
TP391
A
1672-0504(2015)02-0016-04