基于视觉特性的小波零树图像编码压缩

2010-03-16 01:18魏玉芬野金花丁艳清

装备制造技术 2010年11期

魏玉芬，野金花，丁艳清

（黑龙江八一农垦大学文理学院，黑龙江大庆 163319）

嵌入式零树小波编码（Embedded Zerotree Wavelets Encoding，EZW）是基于比特连续逼近的图像编码方法：按位平面分层进行孤立系数和零树的判决和熵编码，而判决阈值则逐层折半递减，又称之为多层（或位平面）零树编码方法，这种编码方法十分有效。近年来，在EZW算法的基础上，出现了许多新的改进算法，如集合分裂嵌入块编码、可逆嵌入小波压缩算法、最优截断嵌入式块编码等，其中最优截断嵌入式块编码算法，更是成为新图像编码标准JPEG2000中所采用的算法[1~3]。

EZW算法简单，无需任何训练，支持多码率，具有较高的信噪比和较好的图像复原品质。然而实验结果表明，该算法由于不能完全利用小波系数的特点和充分考虑人眼视觉特性（HSV），导致编码时间过长，编码效率低，影响图像复原品质。本文提出视觉加权小波零树编码方法，通过对高频子带进行视觉加权，修改高频子带系数扫描策略和量化阈值等方法进行编码，对低频子带采用无损预测编码方法，进一步提高图像复原的品质和编码效率。

1 EZW编码算法

EZW算法利用小波系数的特点，较好地实现了图像编码的嵌入功能，主要包括以下3个过程：零树预测，扫描方法，逐次逼近量化[4]。

1.1 零树预测

在变换编码中，变换系数矩阵经过量化后，产生大量零符号。编码的后续过程，就是有效地表示那些非零符号，包括非零符号的位置和大小。表示量化后非零值位置的过程，也就是表示有效值位置的过程，称为有效值映射（significance map）。

为了构成一个完整的有效值映射，除了定义零树根（ZTR）外，还需定义其他3个符号：

（1）孤零（IZ），表示当前系数值是无效值，但它的子孙系数中至少有一个是有效值；

（2）正有效值（POS），表示当前系数是一个正的有效值；

（3）负有效值（NEG），表示当前系数是一个负的有效值。小波树结构示意图如图1所示。

1.2 扫描方法

EZW算法对小波系数进行编码的次序叫做扫描。有了上述4个符号，可以按一定的顺序扫描小波变换系数矩阵，从而形成一个符号表，它就是要得到的有效值映射。扫描过程中，各子带按图2所示的次序扫描。

图1 三级小波分解和树结构示意

图2 子带扫描顺序

1.3逐次逼近量化

为了使零树表示构成一个有效的嵌入式码流，结合逐次逼近量化技术，来依次确定有效值和有效值映射，门限值之间满足依次减半。

2 视觉特性（HVS）控制

通过对人眼某些视觉现象的观察，并结合视觉生理、心理学等方面的研究，发现恢复图像的视觉失真，不仅取决于整体均方误差，而且还取决于这个失真空间频率上的分布。由于人眼具有视觉阈值效应和掩盖效应，因此人的视觉分辨率力有限，可以容忍一定的图像失真，但是人眼对不同频率视觉信号的敏感度是不一样的：

（1）人眼对图像边缘区信息的失真很敏感；

（2）人眼对图像平滑区信息的失真比较感敏；

（3）人对图像纹理区信息的失真不敏感。

长期以来，人们试图建立人类视觉系统的数学模型，本文采用Ngan[5]提出的模型，即

其中，

a，b，c为常数；

f为视频率，单位为周/像素（cycle per pixel，简称CPD）。

根据Ngan的研究，人眼对3～6 CPD的空间频率分量最为敏感。利用上述视觉模型对小波系数进行加权，可把空间频率f的单位变换为小波系数域（付氏域）的单位周/像素（cycle per pixel）。表1给出三级小波高频系数的视觉加权值。

3 人眼视觉特性小波零树编码算法（HVEZW）

如图3所示编码流程图，是将最低频子图和其他子图分开处理的方法，用无损预测编码对最低频子图单独编码，而对高频图像的编码采用如下的改进方法：

（1）小波分解高频系数进行视觉加权，对传统的扫描顺序进行改变，扫描不是从最后一级低频系数开始，而是从最后一级高频系数最大值开始，且按先水平方向高频、垂直方向低频，然后水平方向低频、垂直方向高频，再对角线方向高频；

（2）选择阈值的时候，是先在LHi最后一级分解的高频系数中选择，然后在LHi最后一级的高频系数中选择，最后是HHi中选择；依然按照2的整数幂从高到低排列量化阈值。根据阈值选取的子带顺序不同，产生的零树编码码流分别采用自适应算术编码、Huffman编码。

（3）如果第j层（三级小波变换，2≤j≤3）高频子带中的一个系数及其所有后代为零，定义该节点为j-1级ZTR（零树根），然后依此类推。如果同一关系树中有数个ZTR，则只对最高级ZTR进行编码。解码时，根据ZTR的级数，确定开始补零的层以及具体的起点；

（4）根据给定的阈值T做出一轮扫描后，将高频子带系数分成了3类：非零点、ZTR（零树根））、IZ（孤立零）。显然，要表现这3种情况都需要消耗额外的比特数，由于IZ的产生是因为第j层子带的一个系数无意义，但其后代中有非零点。将IZ的量化值重新恢复进来，与非零点一并进行编码，这时所有的高频子带系数就只有两类了：非零点、ZTR（零树根）。这样在有效减小图像失真的同时，提高了编码效率。

（5）对除LL3子带外的每一个高频子带，都建立一个编码信息表，用来表明对应系数的分类情况。如果值为1，则表示对应系数为非零点，参与量化编码；如果值为0，则表示对应系数为ZTR，不需要参与量化编码。

图3 HVEZW编码流程图

4 实验结果与分析

为了验证上述算法的正确性，对MPEG-4标准测试序列图像Claire第15帧灰度图像进行EZW编码压缩和HVEZW编码压缩。如表1得出在不同的压缩比下，得到的重构图像的PSNR及MSE。

表1 EZW和改DFEZW对Claire图像编码结果

通过对比能够得出下面的结论：在相同的压缩比下，应用HVEZW算法，能够提高重构图像的PSNR、降低图像的MSE，明显地提高了图像编码的效率，即在较低码率的情况下仍能很好的恢复图像。这主要是因为HVEZW算法在进行零树量化之前，对最低频子带进行单独处理，对高频子带进行视觉加权，这样在不影响图像整体压缩比的情况下，提高了编码效率和恢复图像的品质。如图4，从视觉效果上来讲，采用HVEZW算法重构图像的视觉效果，要比采用EZW算法的重构图像效果稍好。

图4EZW编码与DFEZW编码结果比较

5 结束语

基于视觉特性的小波零树图像编码压缩方法，充分利用了小波系数的特点和人眼视觉特性，重建图像的主观效果比较好，达到了压缩比高而失真度减少的目的。

[1]张旭东，卢国栋，冯健.图像编码基础和压缩技术-原理、算法和标准[M].北京：清华大学出版社，2004.

[2]沃焱，韩国强，张波.基于视觉特性的静态图象压缩编码[J].中国图象图形学报，2003，10（10）：248-302.

[3]王娜，贾传荧.一种改进的无表零树编码的图像压缩方法[J].电子学报，2003，31（6）：879-881.

[4]沈兰荪，卓力，田栋，汪孔桥.视频编码与低速率传输[M].北京：电子工业出版社，2001.

[5]Kunt M，Kocher M.Second generation image coding techniques[J].Proceedings of the IEEE，1985，73（4）：549-575.