王树亮,王巧英
(江苏理工学院 计算机工程学院,江苏 常州 213001;2.江苏理工学院 卫生所,江苏 常州 213001)
JPEG是Joint Picture Expert Group的缩写,即联合图像专家组。JPEG2000是由ISO/IEC JTCISC29标准化小组负责制定的。ISO是我们所熟悉的国际标准化组织(International Standard Organization)。而IEC是国际电工协会(International Electrotechnical Committee),它是一个负责电工技术标准化的委员会。实际上,有许多工程师既是ISO的成员,又是IEC的成员。因此,它们的很多标准是一样的。而JTCI就是它们的领导小组。其中的SC29负责JPEG2000标准的制定。SC29分WG1、WG11、WG12三个小组。WG1负责JBIG(Joint Binary Image Group即二值图像的压缩标准)和JPEG标准的制定;WG11负责MPEG(Move Picture Expert Group即运动图像专家组)标准的制定;WG12负责MHEG(Multimedia Hypertext Expert Group即多媒体超文本专家组)标准的制定[1]。
在JPEG出台前,对大量高质量图像的存储量的要求一直是图像得以广泛应用的障碍。问题不在于缺乏图像压缩算法,而是缺乏一种允许在不同的应用之间进行图像交换的标准算法。JPEG对于上述问题提供了一种高质量,同时也是非常实用和简洁的解决办法。JPEG静止图像压缩标准在许多不同的领域得到了广泛的应用。它采用的DCT变换编码和熵编码,具有适中的计算复杂性,易于硬件实现,由于它在保证图像质量的前提下能提供较高的压缩比,通过使用专用压缩芯片,JPEG甚至可以用于较高波特率下连续图像的传输。通过对JPEG标准的深入研究,可以了解图像压缩方面的许多原理和知识,并且可以灵活应用到自己研究项目或软件开发中。
由JPEG压缩方法而节省的数据是大量的。例如,一幅727×525的真彩色图像,其原始的每个像素24位格式占用1 145K,GIF格式是240K,非常高质量的JPEG格式为155K,而标准的JPEG格式则仅为58K,当在显示器上观看时,58K的JPEG同GIF的质量相同,155K的JPEG比起256色要好得多。JPEG重建后的真彩色图像与使用一个像素一个像素存储的原始图片相比,几乎看不出什么区别。事实表明JPEG方法对于大多数类型的图像均能取得比较满意的编码压缩结果。
尽管基于分块DCT变换编码的JPEG图像压缩技术已得到了广泛的应用,然而在低比特率压缩时,这种编码的一个主要缺点是产生方块效应,严重影响解码图像的视觉效果。其主要原因是低比特率压缩的粗量化过程在各个方块内引起高频量化误差,各子块独立编码而没有考虑块间的相关性,从而造成块边缘的不连续性。此外,由于舍去了图像的高频信息,因而编码图像的边缘难以很好地保持,例如图像中有文字的地方,这样的失真就显得很明显。目前去除方块效应的方法可分为两类:第一类是在编码部分采用重叠分块的方案,但这会提高图像传输的比特率,加重编码和解码的负担;第二类是后处理技术,即对解码图像进行增强或图像恢复等处理。一般地,较多采用的是第二类。现有的后处理方法主要包括各种结合边缘检测和增强的空间滤波算法,基于凸集投影(POCS)的迭代算法、约束最小平方算法(CLS)和图像最大后验概率(MAP)估计等。这些方法一般都可以达到减少方块效应的效果。但是,简单的低通滤波会导致对图像边缘和纹理的过度平滑,而各种图像估计的迭代算法则有计算量过大的缺点[2-3]。
一个好的去除方块效应的算法应该在平滑人为方块边缘的同时能够保留原图像的边缘,为此必须进行有效的边缘检测和边缘增强。初步研究表明,基于小波变换的低比特率压缩图像的后处理技术能有效地减少方块效应和保留图像的重要边缘,并且具有计算复杂性较小的优点。图像小波变换具有多分辨率的特性和时频局部化特性,它在兼顾图像噪声平滑和图像边缘检测方面表现出良好的性能,因此,十分适合解决JPEG压缩图像的去方块问题。实验表明JPEG图像的高频量化噪声主要表现在第一级小波分解的高频分量,并且有明显的结构性质,即在第一级小波分解的高频分量显现明显的块状效应,而在第二级小波分解的高频部分和低频部分中则几乎没有表现,因此,对第一级小波分解的高频分量方块边缘及其邻域的像素进行平滑,可以有效减少表现为高频噪声的块状效应。
现在随着多媒体和网络的发展,图像压缩技术的应用范围越来越广,人们对图像质量和图像功能的要求越来越高,这些变化要求压缩编码算法具有高效率性、灵活性和互换性。例如:
(1)低比特率压缩(0.1bit/像素)。现在的压缩标准JPEG在中等或高比特率下能够提供非常好的图像质量,但在小于0.25bpp的低比特率下,对于具有复杂细节的图像,失真变得无法接受。
(2)无损压缩和有损压缩。现在的静止图像压缩标准没有一个能在单一码流中提供很好的有损压缩和无损压缩。
(3)大尺寸图像。现在的JPEG算法不允许图像尺寸大于64 000×64 000。
(4)在噪声环境中传输。现在的JPEG虽然规定了重起间隔(restart intervals),但是一旦遇到误码,图像质量将受到严重损害。
(5)对计算机合成的图像进行压缩编码。现在的JPEG是为压缩连续色调的自然图像优化设计的,对于计算机产生的人工图像压缩性能不佳。
(6)复合文档。对于包含自然图像、计算机图形、黑白二值文字的复合文档,现在的JPEG压缩性能很差。
面对这些新的要求,传统的JPEG显得力不从心,于是新的图像压缩标准JPEG2000在此要求下逐渐酝酿出台,JPEG2000的研究工作始于1996年,在2000年3月,JPEG2000第一部分的委员会最后草案(Final Committee Draft)ISO/IEC FCD15444 -1 -2000(V1.0,16 March 2000)正式提出,现在逐步向 ISO国际标准迈进。
随着多媒体应用领域的激增,特别是计算机网络的发展,传统JPEG压缩技术已经无法满足人们对多媒体图像资料的要求。因此,具有更高压缩率以及更多新功能的新一代静止图像压缩技术JPEG2000就诞生了。顾名思义,JPEG2000是为21世纪准备的压缩标准,正式名称为“ISO 15444”,同样是由JPEG组织负责制定。自1997年3月开始筹划,但在开始两年间,在算法选取问题上耽误了不少时间,人们普遍预计要到2000年12月JPEG2000才能制定完成,但在2000年3月的东京的一个会议上,由于数字照相机厂商们施加压力,规定基本编码系统的最终协议草案提前出台,因而不用改名为JPEG2001了。目前,它的总体框架已经完成,剩下的工作只是它的细节。由于其功能强大,效率卓越,受到计算机界人士的广泛关注。
JPEG2000相对于以往的JPEG标准有一个很大的飞跃。之所以这样说,是因为它有许多原先的标准所不可比拟的优点。JPEG2000的主要优点和特点有:
(1)JPEG2000作为JPEG的升级版,高压缩(低码率)是其目的,其压缩率比JPEG高约30%。反之,在压缩率相同的情况下,JPEG2000的影像质量明显优于JPEG。JPEG最大的缺点是,在高压缩率下所处理的图像由于前面所述的方块效应而发生失真,也就是的人们所说的马赛克现象非常严重。而用JPEG2000进行处理就基本看不到马赛克,图像中景物的轮廓能比较清晰的表现出来。在低压缩率下,虽然JPEG压缩的图像马赛克小了很多,但还不能完全清除,甚至会很明显。而JPEG2000用一半的压缩率来压缩的影像依然比JPEG的图像清晰。
(2)JPEG2000同时支持有损压缩(Lossy Compression)和无损压缩(Loseless Compression)。在实际应用中,有一些重要的图像,如卫星遥感图像、医学图像、文物照片等,通常需要进行无损压缩。对图像进行无损编码的经典方法-预测法已经发展成熟,并且作为一个标准写入了JPEG2000中。
(3)JPEG2000有一个很好的优点就是误差稳定性好(Robustness to Bit Error)。因此,使用JPEG2000的系统稳定性好,运行平稳,抗干扰性好,易于操作。
(4)JPEG2000能实现渐进传输(Progressive Transmission),这是JPEG2000的一个非常重要的特征。它先传输图像的轮廓,然后逐步传输数据,不断提高图象质量,让图像由朦胧到清晰显示,以满足用户的需要。而不必是象现在的JPEG一样,由上到下慢慢显示。这在网络传输中有着重大的意义。随着网络用户飞速增长,狭窄的带宽成为网络进一步发展的瓶颈。当网上传输的速度很慢时,下载一个图片的耗时便不能让人忍受。在大多数情况下,你需要等到出现整个图像之后,才能决定是否需要这个图像。如果你干等了半天之后,发觉所传输的图像不是你想要的,那么可以想象你的愤恨了,尽管能通过改进硬件和网络来提高带宽,但是这种改进毕竟有一个极限,而且需要一个很长的过程。有了JPEG2000后,这个问题就可以得到解决了。当你下载一个图片时,你马上可以看到这个图片的轮廓或这个图片的缩像,然后你就可决定是否下载他了。而且,在你决定下载的情况下,你也可以根据你的需要和带宽,决定你下载的图像质量的好坏,从而动态控制数据量的大小。
(5)JPEG2000另一个极其重要的优点就是ROI(Region of Interest,即感兴趣区域)。可以任意指定感兴趣区域,在这些区域,可以指定特定的压缩质量,或在恢复时指定特定的解压缩要求。例如,可以选择指定的部分解压缩。这给人们带来很大的方便。因此,在有些情况下,图像中只有一小块区域对用户是有用的,对这些区域采用低压缩比,而感兴趣区域之外采用高压缩比,既能保证不丢失重要信息,又能有效地压缩数据量,这就是基于感兴趣区域的编码方案所采取的压缩策略。基于感兴趣区域的压缩方法的优点,在于它结合了接受方对压缩的主观要求,实现了交互式压缩。而接受方随着观察,常常会有更新的要求,可能对新的区域感兴趣,也可能希望某一区域更清晰些。
(6)JPEG2000还考虑了人的视觉特性,增加了视觉权重和掩膜,这样在不损害视觉效果的情况下,大大提高了效率。
(7)JPEG2000与传统JPEG最大的不同在于它放弃了JPEG所采用的以离散余弦变换为主的区块编码方式,而改采用以小波变换为主的多解析编码方式。小波变换的主要目的是要将图像的频率成分按子带抽取出来。余弦变换是经典谱分析的工具,它考察的是整个时域过程的频域特征,或者整个频域过程的时域特征,因此,对于平稳过程有很好的效果,但是对于非平稳过程,它的不足是显而易见的。小波变换是现代谱分析工具,它既能考察局部时域过程的频域特征,又能考察局部频域过程,因此,即使对于非平稳过程,它也是强有力的工具。
近年来离散小波变换在包括压缩在内的图像处理与图像分析的各个领域中得到了广泛应用。这主要是因为小波的时频局域化使它在信号分析中有着优良的性质,而且由于它对高频成分采用由粗到细渐进的时空域上的取样间隔,从而能像物理上自动调焦看清远近不同景物一样放大任意细节。因此,小波分析被誉为数学上的显微镜,是均等图像多分辨率表示的有力工具,它的快速算法又使它如虎添翼,它的多分辨率分析提供了进行渐进式压缩的基础。
小波在空间和频域上的局域性,是统计意义上的局域性。这里所说的局域性,指的是一个变换系数,实际牵涉到的图像空间范围是局部的。因而,要完全恢复图像中的某个局部,并不需要所有的编码都被精确保留,只需要对应于它的一部分编码没有误差就可以了,所以能实现无损压缩和感兴趣区域压缩。
一般讲,JPEG2000的应用领域可概括分成两部分,一为传统的JPEG市场,像打印机,扫描仪,数码相机等;一为新兴应用领域,像网络传输,无线通讯,医疗图像等。目前对JPEG2000热情最大的是那些数字照相机厂商。由此可见,JPEG2000和JPEG相比优势明显,且向下兼容,取代JPEG格式将是必然趋势。
[1]Christopulos C,Ebrahimi T,Skodras A.The upcoming JPEG2010 standard[A].In:Proceedings of invited tutorial to the 11th Portuguese coference on Pattern Recognition(RECPAD2000),Porto,Portugal,2000:359 -368.
[2]Rabbani M,Joshi R.An overview of the JPEG2000 stiff image compression standard[J].Signal Procession:Image Communication ,2002,17(1):3 -48.
[3]Taubman D.High performance scalable image compression with EBCOT[J].IEEE Transaction on Image proceeding.2011,9(7):1 158-1 170.