周宁
摘要:多媒体技术近些年正处于快速发展阶段,应用领域持续提升,相对应的技术水平也在不断改进。多媒体数据压缩技术属于多媒体技术持续发展与应用的关键,当前来看多媒体数据压缩技术具备可拓展、高压缩比、可交互等多方面的优势。
关键词:多媒体;数据技术;压缩技术
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2021)12-0200-02
1多媒体数据压缩的意义
近些年随着微电子技术、计算机技术、网络技术的持续性发展,多媒体信息技术处理中,最为基础的需求便是动态实时性的处理动画、声音以及视频资料,图像的数据量是非常庞大的,如果不对视频信息进行压缩处理,会导致数据传输效率下降,从而无法实现实时性传输。虽然当前的存储技术以及网络技术处于持续提升状态,再加上网络带宽、移动通信技术的持续发展促使信息传输容量以及速度得到了明显的提升,但是想要更大程度的降低带宽压力,提升通信干线的传输效率,需要应用计算机实时音频与视频的处理,从而保障高质量的音频与视频处理,所以多媒体数据压缩显得非常重要。
另外,对于多媒体信息压缩技术而言,其需要有效实施的原因还涉及:1)原始图像数据具备较高的相关性,存在比较多的冗余度,数据冗余会导致比特数的浪费,此时消除冗余时可以有效节省码字,从而达到压缩的目的。每一帧图像可以通过帧内相近的像素之间空域关联性,所以数据本身也存在较大的空间冗余;2)图像编码本身具备一定失真率,这也是图像可以有效压缩的主要原因。在许多应用场合中,并没有要求压缩和复原后的图像与图像完全相同,而是允许少量的失真。在少量失真时基本不会被发现,在大多数情况下都是可以被接受的。另外,还可以借助新技术实现对图像压缩编码的对象特性维持可预知特性,例如在可视电话当中,编码对象主要是以人的头肩像,可以充分应用编码对象的先验方式实现建模,并借助模型参数的提取与编码实现对图形的加工,从而达到大量码子的减少,呈现出较高的压缩比。
2多媒体数据压缩技术的软件实现
2.1 编码器基础原理
借助数据压缩技术的标准视频框架简单级别的基础定义,视频编码主要是将运动估算补偿、离散余弦变换、标量量化以及游程编码为主。对于编码控制机制而言,其主要是采用率失真模式进行计算,从而决定采用帧内或帧间的编码方式。假设是帧内编码模式,则原视频数据需要借助DCT变换、量化以及行程编码。并借助合成器实现对视频流的压缩,此时可以重构预制帧,并作为下一编码帧的参考数据。假设采用帧间编码模式,需要先基于参考帧值作为帧内编码时的重构预测值,如果上一帧属于帧间编码,则对源数据进行预测并获得误差。对于预测误差值以DCT变换与量化,同时采用RLC进行编码。编码的结果可以和编码模式、运动矢量以及量化参数等编码参数一同转变为可变长编码,并借助合成器进行压缩。此时可以重构预测帧,并为下一帧参考使用。
2.2 整体框架
编码器的实现核心在于提供一个简单的编码接口函数,这一接口函数主要是按照编码的三个不同阶段提供三个基础入口。接口函数的封装主要是处于静态链接库当中,并在编码期间提供支持。按照编码接口函数对视频序列进行编码处理。先做好编码初始化处理,并调用初始化的接口函数,并循环到每一视频帧,借助接口函数对视频帧进行编码处理,最终应用资源释放接口函数释放内存。完成的流程如下:(1)初始化。设置变换编码,其中涉及离散余弦变换以及逆离散余弦变换的变换矩阵;(2)导入编码的参数涉及帧率、比特率以及矩阵率等数据,同时还需要导入最值量化参数以及运动估计搜索范围;(3)为编码、参考、重构以及残差提供内存并进行初始化;(4)配置相关参数,做好比特率控制的初始化处理,编码处理视频帧并。这一环节的操作相对复杂,需要先读入原始帧,并将原本输入导入到编码的分量当中初始化比特率后为其输入数据并准备,假设编码属于第一帧,则计入VO与VOL的头信息,调用VopCode函数实现对帧的编码。在根据返回的编码长度以比特率的方式进行控制,并借助函数处理更新控制参数。
2.3 资源释放
在上述的编码阶段中,编码视频帧属于关键性环节,编码需要分别针对每一个编码、参考、重构以及残差的阶段,通过编码器可以基于数据压缩技术的技术标准视频框架的简单级别,将原始视频序列当中的每一帧图像当作是矩阵数据,并基于预测数据以及帧内数据实现编码处理。对此,在编码视频帧时,需要注重函数对于输入视频帧的编码处理。基于函数VopCode的实现流程,其需要先判断编码VOP的类型,假设属于P-VOP,则需要先实现运动估计与补偿,在获得绝对平均值误差值与帧内宏块比例;判断编码是否存在误差以及帧内的预测值编码结果,并判断是否继续应用P-VOP类型进行编码,如果存在明显的失真则应用帧内编码模式进行处理;假设编码的VOP类型属于I-VOP,则直接进入到帧内编码模式;在帧内预测编码以及帧内编码期间,也可以获得重构帧,此时可以作为下一幀编码的参考帧,并作为其他参考帧应用,此时还可以进行重复的填充处理。编码的整个过程可以划分为三阶段,分别为运动估计与补偿、帧内预测编码以及帧内编码三个阶段。运动估计与补偿主要是对应当编码的原理图MC、ME进行处理,而帧内预测编码则采用便利图当中的量化、逆量化、DCT等数据处理为主。两种方式的差异主要在于预测值的应用,帧内编码主要是对原始帧进行处理,帧内编码不仅涉及编码参数的控制还需要涉及运动矢量的编码。
2.4 运动估计与补偿
本文基于改进的运动估算算法作为基础实现运动估算算法,为了更好地保障搜索的精度,需要在实施期间采用两种方案。一种是将整像素和半像素的结合估计计算方式,改进运动估算算法的基础上提升整个搜索的精度与速度。另一方面在于将单适量估计和四适量估计结合起来,从而实现预测精度的提升。为了更好地满足具体应用的需求,可以在应用中允许全局搜索与部分搜索的选择,并基于具体的应用特征采用最佳的搜索算法。运动估计与补偿的实现函数应用期间,其作用核心在于估算运动矢量,同时提供适当的运动补偿。整体来看,需要先读取目前的VOP信息,并应用初始化方式实现对数据变量的控制,并借助函数的调用获得半像素精度的数据,借助函数的应用为运动矢量与模式需求数据分配相应的内存;应用函数实现运动补偿;应用函数释放部分的内存压力。函数的应用核心在于实现对运动向量以及误差的预测,并完成整个VOP运动函数的预测,这一函数主要是针对VOP当中每一块宏块实现运动估计,从而实现二重循环,对其中每一帧进行处理。
2.5 帧内编码
帧内编码的功能属于VOP内部纹理编码,其可以在不通过其他参考帧的情况下独立的完成编码,编码过程可以基于某一个VOP当中的宏块进行处理,每一个宏块涉及4个亮度块与2个色差块,帧内编码的函数方面,其核心在于二重循环,对于每一个宏块实行编码时,每一次循环便需要对MB的编码划分为三个步骤,分别为宏块的变换、量化以及重构,不同类型编码系数的编码时,变换和量化的结果编码。函数可以实现对原本框架下的DCT、量化以及逆量化的处理,将原始数据实行DCT变换与量化处理,保存变化与量化的结果,将逆量化与逆DCT变化获得重构的视频帧。在处理期间需要针对每一个块实行变换与量化,变化与量化的具体实施需要基于具体情况选择。函数实现的首要步骤在于变换与量化结果的编码,假設实行ACDC的预测,可以先基于DC系数实现对DPCM编码与VLC编码,并对AC系数实行RLC编码与VLC编码,假设没有ACDC预测,则以统一方式完成对变换系数的RLC与VLC编码。DCT的变化属于视频编码中的关键算法,其运行次数越多则运算量也会越大,变换的速度会直接决定编码的速度,目前可以应用二维的DCT分解方式实现对一维DCT计算与列向DCT的计算,并基于组合运算方式实现对DCT变换的控制,尽可能减少运算的复杂性,提升变换的速度。在量化方面,可以通过DCT变换获得8X8的系数矩阵,并借助量化方式获得8X8的量化系数矩阵,量化的实现主要是应用H.263标准进行量化处理,并基于块的类型采取相应的量化处理方式,其中DC与AC系数的量化需要区别性对待。DC预测的差分应用DC系数进行编码,在DC预测的情况下对于差分DC系数的编码可以应用DPCM进行编码,先对差分的DC系数位置进行编码,后应用系统定义的固定DC系数进行VLC码表,之后对差分的DC系数进行编码。对于非DC预测的DC系数编码需要在不预测的情况下直接进行编码。在AC系数的编码期间,整个编码过程划分为2个步骤,分别为Z形的扫描序列矩阵以及三种Z形扫描矩阵。借助对Z扫描的方式可以获得序列数据的DC系数,并对序列数字进行编码,长度方面应当跳过零量化的系数个数,并基于层次方面对非零量化系数进行判断,每一个非零量化系数需要和前面零量化系数的个数run形成对应。借助行程编码可以run数后,对其实行变长编码,应用系数给定固定码表,通过VLC表在大量统计分析基础上,对大多数情况都可以适用,同时额外传送VLC码表获得比特量后,无法保障压缩比的提升。变长编码方面可以基于VLC码表当中查询具体的数据,并基于run、level数值确定最终的系数,从而获得压缩结果。
3结语
综上所述,随着近些年多媒体技术的持续性发展,MPEG-4成了最为广泛的多媒体数据压缩方式,具备广泛性应用优势,相对于以往的压缩标准,MPEG-4已经不再是单纯的视频音频编解码标准,其内容和交互性优势明显,这也是推动多媒体数据压缩技术持续稳定发展的重要方向。在今后,需要进一步深入探究多媒体数据压缩技术,基于技术的改进,优化匹配块的运算估计以及快速搜索算法,从而推动网络信息技术持续稳定发展。
参考文献:
[1] 李琰.多媒体数据压缩算法研究与实现[J].计算机产品与流通,2018(2):118.
[2] 韩慧.多媒体计算机图像数据压缩的实现研究[J].通讯世界,2018(10):49-50.
[3] 杨阳.物联网中数据压缩与资源分配的研究[D].重庆:西南大学,2019.
[4] 张琰.对多媒体数据压缩技术的一些探讨[J].信息与电脑(理论版),2011(2):165.
[5] 袁佳乐.浅析多媒体图像压缩和转换技术[J].科技信息,2010(30):650.
【通联编辑:代影】