基于人工智能技术的运动教学视频压缩算法

2020-12-07 06:12姜龙骆勇
现代电子技术 2020年21期
关键词:压缩算法人工智能技术

姜龙 骆勇

摘  要: 传统的运动教学视频压缩算法压缩帧数少,信噪比低。为了解决上述问题,提出基于人工智能技术的运动教学视频压缩算法,利用多线性子空间KL变换技术进行运动教学视频编码,引用人工智能技术中的钻石搜索法构建视频压缩算法,分析视频图像运动中矢量的基本规律来检测算法的有效性,确定多个子空间的数据,将视频帧数进行分辩,分辨出新的变量进行XL变换处理来完成教学视频编码,编码后采用钻石搜索法的两种模式进行互补,从而确定出最小误差点,利用SAD算法算出最佳匹配矢量,完成运动教学视频的压缩。与传统算法进行实验对比,结果表明,基于人工智能技术的运动教学视频压缩算法压缩帧数多、信噪比高、清晰度高,具有很好的压缩效果。

关键词: 人工智能技术; 运动教学视频; 视频压缩; 压缩算法; 视频编码; 最小误差点确定

中图分类号: TN911.73?34; TP18                  文献标识码: A                     文章编号: 1004?373X(2020)21?0055?04

Sports teaching video compression algorithm based on artificial intelligence technology

JIANG Long1, 2, LUO Yong2

(1. Jiangsu Normal University, Xuzhou 221116, China; 2. Lianyungang Technical College, Lianyungang 222000, China)

Abstract: As the traditional sports teaching video compression algorithm has fewer compressed frames and lower signal?to?noise ratio, a new sports teaching video compression algorithm based on artificial intelligence technology is proposed. The multi?line subspace KL transform technology is used for sports teaching video coding. The diamond search method in artificial intelligence technology is used to construct video compression algorithm. The basic law of vector in video image motion is analyzed. In order to check the validity of the algorithm, the data of several subspaces is determined, and then the number of video frames is discriminated to get new variables and perform XL transform processing, so as to complete the teaching video encoding. The two modes of diamond search method are adopted for complementary after encoding, so as to determine the minimum error point. The SAD algorithm is used to calculate the best matching vector to complete the compression of the sports teaching video. The results of comparison experiment show that, in comparison with the traditional algorithm, the sports teaching video compression algorithm based on artificial intelligence technology can get many frames compressed, and has high signal?to?noise ratio, high definition and good compression effect.

Keywords: artificial intelligence technology; sports teaching video; video compression; compression algorithm; video coding; minimum error point determination

0  引  言

现在的教育不仅仅是知识的教育,而是全面发展的教育,让学生在运动、智力、意志力、情感等方面得到全面和谐的发展,各个大学都开展了运动教学,它引导学生开展各种活动,通过学生在学习和掌握运动技能的反复练习中锻炼学生的身体,达到增强体质的目的。体育课也传授个人卫生方法的知识,使学生养成讲究卫生的好习惯,提高学生的健康水平[1]。某些高校为了提高学生的自主学习能力,用人工智能技术的运动教学视频来传授知识。因此本文基于人工智能技术研究了一种新的运动教学视频压缩算法[2]。

人工智能技术的运动教学视频压缩算法是一种有效的算法,其中最重要的环节就是视频压缩处理和编码变换处理。当前,有学者提出压缩方法主要利用关键帧检测和指示符运动建模的智能教学视频的压缩算法[2],还有学者提出基于运动矢量细化的帧率上变换与HEVC结合的视频压缩算法[3]。但是这两种方法运行复杂,运算时间长,所以本文采取简便高效的钻石搜索法。为了提高压缩率,本文结合了多媒体扩展指令集(MMX)技术,在进行编码处理变换时,采取KL变换,降低局限性[3]。为了提高编码处理的全面性,本文提出基于多线性子空间KL变换的压缩视频方法,通过广义主成分分析法(GPCA)将视频图像信号映射到多个线性子空间,让每个子空间的变换系数都靠近,可以使编码获得更好的结果。

1  基于多线性子空间KL变换的运动教学编码视频

本文将GPCA方法和KL变换结合应用于运动教学视频编码,即提出了基于多线性子空间KL变换的运动教学视频编码[4]。GPCA是把多个线性子空间中的数据集分割出来,估计线性子空间的维数和基向量。本文用这一方法进行图像和视频编码,单一的输入样本不能保证是在分割出的各个小方块中,所以本文需要足够多的样本证明实验的准确性[5]。虽然GPCA方法的计算复杂度很高会消耗大量的计算时间,但是通过降低子空间的维数和减少子空间分割出的个数,让GPCA方法在一般情况下是可行的[6]。

处理后的GPCA可以进行运动教学视频的压缩,这种视频压缩方法比DCT方法消耗时间少、更加便捷[7]。GPCA法主要是利用图像帧数进行KL变换处理,通过离散小波变换得到图像的第一个帧数的一个多尺度分解,分解出图像中的低频信号和高频信号,然后利用GPCA方法分割各个线性子空间的数据,最后对分割的有效数据进行KL变换编码,从而对运动教学视频更好的进行压缩。解码时需要截取低频信号和高频信号,这样才能得到完整的视频编码。

单一尺度图像变换编码时,视频帧会划分成一个个大小相等的子块,因为图像的纹理特点不同,很难在同一个线性空间中进行平均分割,所以直接对视频帧分割处理是有局限性的[8]。为了解决这一局限性,本文先对图像帧数进行访问,根据访问结果进行运动预测,根据预测结果进行视频编码。通过预测结果更好地了解图像的高频和低频区域,准确地分割[9]。如果分割的都是低频子带会导致只得到基本层的解码;如果分割的是高频子带也会导致解码不全面,只有低频子带和高频子带都分割才能得到比较完整的视频编码。通过合理的方法将视频帧分割成大小相等的子块,接下来利用小波的多分辨、多分析过程将图像的高频分量和低频分量进行分层,具体编码流程如图1所示。

1) 输入视频帧并对输入的帧进行小波分析分辨;

2) 对分析出的高频和低频进行分组形成新的向量;

3) 对组成的新向量进行KL变换处理;

4) 对变换处理得到的系数进行量化,最后输出视频编码。

输入一个图像帧,经过小波分析分辨形成了三层波层、一个低频分量和三个高频分量,图片左上角为低频分量,将子带中三个高频分量系数组成一个新的向量,低频分量进行KL变换处理与新的向量分开,向量进行GPCA运算和KL变换,得到运动教学视频的编码如图2所示。

2  基于人工智能技术的视频压缩算法

应用人工智能技术中的钻石搜索法构建视频压缩算法,分析视频图像运动中矢量的基本规律[10]。钻石搜索法是把要搜索的范围放在一個大的圆形区域内,在圆形区域内分布好正方形小格子,圆形与每个小格子的交点代表待搜索点的位置,在搜索点搜索图像的频谱如图3所示。

因为视频图像的频谱大多数是菱形的,与钻石的形状非常相像,所以钻石分割法非常适合视频压缩。钻石搜索法包括大钻石搜索模式和小钻石搜索模式[11]。如图4和图5所示。

虽然两种搜索模式很相似,但选择时不能随意选择。搜索模式的大小和形状会影响到搜索的速度和精确度,所以在选择时要十分的谨慎,选择最合适的钻石搜索模式[12]。钻石搜索法的基本操作为:先用大钻石搜索模式进行搜索,确定出小钻石搜索模式的边界点进行运算,发现最小误差点,如果最小误差点在各个小格子的交点上则直接进入最后搜索阶段,进行小钻石搜索模式,判断出最佳匹配块的运动矢量。如果发现最小误差点不在各个小格子的交点处,则以上一次找到的最小误差点为中心点,对局部没有匹配的点进行SAD运算,最后取平均值,提供最佳匹配矢量点。

虽然操作是循环操作,但在执行时只需要进行条件判定,符合条件则执行相应的操作,这种方法大大提高了CPU的利用效率,节约时间。通过舍弃部分运算结果进行编码可以更好的进行视频压缩,钻石搜索法为人工智能技术的视频压缩节省了空间,提高了压缩率。

运动教学视频压缩算法计算式为:

[SAD(m,n)=m=1Mn=1Nbk(m,n)-bk-1(m+j,n+j)] (1)

式中:[bk(m,n)]和[bk-1(m+j,n+j)]分别代表第[k]帧和第[k-1]帧像素点[(m,n)]的亮度值;[M]和[N]为水平和垂直像素数;[j]为最大可能平移的水平和垂直像素数[13]。

虽然钻石搜索法提高了视频压缩率,但钻石搜索模式在进行SAD最小误差点运算时包含大量的循环运算,这种频繁的循环运算非常适合MMX技术。MMX技术为钻石搜索法释放了额外的处理器周期[14]。

MMX和钻石搜索法互相补充,大大地提高了视频的压缩率。结合后可以准确地计算出SAD值并且运算时间大大减少,与单独运用钻石搜索法相比速度提高了3倍,使用MMX指令计算绝对值不需要计算中间结果和分支,直接计算运动矢量估计绝对值。这样用8位精度计算了绝对值不需要利用16位精度,也无需条件分支语句,使人工智能技术的视频压缩变得更加简单[15]。

3  仿真测试结果与分析

为检测本文研究的算法效果,设计对比实验,通过两种不同的方法对视频进行压缩,实验对比量为:压缩完成的时间和相应的压缩所需要的帧数即运动教学视频的压缩率。选取的运动教学视频文件是运动预备知识的视频,视频中男子有轻微的手部和腿部动作,用钻石搜索法和传统压缩法对该视频进行压缩。首先对视频图像帧数进行分割,然后根据各自的方法进行视频压缩,因为实验会受到电压、计算机的影响出现误差,所以本文最后的压缩时间和压缩率都取多次实验的平均值。通过三种方法对运动教学视频压缩得出结果,对比图如图6所示。

由图6可知,钻石搜索法对运动教学视频的压缩率比传统方法的压缩率高。在相同的时间内,钻石搜索法压缩的帧数比传统方法多,且钻石搜索法的稳定性强,不受视频中人物动作的难易程度影响。所以钻石搜索法对人工智能技术的运动教学视频压缩比传统方法更加完善。

本文将GPCA方法和多线性子空间KL变换法相结合应用于运动教学视频的编码,即提出基于多线性子空间KL变换的运动教学视频的编码。针对一个女生说话的视频进行编码,用KL变换和三维空间等级树集的编码方法同时编码,对比最后编码成功的视频的清晰度和信噪比。

在KL变换编码过程中选取32帧图像序列进行离散小波变换处理,得到高频和低频信号并用GPCA方法分割出有效分量,最后进行编码处理,三维空间等级树集的編码主要利用小波系数变换分解出高频子带和低频子带,不同的是它是从低频向高频不断的分割,得到实验需要的子带。将子带中像素坐标[(i,j,k)]写入不重要像素表中和不重要集合中,代入式(1)得出编码处理,在编码过程中是以树为单位的。开始编码时需要对[i,j,k]三个向量进行分量初始化,得到初始化后的分量由公式算出平均值,从而完成整个编码过程。得到的编码结果如表1所示。

分析表1可知,本文算法编码的视频信噪比高、压缩比高、更加清晰、稳定。对于帧数变化不大的视频序列,采用本文的变换处理法可以收集到更多的边缘信息,编码出更清晰的视频。

对比分析本文算法、文献[2?3]算法对8种运动教学视频的压缩情况,结果如表2所示。

分析表2可得,本文算法对8种类型运动教学视频进行压缩过程中的压缩效率始终处于96%~99%之间,而传统算法压缩8种类型运动教学视频的压缩效率都低于本文算法。同时对比分析可得,相比其他两种算法,本文算法的平均压缩比高、信噪比高,说明本文算法压缩不同类型运动教学视频的压缩性能更佳。

实验为了分析本文算法的应用性能,在某高校中随机选择100名运动视频分析人员,采用问卷调查的手段得到这些人员对于本文算法的满意度,结果如图7所示。

全面分析图7可得,这些运动视频分析人员采用本文算法压缩运动教学视频过程,对于本文算法压缩运动视频的压缩便利性、压缩清晰度、压缩效果以及压缩信噪比的满意度都占据较大比例,说明本文算法的实际应用效果较佳,可大量推广使用。

4  结  语

本文运用GPCA方法和多线性子空间KL变换方法对视频进行编码,设计了一种有效的视频压缩算法。通过实验证明,钻石搜索法比H.263方法更适合视频编码。本文研究的基于人工智能技术的运动教学视频压缩已经应用到一些高校中,并得到了满意的结果。相信在今后基于人工智能技术的运动教学视频压缩中会发展的更好。

参考文献

[1] 冯佳.基于数据人工智能技术的体育网站开发编程[J].自动化与仪器仪表,2018(1):144?146.

[2] 孟春宁,陈梓铭,冯明奎,等.基于关键帧和指示符运动模型的教学视频压缩算法[J].激光与光电子学进展,2018,55(10):118?129.

[3] 蔡于涵,熊淑华,孙伟恒,等.基于运动矢量细化的帧率上变换与HEVC结合的视频压缩算法[J].计算机科学,2020,47(2):76?82.

[4] 马琳,张传新.体育人工智能的探讨[J].泰山乡镇企业职工大学学报,2006(4):40?41.

[5] 艾强,刘业飞.基于五人制足球网上体育教学系统的研究[J].电子测试,2018(13):179?180.

[6] 刘健,吴飞,姚蕾,等.基于多线性子空间KL变换的可伸缩视频压缩方法[J].电子与信息学报,2010,32(5):1188?1192.

[7] 杨春玲,余英林.基于三维小波变换嵌入式视频压缩算法的研究[J].电子学报,2019,29(10):1381?1383.

[8] 徐丽琨,黄登山.基于H.263标准的视频压缩算法的优化及研发[J].电力系统通信,2005,26(7):31?34.

[9] 祝世平,王再阔.一种基于对象的分形视频压缩算法研究[J].光电子·激光,2018,21(5):725?730.

[10] 须明,王博,何亦征,等.两种实时视频压缩算法DSP嵌入式框架方案比较[J].航空电子技术,2016,37(1):33?37.

[11] 李晓萌,王建军.低比特率下视频压缩算法的研究[J].计算机应用,2018,23(10):24?26.

[12] 陈秋华.一种内存读写数据压缩算法[J].中国集成电路,2018,27(7):42?47.

[13] 徐夏刚,叶正麟,张定华.分形视频压缩的一种快速算法[J].西北工业大学学报,2017,22(2):196?199.

[14] 王晓利.基于数学形态学的视频帧间压缩算法研究与实现[J].微计算机信息,2018,27(8):223?224.

[15] 钟代笛,张琦.压缩域内的视频图像处理算法[J].电视技术,2017,25(12):21?22.

作者简介:姜  龙(1987—),男,江苏东海人,硕士,讲师,主要研究方向为运动教学。

猜你喜欢
压缩算法人工智能技术
基于参数识别的轨道电路监测数据压缩算法研究
一种基于嵌入式实时操作系统Vxworks下的数据压缩技术
更正声明
人工智能技术在智能建筑中的应用
基于Hadoop平台的数据压缩技术研究
人工智能技术在电气自动化控制中的应用思路
智能技术在电气自动化方面的应用分析
人工智能在电气工程自动化中的应用研究
PMU数据预处理及压缩算法
基于HBASE的大数据压缩算法的研究