党 毅
(皖西学院实验实训教学管理部,安徽六安 237012)
随着互联网技术、解编码技术的发展,传统单一媒体授课形式逐渐被基于移动终端的多媒体教学形式取代,教育者可通过手机、电脑、平板等移动终端进行各种线上教学[1].随着多媒体应用范围的推广,用户对其实时通信服务提出了更高的质量要求.尤其在多媒体教学方面,要求在不同网络条件下,仍具有较高的数据传输效率以及数据传输质量[2].抖动缓冲是多媒体数据传输的重要环节,其能在一定程度上弥补网络抖动、提高相应视频播放质量,确保数据传输平滑顺利[3-4].移动终端的多媒体教学中,主要是通过视频通信的方式实现教学内容的传授.而视频通信的用户体验质量(QualityofExperience,QoE)容易被时延、抖动、丢包率等因素影响,为了保障QoE,此次研究将在改进抖动缓冲的基础上进行数据传输的优化.
抖动是指多媒体实时数据传输过程中,不同数据组的转发路径相同,但接收端接受数据包的间隔存在变化的情况[5].
如图1所示,抖动即为多媒体实时数据传输过程中,相邻数据包的相对延时变化.除抖动之外,数据包传输过程还存在乱序、丢包、到达太晚等问题[6].此次研究从网络数据传输抖动入手,通过抖动的缓冲优化,实现多媒体教学数据传输优化.网络数据传输抖动受传输路径、不同节点负载等两方面的影响.路径选择不同,传输距离不同,传输时延不同;当选择同一条传输路径时,不同节点负载不同,每个数据包排队时延不同,造成数据包间的传输时间的不同[7].
图1 数据包在传输过程中发生的异常Fig.1 Exceptions occurring during packet transmission
抖动易造成数据包乱序、丢失、网络拥塞,影响媒体播放质量.在接收端设置抖动缓冲模板,能够弥补抖动,从而确保多媒体教学中数据传输质量、平滑性及实时性[8].抖动缓冲模板的工作包含缓冲区接收新数据包、数据包的重排组帧、计算抖动时延并输出.
图2显示抖动缓冲模块更新流程,此次研究利用网页实时通信系统(WebReal-TimeCommunication,WebRTC)调节抖动缓冲区“深度”.设置抖动时延的“深度”时,需注意“深度”过大,会导致端到端的时延过大,不利于通信实时性;“深度”过小,会导致系统丢包率增加,不利于保障媒体的传输质量[9].其中QoS为服务质量(QualityofService),结合服务质量统计信息,设置QoS参数,进而设置缓冲器控制参数,完成动态抖动缓冲.
图2 抖动缓冲模块更新流程图Fig.2 Updating flow chart of dither buffer module
鉴于低丢包率是建立在牺牲端到端的时延上,二者不可兼得,具体情况如图3所示.
图3 端到端时延与丢包率等二者间的关系Fig.3 Relationship between end-to-end delay and packet loss rate, etc
如图3所示,随着端到端时延的减少,抖动时延的丢包率增加;抖动时延a的丢包率小于抖动时延b,但后者端到端时延小于抖动时延a,因此无法直接判断抖动时延a以及抖动时延b的好坏.可通过加权的方式,对二者进行度量.
(1)
式(1)为丢包率P与端到端时延的加权调和平均值F,其中β、D分别表示权值因子(显示数据传输中丢包率与端到端时延的重要性)、归一化后的端到端时延.当β>1时,显示端到端时延更为重要;当β<1时,显示丢包率更为重要;此次实验取β=1,两者重要性相当.与F相关系数最高的特征包括抖动时延、多媒体信道传输速率、数据传输中网络排队时延差及其变化趋势,因此需将这几个特征纳入后续模型训练.
针对数据中存在的数据缺失状况,可通过直接丢弃、填充、转换数据类型等方式进行处理;在处理异常值(明显偏离平均分布值)时,具体方法如表1所示.
实验中利用AdaBoost模型进行抖动缓冲预测模型的训练,AdaBoost模型训练中通过每轮基学习器拟合上一轮训练残差,最终将基学习器的预测值相加,获取最终预测值.
JitterDelay=iFrameDelay+noiseDelay
(2)
(3)
(4)
公式(2)中JitterDelay指总抖动时延,是弥补传输大帧造成的抖动时延iFrameDelay以及弥补网络噪声引起的抖动时延noiseDelay等两种时延组成.式(3)中“MaxFS”指“MaxFrameSize”,是多媒体通信过程中收到的最大帧值;“AvgFS”指“AverageFrameSize”,是截止到目前时刻的多媒体通信过程中,接收到的所有帧的平均大小;C为信道传输速率.式(4)中noiseStdDevs、noiseStdDevOff、varNoise分别指网络噪声系数、网络噪声扣除常数、网络噪声的方差.
(5)
式(5)为噪声noise的计算式,其中frameDelay、deltaFS分别指帧间时延、相对帧长,m指网络排队时延差.
dm(ti)=ti-ti-1-(Ti-Ti-1)
(6)
(7)
式(6、7)中dm(ti)指帧间时延,第i帧中所有数据包均顺利且无遗漏的到达接收端时间为ti,其对应的网络排队时延差为m(ti);第i帧中发送出第一个数据包的具体时间为Ti.
为了测试多媒体教学数据实时传输的状态,本次研究将媒体传输质量指标(MediaDeliveryIndex,MDI)与QoS参数,建立传输质量评估模型.该模型的建立考虑了丢包率、端到端时延、播放抖动等三项指标.
丢包率是指传输过程中数据包丢失的数量占发送端发送总数据包数量的比重.丢包异常将影响视频质量,导致视频图像播放效果变差,因此丢包率越低,数据的传输质量越高.
表2为用户感官与端到端时延的联系,端到端时延由采集时延、编码时延等多种时延构成.随着端到端时延的降低,多媒体通信实时性增加,多媒体教学数据传输质量越高.为了保障多媒体教学视频通信质量,应确保端到端时延在400 ms以下.实验中利用合页损失函数(HingeLoss)完成时延的控制,函数表达式如式(8)所示.
(8)
式(8)中|wx+b|指点x到平面上的距离;y(wx+b)可用于分类正确性与距离确信度的表示,其绝对值越大,决策边界对样本的区分度越好;w为法向量(原点到超平面的最短距离),b为位移实数.
图4 合页损失函数与二次平滑合页损失函数Fig.4 Hinge loss function and quadratic smoothing hinge loss function
delay=end_to_delay+hinge_loss
(9)
(10)
式(9)为在二次方平滑合页函数下,端到端时延的表现评估delay.由公式(9、10)可推测出,当端到端时延大于400 ms时,HingeLoss函数将充当高于400 ms部分时延的二次函数.换而言之,当时延超过400 ms时,对超过阈值的部分进行惩罚,多媒体机教学数据传输质量评估值由端到端时延与惩罚值组成.
playout_jitter=(renderi-renderi-1)-(renderi-1-renderi-2)
(11)
式(11)为播放抖动playout_ jitter的计算式,其与连续的三个视频帧(renderi-2、renderi-1、renderi)的具体播放时刻相关.播放抖动表示的是帧间相对播放稳定性,一般情况下,playout_jitter取绝对值.当播放抖动大于0时,说明与上一帧相比,当前帧播放速度降低.
E=ω1·packet_loss+ω2·delay+ω3·playout_jitter
(12)
式(12)为最终传输质量评价值E,w表示各指标对数据传输质量的影响权值,其中丢包率(packet_loss)的w1取0.4,端到端时延(delay)的w2取0.3,播放抖动(playout_ jitter)的w3取0.3.
为了验证AdaBoost模型的效果,此次研究将比较岭回归法、决策树回归法、随机森林法、AdaBoost法等四种模型的效果.其中岭回归属于单个学习器法,它通过找到一组参数,增加自身所构建预测模型预测输出标签的准确性;决策树法属于单个机器学习法,随机森林法和AdaBoost法属于集成学习法.上述四种模型的均方误差如图5所示.
图5 不同参数选择下四种模型的均方误差Fig.5 MSE of the four models with different parameter choices
由图5可知,当参数在14时,岭回归模型的均方误差最低,其值仅为0.135;当参数为9时,决策树模型的均方误差最低,其值为0.141;当最大特征数为总特征的0.3时,随机森林的均方误差最低为0.137;当AdaBoost法利用30个弱学习器进行模型训练时,AdaBoost模型均方误差最低为0.127.由此可见,本次研究选择的AdaBoost模型,是较为适合作为抖动缓冲预测模型.
由图6可知,基于移动终端的多媒体教学数据传输中,对数据传输质量影响最大的是数据传输过程中的丢包率,其次分别为播放抖动与端到端时延,后两者对多媒体教学数据传输质量的影响程度基本一致.为了验证多媒体教学数据传输的优化效果,本次实验将选择正常网络环境(宽带1000 Kb/s,丢包率2%)与拥塞网络环境(宽带500 Kb/s,丢包率5%),比较不同环境下,原WebRTC中抖动缓冲算法与优化后的抖动缓冲算法的工作效果差异.
图6 QoS参数对传输质量的影响Fig.6 Influence of QoS parameters on transmission quality
图7为正常网络环境下,以录制1min示例视频充当视频输入源,分别在两种不同算法的多媒体数据传输方式下,进行三次有效视频通信的具体结果.原算法中,丢包率均值达2.99%,端到端时延均值达114.33 ms,播放抖动均值达13.41 ms,传输质量评估仅为0.201.可见与基于原网页实时通信系统(WebRTC)的抖动缓冲算法相比,本次研究提出的优化后的抖动缓冲预测算法的丢包率较低(2.35%),端到端时延较短(96.4 ms),播放抖动均值较低(10.71ms),多媒体教学数据传输质量评估值更高(0.249).丢包率越低、端到端时延越短、播放抖动均值越低,说明基于该优化算法能得出更合适的抖动时延调整,其数据传输质量更高,延时更低,教学视频通信更稳定,系统的工作效果更好.继续进行拥塞网络环境下,原抖动缓冲算法和优化后抖动缓冲算法的工作效果比较,其具体的比较结果如图8所示.
图7 正常网络环境下不同算法结构对比Fig.7 Comparison of different algorithm structures in normal network environment
图8 拥塞网络环境下不同算法结构对比Fig.8 Comparison of different algorithm structures in congestion network environment
图8为三次有效视频通信实验下丢包率、端到端延时、传输质量等三种指标的均值,由这三种指标均值计算数据传输质量.并比较拥塞网络环境下(宽带500 Kb/s,丢包率5%),原WebRTC抖动缓冲算法与此次研究提出的优化抖动缓冲预测算法的工作效果.图8显示,与原WebRTC抖动缓冲算法相比,优化后的算法在数据丢包率、端到端延时、视频播放抖动等指标的工作效果方面均有所提升,提升幅度依次为18.2%、14.1%、18.1%.从多媒体教学数据传输质量上看,原算法的传输质量评估值仅为0.561,优化算法的数据传输质量为0.680,显著提升17.5%.
利用移动终端进行多媒体教学成为传授知识的新方式,这要求着更高质量的多媒体实时通信服务,即高质量的数据传输.抖动缓冲可有效平滑数据传输,提高数据传输质量.有鉴于此,本次实验在分析抖动缓冲算法的基础上,提出了一种抖动缓冲预测模型,并以该模型实现基于移动终端的多媒体教学数据传输优化.实验结果显示,选择以AdaBoost法构建抖动缓冲预测模型时,该模型的均方误差最低,仅为0.127;对多媒体教学数据传输质量影响最大的是数据丢包率(62.6%),其次为播放抖动(18.8%)和端到端时延(18.6%),这三种指标的值越低,数据传输效果越好,数据传输质量越高;两种不同的网络环境中,原WebRTC抖动缓冲算法的丢包率、端到端时延、播放抖动等各项指标值均高于此次研究提出的抖动缓冲遗传算法,后者的数据传输质量评估值高于前者.综上所述,此次研究提出的基于抖动缓冲预测算法,能显著提高的多媒体数据传输质量.此次研究虽然取得一定成果,但尚未进行帧长变化规律的优化,未来应通过帧长规律的学习,进一步改进抖动缓冲算法.