王坚
【摘要】 OTT视频应用已经成为业界发展趋势,但其网络环境却缺少QOE(Quality of experience)保证。因此在提供OTT业务时,用户使用体验QOE变得至关重要。在无线网络环境下,由于无线频谱资源的稀缺性,优化OTT视频能够节省宝贵的无线网络资源。本文通过介绍自适应码流的原理及在OTT中的应用,说明自适应码流技术在OTT环境中的重要应用价值。
【关键词】 IPTV OTT 自适应码流 QOE 视频优化
一、IPTV与OTT视频行业背景
2002年左右,IPTV作为付费电视的一种,开始在欧洲部署。经过10多年的快速发展,IPTV视频业务日益普及。据市场研究机构Multimedia Research Group(MRG)2011年研究报告称,全球IPTV用户总数将在2014年增至1.02亿。截至2012年底,中国大陆地区就已超过2000万IPTV用户,用户主要集中在电信运营商。另外一种主流的付费电视,广电的有线数字电视用户在国内目前已经超过1亿。通常将IPTV和有线数字电视都称为付费电视业务,付费电视用户的服务体验是得到有线网络(数字电视)或电信运营商(IPTV)承诺保证的。
近几年随着宽带网络的普及发展,家庭网络接入提速,智能终端得到普及,包括智能手机、各种PAD屏、智能电视机顶盒等。有不少用户已经逐步从有线数字电视和IPTV等付费电视服务中分离出来,观看更多来自互联网的视频内容,即OTT(OVER THE TOP)业务。全球知名的咨询机构ABI RESEARCH调查报告称,到2017年全球OTT的市场收入会达到320亿美元,是2012年82亿美元的4倍多[1]。
二、OTT视频服务中存在的问题
OTT视频特点是用户通过运营商提供的宽带接入网络,消费来自互联网视频内容供应商的内容,在国外比较典型的是NETFLEX,GOOGEL TV等。终端用户可以通过互联网在OTT平台订购OTT的视频节目包,而这笔订购费用是直接支付给OTT服务提供商,而对电信运营商只收取宽带网络接入的费用,不收取节目费用。所以,OTT视频的内容体验质量,电信网络运营商是不提供保证的。
技术层面,与付费电视IPTV相比,OTT视频的最大区别在于:IPTV是运营商提供视频内容,是在运营商的宽带网络内分发,承诺提供体验有质量保证的视频内容。IPTV一般采用恒定码率的编码方式CBR。OTT视频由于是在网络不能保证QOS的情况下采用可编码率VBR或CVBR压缩的视频,容易出现如下2种情况:(1)没有用户视频体验质量保证QOE。在网络带宽瞬间劣化的情况下,由于视频压缩后的带宽要求大于网速,无法满足正常播放视频的要求,客户端就会出现图像卡顿现象。另外就是视频内容由于网络丢包而造成图像马赛克现象。用户对视频业务的体验ITU-T P.10/G.100中的QOE(Quality of Experience)规定的一般采用用户主观评分的方式评估(ITU-R BT.500),客观评估是个复杂的课题,虽然有许多研究机构和组织向ITU提交了关于视频QOE 客观评估的建议,但ITU 目前还没有定义统一的国际标准[2]。(2)OTT视频过度消耗无线网络资源,造成网络拥塞。据调查,约75%的互联网视频流量主要都是约占其中5%链接过高分辨率的视频及图像文件造成的,而约95%的客户端连接只消耗网络总带宽的20%-40%。相对显视频屏幕的大小,OTT提供视频的同时,往往给手机等智能终端分辨率过高的内容,由此而造成无线带宽资源的浪费。比如给终端屏幕5英寸的智能手机屏提供高质量视频,480P分辨率视频就足够了,若提供1080P分辨率的视频就会占用大量不必要的网络带宽资源,而用户主观的视频清晰度没有明显增加,这显然是不经济的,甚至可能造成由于少量高带宽用户的突发请求,出现较大面积阻塞无线网络的情况发生,导致其它用户的业务体验响应延迟。
三、HTTP自适应码流基本原理及方案组成
(1)自适应码流基本原理
首先是编码过程,视音频信号(可以是直播或非直播)的节目源,经过编码后成为MPEG-2 TS封装的节目流。然后将连续的 MPEG2 流进行切片,成为一个系列视频片段进行保存,比如一系列.ts结尾的文件格式。如果只有音频文件而不包括视频,则可以是一系列MPEG的音频文件,一般是带ADTS头的AAC或 MP3文件。编码时可以对同一内容设置不同编码带宽,分别设为125K,250K,600K,1200K,2500K,8000K的同样内容的视频文件。
切片的过程,通常需要用软件切片实现。切片工具在切片同时产生一个索引文件,即index文件。该索引文件包含一系列的媒体文件相关信息,包括元数据 metadata。索引文件是.M3U8格式。播放的客户端通过URL,首先获得这个索引文件,然后就按索引顺序获取分片媒体文件,然后顺序播放。切片的同时可以选择对文件进行加密或不加密。
多码流文件在切片时,编码器往往不是切片1个固定带宽的文件,而是切片多个带宽的压缩的文件,可以按多种带宽压缩文件,比如每个文件可以定长为10秒。
HTTP客户端则根据网络的状况,在不同的视频带宽文件中进行选择最优的适合此时网络带宽的文件进行下载播放。
整体结构如图(1)。
总之,HTTP提供一些明显的优势,例如支持媒体加密和根据不同网络链接速度动态的在不同码流之间切换。相对TS封装,如果采用单一的MPEG-4或QUICKTIME文件封装是比较高效,但不能实现不同码率的动态切换。
(2)方案组成
①服务端部分:
编码器
流文件切片器和存储切片文件
编码器:
编码器功能是将未压缩的视音频信号进行编码压缩并做封装输出。编码设置的格式需要为客户端可以支持解码配合,例如是H.264视频和HE-AAC音频编码,然后通过 MPEG-2TS封装,对音频信号则只包含MPEG ES封装音频信号。编码器需要对相同视频内容生成不同带宽的视频内容,比如125K,250K,600K,1200K,2500K,8000K的不同编码率文件。endprint
注意:MPEG-2TS封装不能与MPEG-2编码的概念混淆。封装是一种打包的格式,可以封装多种编码格式内容,比如对视音频就是H.264视频和AAC音频,对音频就是MPEG ES格式,封装带ATDS头的AAC格式或MP3格式。
流文件流切片器及存储:
流切片过程是通过软件在本地网络读出TS封装文件,并将文件切片为一系列,较小的等长度的媒体文件,比如10秒为一段。这些已分割的文件,可以在客户端重新复原组成连续的流文件。
切片同时创建一个索引文件,包含了切片文件的样板。每次切片器完成文件切片,索引文件就会更新。索引文件用来跟踪媒体文件可用性及位置。切片器以在切片的过程中,可以对文件进行加密并在这个过程中生成相关密钥文件。切片后的媒体文件被保存为.ts文件(MPEG-2封装,索引文件被保存为.M3U8文件)。切片时需要强调的是,对文件的等长切片,而且要对不同码率的视频文件都做切片。
②分发单元
分发系统是一个WEB服务器或WEB 缓存系统,通过HTTP与客户端建立链接并下发媒体文件和索引文件。 对于WEB服务器可以是通用的,一般只需要少量配置工作就可以实现。
推荐配置是典型的用于MIME类型的M3U8文件和 .ts 文件。生存时间 TTL值对于.M3U8 文件可以设置,以达到需要WEB CACH服务缓存达到的设计要求。这些文件经常需要频繁的覆盖,最新的内容则按最新的请求下载。
③客户端单元
首先是客户端获取索引文件并基于URL来区分不同视频流。索引文件按序定位已存在的媒体文件,密钥文件及可替换的媒体文件等。对于选择播放的流,客户端会按顺序下载已有媒体文件。每个文件即包含播放流里的顺序文件。当下载足够的数据文件后,客户端开始播放给用户重新组装的流。
客户端负责获取解密密钥字,认证或提供认证界面并按需解密媒体文件。在这个过程中,客户端一旦索引文件中遇到 #EXT-X-ENDLIST的标记,就会停止这个过程。如果一直不遇到#EXT-X-ENDLIST的标记,则索引文件则会是持续广播信号的一部分。客户端会周期性的下载新版本的索引文件,然后客户端在更新的索引文件中寻找媒体文件及解密密钥字,并将这些URL加到队列中。
Session 会话类型
HTTP直播流协议支持直播会话和VOD视频点播会话链接。对直播会话链接,新的媒体文件创立并且现有的索引文件实时更新。新的索引文件包括新的媒体文件,而旧的索引文件被移除,更新的索引文件表现为连续播放流的一个移动窗口,这种会话适用于连续的广播视频。
对于 VOD会话,媒体文件表示了需要播放的完整周期。索引文件是静态的,包含从文件之初到结束的完整索引。这种类型的会话允许客户端能完整的访问到整个节目内容中。
也可以创立一个直播然后转为点播,即转直播到VOD,这时不需要从服务器里移除旧的文件或从索引文件里删除URL,只需要在广播结束时增加一个 #EXT-X-ENDLIST标识。客户端可以随后加入广播并仍旧看到完整事件,这在需要重播的时候就相当方便。
替换流的切换
索引文件可以指向可替换的流内容,从而实现对同一视频多种编码质量对应不同的终端类型和网络质量。如果网络带宽变化,HTTP直播流协议支持动态的流切换,客户端软件则会自动在不同的流之间在适当的时候进行切换,这种自动方式是根据测量网络吞吐能力来实现。
索引文件指向一个替换流,是通过指向另一给索引文件标示实现,如图(2)所示。
客户端可以在任意时刻,实现对不同流的切换,比如移动终端从蜂窝网络接入或离开WIFI 热点。所有的可替换流需要使用统一的音频,这样才能实现平滑的切换过程。
应用案例说明:
按照在不同网络带宽的条件下,我们对视频内容进行不同的编码率实现编码,比如我们可以对同一部电影内容,采用H.264编码,做7个级别码率编码,如表1所示。
手机,PAD,PC和TV至少都由2档质量可选,具体选哪种质量,取决于网络,在默认情况下,应选择较高质量的视频内容,以满足较好的用户体验。比如在网络条件允许的情况下,采用H.264的编码压缩的视频256Kbit/s图像的清晰度一定比128Kbit/s的要高,如果在网络情况不好时,则自动切换到低码率的一档,从而使播放流畅。
另外一种情况是,但对于较小屏幕如提供较高的带宽,实际是对网络带宽的消耗是一种浪费,因为用户体验并未得到很明显的提高,这种由少量用户对大宽带视频的需求,会对无线网络的带宽消耗造成浪费和拥塞,降低了其它大量用户的使用体验,因此需要在无线网络内对视频进行优化处理,比如对手机用户的所有1080P的视频降低为720P或480P视频分辨率,从而节省宝贵的网络资源。
四、总结
在OTT的业务环境中,由于业务是假设在互联网之上,对网络服务质量没有QOS保证,因此需要在应用层对视频传输进行进一步的优化处理,以提供用户业务体验:(1)通过HTTP的自适应码流技术,提高OTT视频在网络带宽波动的情况下提供平滑播放的业务体验。(2)对各种视频终端的屏幕实现分辨率匹配策略,尤其在无线网络环境下,减少OTT视频对网络开销,降低无线网络拥塞的可能,从而提高业务体验质量。
参 考 文 献
[1] 黄远清. 2012年美国OTT市场浅析[J],卫星电视与宽带多媒体,2012(23)
[2] 姚良等. 智能电视终端的视频服务质量保障[J],电信科学,2013(04)endprint
注意:MPEG-2TS封装不能与MPEG-2编码的概念混淆。封装是一种打包的格式,可以封装多种编码格式内容,比如对视音频就是H.264视频和AAC音频,对音频就是MPEG ES格式,封装带ATDS头的AAC格式或MP3格式。
流文件流切片器及存储:
流切片过程是通过软件在本地网络读出TS封装文件,并将文件切片为一系列,较小的等长度的媒体文件,比如10秒为一段。这些已分割的文件,可以在客户端重新复原组成连续的流文件。
切片同时创建一个索引文件,包含了切片文件的样板。每次切片器完成文件切片,索引文件就会更新。索引文件用来跟踪媒体文件可用性及位置。切片器以在切片的过程中,可以对文件进行加密并在这个过程中生成相关密钥文件。切片后的媒体文件被保存为.ts文件(MPEG-2封装,索引文件被保存为.M3U8文件)。切片时需要强调的是,对文件的等长切片,而且要对不同码率的视频文件都做切片。
②分发单元
分发系统是一个WEB服务器或WEB 缓存系统,通过HTTP与客户端建立链接并下发媒体文件和索引文件。 对于WEB服务器可以是通用的,一般只需要少量配置工作就可以实现。
推荐配置是典型的用于MIME类型的M3U8文件和 .ts 文件。生存时间 TTL值对于.M3U8 文件可以设置,以达到需要WEB CACH服务缓存达到的设计要求。这些文件经常需要频繁的覆盖,最新的内容则按最新的请求下载。
③客户端单元
首先是客户端获取索引文件并基于URL来区分不同视频流。索引文件按序定位已存在的媒体文件,密钥文件及可替换的媒体文件等。对于选择播放的流,客户端会按顺序下载已有媒体文件。每个文件即包含播放流里的顺序文件。当下载足够的数据文件后,客户端开始播放给用户重新组装的流。
客户端负责获取解密密钥字,认证或提供认证界面并按需解密媒体文件。在这个过程中,客户端一旦索引文件中遇到 #EXT-X-ENDLIST的标记,就会停止这个过程。如果一直不遇到#EXT-X-ENDLIST的标记,则索引文件则会是持续广播信号的一部分。客户端会周期性的下载新版本的索引文件,然后客户端在更新的索引文件中寻找媒体文件及解密密钥字,并将这些URL加到队列中。
Session 会话类型
HTTP直播流协议支持直播会话和VOD视频点播会话链接。对直播会话链接,新的媒体文件创立并且现有的索引文件实时更新。新的索引文件包括新的媒体文件,而旧的索引文件被移除,更新的索引文件表现为连续播放流的一个移动窗口,这种会话适用于连续的广播视频。
对于 VOD会话,媒体文件表示了需要播放的完整周期。索引文件是静态的,包含从文件之初到结束的完整索引。这种类型的会话允许客户端能完整的访问到整个节目内容中。
也可以创立一个直播然后转为点播,即转直播到VOD,这时不需要从服务器里移除旧的文件或从索引文件里删除URL,只需要在广播结束时增加一个 #EXT-X-ENDLIST标识。客户端可以随后加入广播并仍旧看到完整事件,这在需要重播的时候就相当方便。
替换流的切换
索引文件可以指向可替换的流内容,从而实现对同一视频多种编码质量对应不同的终端类型和网络质量。如果网络带宽变化,HTTP直播流协议支持动态的流切换,客户端软件则会自动在不同的流之间在适当的时候进行切换,这种自动方式是根据测量网络吞吐能力来实现。
索引文件指向一个替换流,是通过指向另一给索引文件标示实现,如图(2)所示。
客户端可以在任意时刻,实现对不同流的切换,比如移动终端从蜂窝网络接入或离开WIFI 热点。所有的可替换流需要使用统一的音频,这样才能实现平滑的切换过程。
应用案例说明:
按照在不同网络带宽的条件下,我们对视频内容进行不同的编码率实现编码,比如我们可以对同一部电影内容,采用H.264编码,做7个级别码率编码,如表1所示。
手机,PAD,PC和TV至少都由2档质量可选,具体选哪种质量,取决于网络,在默认情况下,应选择较高质量的视频内容,以满足较好的用户体验。比如在网络条件允许的情况下,采用H.264的编码压缩的视频256Kbit/s图像的清晰度一定比128Kbit/s的要高,如果在网络情况不好时,则自动切换到低码率的一档,从而使播放流畅。
另外一种情况是,但对于较小屏幕如提供较高的带宽,实际是对网络带宽的消耗是一种浪费,因为用户体验并未得到很明显的提高,这种由少量用户对大宽带视频的需求,会对无线网络的带宽消耗造成浪费和拥塞,降低了其它大量用户的使用体验,因此需要在无线网络内对视频进行优化处理,比如对手机用户的所有1080P的视频降低为720P或480P视频分辨率,从而节省宝贵的网络资源。
四、总结
在OTT的业务环境中,由于业务是假设在互联网之上,对网络服务质量没有QOS保证,因此需要在应用层对视频传输进行进一步的优化处理,以提供用户业务体验:(1)通过HTTP的自适应码流技术,提高OTT视频在网络带宽波动的情况下提供平滑播放的业务体验。(2)对各种视频终端的屏幕实现分辨率匹配策略,尤其在无线网络环境下,减少OTT视频对网络开销,降低无线网络拥塞的可能,从而提高业务体验质量。
参 考 文 献
[1] 黄远清. 2012年美国OTT市场浅析[J],卫星电视与宽带多媒体,2012(23)
[2] 姚良等. 智能电视终端的视频服务质量保障[J],电信科学,2013(04)endprint
注意:MPEG-2TS封装不能与MPEG-2编码的概念混淆。封装是一种打包的格式,可以封装多种编码格式内容,比如对视音频就是H.264视频和AAC音频,对音频就是MPEG ES格式,封装带ATDS头的AAC格式或MP3格式。
流文件流切片器及存储:
流切片过程是通过软件在本地网络读出TS封装文件,并将文件切片为一系列,较小的等长度的媒体文件,比如10秒为一段。这些已分割的文件,可以在客户端重新复原组成连续的流文件。
切片同时创建一个索引文件,包含了切片文件的样板。每次切片器完成文件切片,索引文件就会更新。索引文件用来跟踪媒体文件可用性及位置。切片器以在切片的过程中,可以对文件进行加密并在这个过程中生成相关密钥文件。切片后的媒体文件被保存为.ts文件(MPEG-2封装,索引文件被保存为.M3U8文件)。切片时需要强调的是,对文件的等长切片,而且要对不同码率的视频文件都做切片。
②分发单元
分发系统是一个WEB服务器或WEB 缓存系统,通过HTTP与客户端建立链接并下发媒体文件和索引文件。 对于WEB服务器可以是通用的,一般只需要少量配置工作就可以实现。
推荐配置是典型的用于MIME类型的M3U8文件和 .ts 文件。生存时间 TTL值对于.M3U8 文件可以设置,以达到需要WEB CACH服务缓存达到的设计要求。这些文件经常需要频繁的覆盖,最新的内容则按最新的请求下载。
③客户端单元
首先是客户端获取索引文件并基于URL来区分不同视频流。索引文件按序定位已存在的媒体文件,密钥文件及可替换的媒体文件等。对于选择播放的流,客户端会按顺序下载已有媒体文件。每个文件即包含播放流里的顺序文件。当下载足够的数据文件后,客户端开始播放给用户重新组装的流。
客户端负责获取解密密钥字,认证或提供认证界面并按需解密媒体文件。在这个过程中,客户端一旦索引文件中遇到 #EXT-X-ENDLIST的标记,就会停止这个过程。如果一直不遇到#EXT-X-ENDLIST的标记,则索引文件则会是持续广播信号的一部分。客户端会周期性的下载新版本的索引文件,然后客户端在更新的索引文件中寻找媒体文件及解密密钥字,并将这些URL加到队列中。
Session 会话类型
HTTP直播流协议支持直播会话和VOD视频点播会话链接。对直播会话链接,新的媒体文件创立并且现有的索引文件实时更新。新的索引文件包括新的媒体文件,而旧的索引文件被移除,更新的索引文件表现为连续播放流的一个移动窗口,这种会话适用于连续的广播视频。
对于 VOD会话,媒体文件表示了需要播放的完整周期。索引文件是静态的,包含从文件之初到结束的完整索引。这种类型的会话允许客户端能完整的访问到整个节目内容中。
也可以创立一个直播然后转为点播,即转直播到VOD,这时不需要从服务器里移除旧的文件或从索引文件里删除URL,只需要在广播结束时增加一个 #EXT-X-ENDLIST标识。客户端可以随后加入广播并仍旧看到完整事件,这在需要重播的时候就相当方便。
替换流的切换
索引文件可以指向可替换的流内容,从而实现对同一视频多种编码质量对应不同的终端类型和网络质量。如果网络带宽变化,HTTP直播流协议支持动态的流切换,客户端软件则会自动在不同的流之间在适当的时候进行切换,这种自动方式是根据测量网络吞吐能力来实现。
索引文件指向一个替换流,是通过指向另一给索引文件标示实现,如图(2)所示。
客户端可以在任意时刻,实现对不同流的切换,比如移动终端从蜂窝网络接入或离开WIFI 热点。所有的可替换流需要使用统一的音频,这样才能实现平滑的切换过程。
应用案例说明:
按照在不同网络带宽的条件下,我们对视频内容进行不同的编码率实现编码,比如我们可以对同一部电影内容,采用H.264编码,做7个级别码率编码,如表1所示。
手机,PAD,PC和TV至少都由2档质量可选,具体选哪种质量,取决于网络,在默认情况下,应选择较高质量的视频内容,以满足较好的用户体验。比如在网络条件允许的情况下,采用H.264的编码压缩的视频256Kbit/s图像的清晰度一定比128Kbit/s的要高,如果在网络情况不好时,则自动切换到低码率的一档,从而使播放流畅。
另外一种情况是,但对于较小屏幕如提供较高的带宽,实际是对网络带宽的消耗是一种浪费,因为用户体验并未得到很明显的提高,这种由少量用户对大宽带视频的需求,会对无线网络的带宽消耗造成浪费和拥塞,降低了其它大量用户的使用体验,因此需要在无线网络内对视频进行优化处理,比如对手机用户的所有1080P的视频降低为720P或480P视频分辨率,从而节省宝贵的网络资源。
四、总结
在OTT的业务环境中,由于业务是假设在互联网之上,对网络服务质量没有QOS保证,因此需要在应用层对视频传输进行进一步的优化处理,以提供用户业务体验:(1)通过HTTP的自适应码流技术,提高OTT视频在网络带宽波动的情况下提供平滑播放的业务体验。(2)对各种视频终端的屏幕实现分辨率匹配策略,尤其在无线网络环境下,减少OTT视频对网络开销,降低无线网络拥塞的可能,从而提高业务体验质量。
参 考 文 献
[1] 黄远清. 2012年美国OTT市场浅析[J],卫星电视与宽带多媒体,2012(23)
[2] 姚良等. 智能电视终端的视频服务质量保障[J],电信科学,2013(04)endprint