周枫 薛荧荧 李千目
摘要:近年来,微电子器件、DSP技术、计算机、通信网等相关技术的不断进步,大量频繁的视频信息的交流和存贮带来许多新的问题,数据通信,特别是数字视频技术进入新的发展阶段。本文对现代数字视频若干关键基础技术及发展进行综述。论文首先指出,符合国际标准的视频编码及相关技术仍是研究热点;其次,数字视频的多样化获取方式、视频格式的相互兼容和转换以及计算机动画也极具发现前景;此外,数字视频非话业务的信息传递和交流日益成为通信的主要内容。
关键词:数字视频;视频编码;非话业务
中图分类号:TN941.1 文献标识码:A DOI:10.3969/j.issn.1003-6970.2015.04.020
0.引言
目前,计算机的应用逐渐进入多媒体时代,信息载体扩展到文、图、声等多种类型,数字视频技术得到了发展。在数字视频技术的发展初期,数字视频的数据量非常大,存储、传输和处理都有很大的困难。这使得视频数据压缩的研究成为必要。近年来,一些国际组织相继制定了关于视频图像的编码标准,压缩编码技术日臻成熟。其次,计算机处理速度和存储容量针对视频数据而言还远远不能满足要求,因此视频数据的处理成了多媒体技术中的关键性技术,众多视频存储格式应运而生。另外,计算机动画的发展也将数字视频技术引入了新的发展阶段。
本文将对以上所述的视频技术的发展与应用进行介绍和分析。
1.视频的压缩编码
视频信号信息量非常大,传输网路带宽要求高,在这种情况下对存储、传输和处理都有很大困难。所以需要将视频信号在传送前先进行压缩编码,以便节省传送带宽和存储空间。视频信号压缩编码有两个基本的要求:(1)必须压缩在一定的带宽内,即,具有足够的压缩比;(2)视频信号在压缩之后,经解压重建应保持一定的视频质量。此外,视频编码器的设计应力求简单、易实现、成本低、可靠性高。
1.1视频数据压缩的技术可能性
一幅图像是由许多像素点构成的。大量的统计表明,同一幅图像的像素之间具有较强的相关性,两个像素之间的距离越短,其相关性越强,通俗地讲,两个像素的值越接近。换言之,两个相邻像素的值发生突变的概率极小,相等、相似或缓变的概率极大,这使得视频信息的每个画面内部有许多信息冗余。并且,我们还可以利用帧间相关性进行压缩编码,由于邻近帧之间的相关性一般比帧内像素间的相关性更强,可以得到更大的压缩比。人眼的视觉灵敏度有限,可以允许画面有一定失真,一些冗余信息的失去对观看视频没有太大影响。
1.2压缩编码
1.1.1有损与无损
无损压缩是指压缩前和解压缩后的数据完全一致。多数的无损压缩都采用RLE行程编码算法。
有损压缩意味着解压缩后的数据与压缩前的数据不一致。在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息,而且丢失的信息不可恢复。几乎所有高压缩的算法都采用有损压缩,这样才能达到低数据率的目标。丢失的数据率与压缩比有关,压缩比越小,丢失的数据越多,解压缩后的效果一般越差。此外,有些有损压缩算法采用多次重复压缩的方式,这样还会引起额外的数据丢失。
1.2.2帧内与帧间
帧内压缩也称为空间压缩。当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息。帧内一般采用有损压缩算法,由于帧内压缩时各个帧之间没有相互关系,所以压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一般达不到很高的压缩。
帧间压缩是基于连续前后两帧具有很大的相关性,或者说前后两帧信息变化很小的特点。也即,连续的视频其相邻帧之间具有冗余信息,根据这一特性,压缩相邻帧之间的冗余量就可以进一步提高压缩量,减小压缩比。帧间压缩也称为时间压缩,它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。帧差值算法就是一种典型的时间压缩法,它通过比较本帧与相邻帧之间的差异,仅记录本帧与其相邻帧的差值,这样可以大大减少数据量。
1.2.3对称性
对称性是压缩编码的一个关键特征。对称意味着压缩和解压缩占用相同的计算处理能力和时间,对称算法适合于实时压缩和传送视频,比如视频会议应用就适合采用对称的压缩编码算法。
在电子出版和其它多媒体应用中,一般是把视频预先压缩处理好,再播放,因此可以采用不对称编码。不对称或非对称意味着压缩时需要花费大量的处理能力和时间,而解压缩时则能较好地实时回放,也即以不同的速度进行压缩和解压缩。一般地说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多。例如,压缩一段三分钟的视频片断可能需要10多分钟的时间,而该片断实时回放时间只有三分钟。
1.3国际数字视频标准分析
近年来,视频图像编码技术得到了迅速发展和广泛利用,日臻成熟。一些国际组织也相继制定了关于视频图像的编码标准。例如ITU-T制定的H.26X系列标准、ISO/IEC制定的关于静态图像的编码标准JPEG和JPEG2000以及活动图像的编码标准MPEG系列等。这些标准图像的编码算法融合了各种性能优良的图像编码方法,代表了目前图像编码的发展水平。如表1所示,H.261、MPEG-1、和MPEG-2采用了第一代压缩编码方法,如:预测编码、变换编码、熵编码以及运动补偿。从MPEG-4标准以后,采用的是第二代视频编码方法,如分段编码、基于模型的编码和基于对象的编码等。
其中,随着多媒体应用领域的不断扩展,传统JPEG压缩技术已无法满足人们对多媒体影像资料的要求。JPEG中采用的算法靠丢弃频率信息实现压缩,因而图像压缩率越高,频率信息丢弃的越多。在极端情况下,JPEG图像只保留了反映图像的基本信息,精细的图像细节都损失了。为此,JPEG制定了新一代静止图像压缩标准JPEG2000。JPEG2000放弃了JPEG所采用的以离散余弦变换(DCT)为主的区块编码方式,而采用以小波变换为主的多解析编码方式,很好地保存了图像信息中的相关性,达到了更好的压缩编码效果。JPEG具有高压缩率且提供无损和有损两种压缩方式的特点,但应用并不广泛,在图像品质要求比较高的医学图像的分析和处理中已经有了一定程度的应用。endprint
H.26X是ITU-T及其前身CCITT研究和制定的一系列视频编码的国际标准。其中,应用最广泛的是H.261、H.263、H.264。H.261是世界上第一个得到广泛承认、针对动态图像的视频压缩标准,而且其后出现的MPEG系列、H.263等视频压缩标准都是以H.261为核心。H.263在H.261基础上增加了一些功能,从而进一步改善了图像质量,提高了压缩比。后来出现的H.26L的编码效率比已有的其他视频编码标准有很大的提高。在相同PSNR下与H.263和MPEG4相比,H.263在低码率时的输出码率平均节省分别约为40%和36%,在高码率时的输出码率平均节省分别约为55%和45%,具有较高压缩比,尤其适用于公众交换电话网及无线/Internet网络环境下的视频传输。H.264是比MPEG和H.263性能更好的视频压缩编码标准,不仅具有高压缩比,而且在恶劣的网络传输条件下,具有较高的抗误码性能,但是性能提高的同时,也增加了计算的复杂度。
MPEG-X是一组由IEC和ISO制定发布的视频、音频、数据的压缩标准,已成为国际上影响最大的多媒体技术标准。MPEG-1最初用于数字信息存储体上活动图像及其伴音的编码,其速率为15Mb/s。MPEG-X是一组由IEC和ISO制定发布的视频、音频、数据的压缩标准,已成为国际上影响最大的多媒体技术标准。MPEG-1最初用于数字信息存储体上活动图像及其伴音的编码,其速率为15Mb/s。MPEG-2是一个通用多媒体编码标准,具有更广阔应用范围和更高的编码质量。由于性能出色,已能适应HDTV,使得MPEG-3被抛弃。它的另一特点是可提供一个范围较广的可变压缩比,能够适应不同的画面质量、存储容量以及带宽的要求。MPEG-4持多种多媒体应用,特别是多媒体信息基于内容的检索和访问,可根据应用的不同要求现场配置解码器。编码系统也是开放的,可以随时加入新的有效的算法模块:它可以将各种多媒体技术充分利用进来,包括压缩本身的一些工具、算法,也包括图像合成、语音合成等技术。MPEG-4标准既可用于的高码率的视频压缩编码,又可用于低码率的视频压缩编码;既可用于传统的矩形帧图像,又可用于任意形状的视频对象压缩编码。
此外,近年来,本领域另一个研究热点是声像数据的基于内容的检索。实现这种基于内容检索的一个关键步骤是要定义一种描述声像信息内容的格式,而这与声像信息的编码又是密切相关的,MPFG-7就是这种压缩编码的代表性技术,其名称叫做“多媒体内容描述接口”,它为各种类型的多媒体信息规定一种标准化的描述,这种描述与多媒体信息的内容本身一起,支持用户对其感兴趣的各种“资料”进行快速、有效地检索。
尽管MPEG取得了种种成功,但在人们的信息交流中尚存有众多的不便之处,如不同网络之间的障碍、知识产权得不到有效保护等;不同的多媒体信息、网络、设备、协议和标准、分布在不同的地点等都给用户造成不能以统一的方式进行多媒体信息交互。如何通过一个综合标准来对上述不便之处加以协调,使多媒体业务畅通无阻,这就是MPEG墨尔本会议提出的多媒体框架的概念,此即MPEG-21。MPEG-21标准的正式名称为“多媒体框架”或者“数字视听框架”,它致力于为多媒体传输和使用定义一个标准化的、可互操作的和高度自动化的开放框架,这个框架考虑到了DRM(Digital Rights Management,数字版权管理)的要求、对象化的多媒体接入以及使用不同的网络和终端进行传输等问题,这种框架会在一种互操作的模式下为用户提供更丰富的信息。MPEG-21的最终目标是要为多媒体信息的用户提供透明而有效的电子交易和使用环境。任何与MPEG-21多媒体框架标准环境交互或使用MPEG-21数字项实体的个人或团体都可以被视为用户。从纯技术角度来看,MPEG-21对于“内容供应商”和“消费者”没有任何区别。
MPEG-21标准是新一代多媒体内容描述标准,它吸收新技术,同时消除多媒体系统框架中的缺陷,使得由于不同的设备、体系结构和标准造成隔阂被逐步消除。对于用户而言,新的多媒体系统是一个与设备无关的、互动性强大的、高度智能化的、符合用户各种不同需要的体系。
1.4我国视频压缩编码的发展现状
AVS标准是具有我国自主知识产权的编码标准,是一套包含系统、视频、音频、媒体版权管理在内的完整标准体系。其编码效率比MPEG-2高2~3倍,与H,264相当,但其算法复杂度比H.264低30%,达到了新一代编码标准的最高水平,主要面向高清晰度电视广播和数字存储媒体。
2013年6月,AVS视频编码标准已经成为了IEEE标准,标准号为IEEE 1857。AVS标准的逐步完善与发展应用,成为了标志着我国在视频压缩编码领域从跟踪国际到自主创新再到国际推广的里程碑。
1.5未来发展趋势
目前,在视频行业广泛采用的压缩和传输标准是2003年推出的H.264,在视频编码标准朝着高清晰度、低码率的方向发展进程中,H.264占据着统帅的地位,但是,在未来的五到十年内,H.265将会掀起引领超高清时代的潮流。H.265于2013年1月25日获得了国际电联的批准,H.265不仅在码流、算法、编码质量上进行了改善及优化,而且同时支持4K(4096×2160)和8K(8192×4320)超高清视频。H265标准下的画面效果更流畅、更高清,势必会对整个视频行业在互联网应用中以及视频压缩编码技术上引起一场巨大的变革。
2.视频文件格式
2.1多媒体视频文件格式
目前视频的数据在计算机内部的存储格式众多,其压缩比、质量和适用领域等各不相同,下面就此对其常用格式及发展进行介绍和分析。
2.1.1QuickTime(MOV)格式
MOV格式的英文全称是Movie Digital Video Technology。MOV格式能够跨平台、存储空间要求小,得到了业界的广泛认可。QuickTime文件格式支持25位彩色,支持领先的集成压缩技术,提供150多种视频效果,并提供200多种MIDI兼容音响和设备的声音装置。该格式具有较高的压缩比率和较完美的视频清晰度,最大的特点是跨平台性,目前已成为数字媒体软件技术领域的事实上的工业标准。endprint
2.1.2AVI格式
AVI的英文全称是Audio Video Interleaved,叫做音频视频交错,是由微软公司开发的一种数字视频文件格式。AVI是Windows操作系统上最基本的、最常用的一种媒体文件格式,支持256色和RLE压缩,但压缩标准不统一,不具有兼容性,体积庞大,用不同压缩算法生成的AVI文件,必须使用相对应的解压缩算法才能播放。它最大的优点是调用方便、图像质量好;还可以根据不同的应用要求,随意调整AVI的分辨率,而且对计算机的配置要求不高,可以先做成AVI格式的视频,在转换为其他格式。
2.1.3MPEG-2(DVD)
PAL制式的标准MPEG-2分辨率高达720X576。MPEG-2在编码时使用了帧间压缩和帧内压缩两种方式,并且通过运动补偿等技术来改善画质。从清晰度来看,MPEG-2几乎是无可挑剔的,但是MPEG-2也并非十全十美。由于MPEG-2没能在压缩技术上有所突破,因此其数据量比MPEG-1大。此外,MPEG-2的压缩数据的码流比较特殊,各种编辑软件无法随机访问,因此在进行非线性编辑时会导致素材搜索很迟缓。更为重要的是,MPEG-2过大的编解码必须依赖强大的处理芯片。
2.1.4DivX和XviD格式
MPEG在开始的时候建立了4个版本:MPEG-1-MPEG-4,分别适应于不同的带宽和数字影像质量的要求。DivX和XviD就是一种MPEG-4编码格式,只不过旧版的MPEG-4编码不允许在AVI文件格式上使用,才会有DivX和XviD编码格式的出现。不过现在国内外称呼的DivX和XviD是MPEG/MP3影片,即影像部分以MPEG-4格式压缩,Audio部分以MP3格式压缩组合而成的AVI影片。它的好处是生成的文件体积小,约为同样播放时间的DVD的1/5到1/10,但是声音及影像的品质都相当不错,当然比DVD还是差一点,但比起VCD要好很多,也就是说,DivX和XviD只要一张光盘就可以放下一个90分钟的电影,而且清晰度要比两张光盘的VCD好许多。在视频采集时,DivX和XviD编码对于系统性能的要求并不高,数据量的降低可以明显减轻CPU与磁盘系统的负担。
2.1.5 RM(Real Media)格式
Real Media是Real Networks公司所制定的音频视频压缩规范,包含RealAudio(.ra,声音文件)、RealVideo(.rm,视频文件)和Real Flash(.ram,矢量动画)三类文件。Real Media可以根据网络数据传输速率的不同制定不同的压缩比,实现在低速率的广域网上进行彩像数据的实时传送和实时播放。
2.1.6FLV格式
FLV全称为Flash video,是在Sorenson公司的压缩算法的基础上开发出来的。FLV格式不仅可以轻松地导入Flash中,速度极快,并且能起到保护版权的作用。由于它形成的文件极小、加载速度极快,使得网络观看视频文件成为可能,它的出现有效地解决了视频文件导入flash后,使导出的SWF文件体积庞大,不能在网络上很好地使用等缺点,是目前增长最快、最为广泛的视频传播格式。目前各在线视频网站均采用此视频格式。
2.2媒体格式的发展分析
影响多媒体文件格式发展的因素有很多,归纳起来主要有应用和技术两个方面。总的来讲,一种格式有存在的必要,必须有一定的应用范围,而压缩、解压缩等技术的发展必将促使新格式的产生。
影像视频的发展必将淘汰传统的影响视频格式。随着视频压缩技术和视频编辑处理技术的不断创新和改进,传统的影像视频(如AVI和MPEG-1格式等)一般体积较大且清晰度较差,因此这些格式必将被体积小数倍,而且具有超高清晰度的新视频格式所代替。另外,随着移动通信的不断发展,市场需求和技术进步共同推动移动视频业务发展的同时,必将极大地推动视频技术的发展,对于视频文件格式的发展产生巨大影响。
随着多媒体技术的迅速发展、各种压缩算法在该领域的应用,对目前存在的各种文件格式很难准确评价孰优孰劣,从压缩率、质量而言,每一种格式都有其优缺点,而且都被大批软件所支持,占有一定的应用领域。因此,在一定时期内,多种文件格式共存的局面不会改变,但随着时间的推移,应用的发展和技术的革新,将不断涌现新的、先进的格式,淘汰落后的格式。
3.计算机动画
3.1计算机动画的原理与分类
计算机动画是采用连续播放静止图像的方法产生物体运动的效果,利用计算机生成一系列可供实时演播的画面的技术。它可辅助传统卡通动画片的制作,也可通过对三维空间中虚拟摄象机、光源及物体运动和变化(形状、色彩等)的描述,逼真地模拟客观世界中真实的或虚构的三维场景随时间而演变的过程。所生成的一系列画面可在显示屏上动态演示,也可将它们记录在电影胶片上或转换成视频信息输出到录像带上。计算机动画由于采用数字处理方式,动画的运动效果、
画面色调、纹理、光影效果等可以不断改变,输出方式也多种多样。计算机动画分为四类。
实时动画:采用各种算法来实现运动物体的运动控制或指可直接在显示屏幕上实时显示动画图像。
逐帧动画:记录下每一帧画面,然后按显示动画的图象序列一帧一帧播放而实现运动的效果。
三维动画:画中的景物有正面、侧面和反面,调整三维空间的视点,能够看到不同的内容。
二维动画:平面上的画面,由纸张、照片或计算机屏幕显示。
在屏幕上实现动画有三种方式:(1)位置不动形态变化。(2)形态不变位置变化。(3)位置和形态均变化。
计算机动画的主要研究内容包括:①动画形体造型技术;②动画运动控制和描述;③动画图象绘制技术和算法;④动态模拟、动画系统的集成环境;⑤关节体、人体动画;⑥动画语言与系统;⑦用于动画运动控制和生成的专门硬件设备及接口;⑧特殊视觉效果生成技术。endprint
3.2计算机动画技术
计算机动画的研究始于20世纪60年代初。1963年美国AT&TBell实验室制作了第一部计算机动画片。在80年代之前,计算机动画主要集中于二维动画系统的研制,应用于教学演示和辅助传统的动画片制作。
三维动画的研究始于70年代初,当时开发了一些三维计算机动画系统。直至80年代中后期,由于具有实时处理能力的超级图形工作站的出现,三维几何造型技术和真实感图形生成技术取得很大进展,促进了具有高度逼真效果的三维计算机动画技术迅速发展,并达到实用商品化地步。到90年代初,计算机动画技术应用于电影特技取得了显著成就。
与此同时,为适应科学研究与复杂系统中的动态模拟、视觉模拟、机器人学和生物力学等领域的需求,基于物理的造型和动画的研究的开展,已成为计算机动画研究中的一个重要课题。
人体动画是近年来发展起来的计算机动画新课题。它是研究开发基于人造角色的集成动画系统,该系统产生涉及人造角色在三维场景中具有人的自觉意识的行为动画,这样的系统是以多种学科的知识、技术和方法为基础的,如动画、力学、机器人学、生物学、心理学和人工智能等。现在的Poser就是著名的MetaCreations公司生产的具有特色的人体建模三维动画制作软件。
目前,主流的计算机动画技术包括:
(1)参数关键帧技术:关键帧技术最初仅仅用来插值帧与帧之间卡通画的形状,后来该技术马上发展成为可以用来插值影响运动的任何参数(例如,一个物体的平移、比例变换、旋转、材料、纹理、形状、可见性参数等都可作为关键帧参数,另外,摄象机和灯光的大部分参数也可作为关键帧参数)。
(2)轨迹驱动技术:指先设计好物体的运动轨迹,然后指定物体沿该轨迹运动。通常,物体的运动轨迹为三次样条曲线(也称为样条驱动),并且由用户交互给出。
(3)变形动画技术:为了制作一种形态变形的动画,即将物体外观上发生变化的过程记录下来,生成一个形态连续变化的动画序列。
(4)关节动画技术:它的主要目的是模拟骨架动物(尤其是人体)的运动。
(5)过程动画技术:指物体的运动或变形可由一个过程来描述。最简单的过程动画是用一个数学模型去控制物体的几何形状和运动,较复杂的过程动画则是包括物体的变形、弹性理论、动力学、碰撞检测在内的物体的复杂运动。
(6)基于物理的动画技术:一种具有潜在优势的三维造型和运动模拟技术。尽管该技术比传统动画技术的计算复杂度要高得多,但它能逼真地模拟各种自然物理现象,这是基于几何的传统动画生成技术所无法比拟的。
3.3计算机动画的未来发展趋势
从国际上看,计算机动画技术的发展正在趋向于规模化、标准化、网络化。
从技术的发展方向看,体视动画会是未来的热点。目前人们正在研究降低立体眼镜的成本、提高图像质量的方法和有关的替代技术,未来我们很可能不用立体眼镜的帮助也能欣赏逼真的立体效果。另一个热点会是虚拟现实(vR)技术,与一般的动画相比,VR的特点在于实时、交互。VR中的场景会随参观者的位置、视点变化而实时动态生成,并具有人机交互的能力,这种技术在未来将大有可为。
今后的几年,还可以继续从以下几个方面研究和发展:
1、新造型技术的设计。尽管造型技术在CAD和CAGD中得到了广泛的研究,但计算机动画对传统的实体、曲面造型提出了一些新的要求。这导致许多针对动画应用而设计的造型技术。
1)Catmull-Clark细分曲面的造型和动画研究。由Catmull和Clark提出的根据任意拓扑控制网格生成B样条曲面的细分曲面方法近几年来在计算机动画中越来越受到人们的重视。在AliasIWavefront公司的动画软件Maya中,基于Catmull-Clark细分曲面的造型和动画已经成为其重要手段。
2)隐式曲面的造型和动画研究。隐式曲面是圆球的更一般形式,它在表现人体的肌肉、水滴、云、树等物体的造型和动画方面有很大的优势。该研究方向近年来逐渐为人们研究的热点,欧洲图形学学会专门设立了相应的Implicit Surface学术会议。
2、运动捕获动画数据的处理。运动捕获技术在电影《泰坦尼克》中取得了非常大的成功,该片中乘客从船上落入水中的许多惊险镜头都是由动画特技来完成的。实际上,运动捕获已成为现代高科技电影不可缺少的工具。怎样把运动捕获动画数据重用和重置目标值得进一步的研究。
3、三维Morphing和变形研究。二维图象的Morphing虽然已经比较成熟,但三维Morphing方法尚存在各种各样的缺陷,具有任意拓扑的两三维物体之间的Morphing技术还有待于进一步的发展。基于约束的变形也是值得研究的方向。
4.数字视频的其他技术
4.1数字电视技术
数字电视是数字技术的产物,它将电视信号进行数字化,然后以数字形式进行编辑、制作、传输、接收和播放。
数字电视除了具有频道利用率高、图像清晰度好等特点之外,它还可以开展交互式数据业务,包括电视购物、电视银行、电视商务、电视通信、电视游戏、实时点播电视、电视网上游览、观众参与的电视竞赛等。
目前,数字电视已成功地应用于卫星直播,有线电视也在向数字方式过渡。整个电视传播业已进人了从模拟式向数字式过渡的时代。整个数字电视系统由信源编码、业务复用和信道传输与发送三个部分构成。美国的DTV、欧洲的DVB和日本的ISDB这几种标准,信源编码中视频都采用MPEG-2标准,音频采用MPEG-2或Dolby AC-3;业务复用采用的都是MPEG-2系统层规范或其扩展形式,它们的主要差别在于信道及发送部分。
数字电视的传输途径是多种多样的,因特网性能的不断提高也将使其成为数字电视传播的一种新媒介。图1是数字电视传播系统的示意图。数字电视接收机(简称DTV接收机)大体有三种形式:一种是传统模拟电视接收机的换代产品——数字电视接收机,另一种是传统模拟电视机外加一个数字机顶盒,第三种是可以接收数字电视的PC机。endprint
4.2点播电视(VOD)技术
VOD(Video On Demand)是视频点播(也称为点播电视)技术的简称,意即用户可以根据自己的需要收看电视节目。VOD技术从根本上改变了用户过去被动收看电视的不足。
视频点播系统可分为TVOD(True VOD)和NVOD(Near VOD)两种。在TVOD(真视频点播)环境下,用户提出要求后即可及时从VOD系统得到服务,这种系统为每一个用户提供一个单独的连接,每个连接需要占用一定的网络带宽;NVOD(准视频点播)是视频点播的另一种实现方案。采用这种方案,系统可每隔一段时间(例如10分钟)在不同的频道上开始播放同一个节目,用户可以选择收看。如果用户需要“倒退”功能,可以切换到比他当前频道晚10分钟播放的频道,需要“快进”功能,可切换到比当前频道早10分钟的频道。显然,这种方式不能为用户及时提供点播服务功能,但减少了用户连接数目,节省了网络带宽与费用,服务器的性能要求也可适当降低。
视频点播是基于数字网络的一种数字视频服务。网络中的音频视频数据必须以实时数据流的形式进行传输,传输一旦开始,就必须以稳定的速率进行,以保证节目平滑地播放。任何由于网络拥塞,CPU争用或磁盘的I/O瓶颈产生的系统或网络的停滞,都可能导致视频传送的延迟,影响用户的收看。因此,大型视频点播系统在技术上是有相当难度的。
视频点播系统的工作过程如下:用户在客户端启动播放请求,通过网络传送给分配服务器,经验证后,系统把视频服务器中可访问的节目单发送给用户浏览,用户选择节目后,视频服务器读出节目的内容,并传送到客户端进行播放。
4.3可视电话与视频会议技术
可视电话:通话双方能互相看见的一种电话系统,电话机具有摄像、显示、声音等功能,内置高质量CCD镜头及MODEM。其应用之一就是视频会议,
视频会议:多人同时参与的一种音/视频通信系统类似于可视电话,但多人参加通话,提供的功能也更加丰富。
两种实施方式:(1)在电信局的数字通信网上进行;(2)在互联网上进行,例如使用下列即时通信软件:微软的MSN Messenger,腾迅的QQ,网易的POPO,新浪的UC等。
5.结论
本文通过从五个方面,对数字视频及其技术应用在近年的研究内容、方法和进展做了比较全面的回顾和分析。从中可以看出,数字视频的压缩编码主要方向集中在基于国际数字视频标准及其应用、IP网络和无线网络视频的可靠性编码及传输技术、新的高效编码方法(小波变换编码等)、面向对象的编码等以及3D视频编码,其未来的应用前是非常广阔的。同时,数字视频压缩编码领域的重大突破推动了可视电话等“会话型”和DVD等“非会话型”视频业务。另外,数字视频的获取与视频的文件格式是难以分割的,很多情况下,视频的获取需要转换文件格式,而且视频获取往往因为文件太大而需要数字视频压缩编码。从国际上看,计算机动画技术的发展正趋于会规模化、标准化、网络化。可以预见,在不久的将来,VR技术将取得巨大的进步。endprint