流媒体网络教学平台构建关键技术

2012-07-09 01:44
长春工业大学学报 2012年1期
关键词:音频无线传输

郎 非

(南京邮电大学通信与信息工程学院,江苏南京 210003)

0 引 言

流媒体指在IP网络中传输的连续时基媒体,如音频、视频或多媒体文件。流媒体区别与其它媒体的最主要特征:首先,流媒体的播放与演示需要一段时间间隔,故流媒体是“连续时基媒体”;其次,流媒体具有时刻不停地运转于网络中的特点,并有能直接在网络终端节点进行播放的功能,而无需在终端播放前下载整个流媒体文件再进行播放。故流媒体对网络系统实时性能提出了很高的要求。

如今在信息与通信技术快速发展的浪潮中,特别是以多媒体和新型网络为代表的新技术分别在日常教学与各类教育中得到广泛快速的应用。其中包含音、视频等多媒体技术的引入,使得知识表达方式更丰富,课堂教学交互性更强;网络技术的引入使得传统教学走出课堂和校园,使得知识传播在不限时间地点的情况下向普通大众传递。

为了使教学能够同时吸纳多媒体和网络两方面的技术优势,多媒体与网络结合的“流媒体技术”应运而生。在进入主题讨论之前,有必要对“多媒体”这一概念进行定义,因为当前确有对此概念“滥用”的现象。

文中所提及的“多媒体”概念在无特殊说明的条件下,指至少要包含一种音频或视频的连续时基性媒体,更多情况下特指包含视频媒体。这样的多媒体在IP网络中传输就称为“流媒体”。

目前,基于流媒体技术的教学平台系统仍未见到真正意义上的应用,即使有类似的原型系统,无论性能还是服务质量都远达不到教学基本要求。文中致力于对这样一个基于流媒体技术的教学平台的实现给出一个基本的解决策略。首先给出多媒体的基本概念及其分类,在此基础上,说明媒体结合技术在课堂教学中的运用以及产生的教学效果。然后主要针对流媒体技术在教学中的应用所涉及到关键技术进行讨论,包括宽带多媒体接入、音频视频媒体对网络传输服务质量的要求和教学中双向交互对网络服务质量的要求。

文中首先给出音频、视频等连续时基性媒体在教学尤其是网络教学中的应用意义。

1 基本概念

1.1 流媒体教学

流媒体教学是对传统多媒体教学的扩展与延伸,指利用计算机、投影仪、音响等数字媒体设备,进行采集、处理、传输、存储和播放等操作,操作的对象除传统的符号、文字和图形之外,还包括声音和视频等流媒体信息。我们把包含流媒体的各要素按教学需要进行有机组合,并通过屏幕或投影仪最终显示出来,同时按需要加上声音、动画等进行配合,此外,在使用者与计算机之间可加上有事先设计好的人机交互操作,完成教学过程[1-3]。

1.2 网络教学

网络教学是相对于传统的围墙式的课堂和校园教学来说的。中国大陆自从90年代初开始,广播、电视教学便应用于各类教育中,突破了封闭式围墙式传统教学模式。自21世纪初以来,随着网络技术的不断发展和快速应用普及,网络教学开展彻底改变了传统“学校”、“教室”的概念,使学校成为开放、虚拟,甚至是社会化的学校。不仅能够重新整合互补各类学校课堂教学资源,也进一步为全民教育和终身教育创造了条件[4]。

具体来说,网络课堂教学是利用已经普及的计算机和宽带网络等硬件环境,依托专业的网络现场教学平台,实现异地、实时、互动教学和学习的教学模式,是“实地现场教学”模式强有力的补充,是教育信息化和网络化的总体趋势和目标。在网络教学模式下,教师讲课工作像以往一样准备电子讲稿(word,ppt,pdf等文件格式),一样按照约定的时间上课。所不同的是上课的地点不再是集中于一固定地点,比如学校的固定班级,而是在网络教学系统平台上开设的一个虚拟化的网络班级。上课的内容仍然是教师备课好的内容,只需要将讲课稿文件“打开”到讲课板上,借助多种媒体设备和网络,整个网络班级的学生都能在异地同时且实时地看到讲课内容,当然前提是学生在规定的时间登陆到了指定班级。在网络教学模式下,学生完全可以在家里参加学校开设的课程,免去了路途奔波,节省了时间和精力,极大地增加了学习的方便性,同时不乏现场教学中的互动和交流。

1.3 流媒体与网络结合教学

网络如果承载多媒体信息并应用于教学中,从教学效果上看,显然会兼顾多媒体和网络的两方面优势。但是,由于流媒体不同于普通文本字符数据,它具有类型多、数据量大、数据不定长等特点,如果再引入音频、视频数据还要考虑时间上的同步性。正是由于这些因素的存在,使得流媒体传输对网络通信的服务质量提出了更高的要求,切实地将多媒体与网络两种技术融合为一个流媒体技术,需要有很多关键技术得到解决才行。然而就目前的实际情况而言,网络课堂教学中的流媒体信息还远不能进行双向自由交互,学生一般只能在网络的一端被动地接收另一端由老师传过来的视频图像,甚至只能传送提前录制好的课堂影像资料。这种没有有效地使用流媒体的网络教学还远远达不到传统教学中师生实时交互交流的效果。

2 多种表示媒体在教学中的应用

当前对媒体种类的划分可谓五花八门,各种涉及组织团体几乎都有其不同的划分方式。在电子化教学领域中对此仍然没有明确定义。概念的模糊很容易导致教学对技术的需求和多媒体技术的提供两方面相互脱节,这对多媒体教学应用技术的发展非常不利。

2.1 媒体分类与媒体功能

国际电信联盟(ITU-T)规定了媒体的5种分类准则:

1)感觉媒体,包括人的视觉、听觉、触觉等;

2)表示媒体,包括信息表示,如文字、声音、语音、图形、图像、视频、动画等;

3)显示媒体,指表现和获取信息的物理设备,如打印机、显示器、扬声器、键盘、摄像机等;

4)存储媒体,包括磁盘、磁带、光盘等;

5)传输媒体(媒介),包括光缆、电缆、电磁波等。

在课堂教学中,显示媒体、存储媒体和传输媒体设备都已经被广泛使用,我们将这3种媒体作为课堂教学中的辅助媒体,它们都是用于承载“表示媒体”的物理设备。值得注意的是,当表示媒体增加了音频、视频,它们以流媒体的形式在网络中进行传输,此时流媒体对显示、存储和传输媒体设备的性能提出了更高的要求。

表示媒体可以看成是通信领域中的信息、信号或消息,在教学中指承载教师备课授课内容的表示符号,是知识最直接的“电子信息表达”。能否有效地使用多媒体,使其产生正面的教学效果全系于媒体的表示,如可以把Powerpoint软件看作是表示媒体的容器。表示媒体中不同的类别会有不同的表现形式,在课堂上会产生不同的教学效果。例如,字符文本擅长表现概念和刻画细节;图形信息擅长表达思想的轮廓以及那些蕴含于大量数值数据内的数学几何信息;视频媒体则适合于表现真实场景等。显然,在教学中这些表示媒体都被期望使用到,这能够触动各种不同的人类感官经验。比如文本、图像等与时间无关的“静媒体”和音频视频等与时间相关的“动媒体”,一静一动的结合会对学生听课产生十分迥异的心里感觉,会刺激学生的脑部神经,加深对知识的理解和记忆。

2.2 媒体结合在教学应用中的作用

“多媒体”不同于“多种媒体”概念,“多种媒体”并没有考虑不同媒体之间的相关性。只有把多种媒体进行结合,才能真正显示出多媒体的意义,课堂教学亦如此。如教学中应把多种媒体的信息围绕一个单一的主题而相互关联在一起,共同主题是这些不同种类媒体相互联系的纽带,否则就是互不相干的共存而已。

在教学中,不同种类媒体有不同的展示知识的能力,而单一媒体对某一知识的表达总可能是蹩脚的。多媒体的核心价值就在于各种形态的信息通过各展所长,从不同的侧面调动不同的感官充分展示一个事物。不同的信息形态被用于传播与之相适应的信息,才能够形成信息互补,这是多媒体应用的精髓所在。

交互性强是实现多媒体核心价值的形式环节,课堂上师生之间的交互性提高是多媒体应用的根本目的。只有产生好的交互性,才能使得学生对知识内容理解的更深刻。这种效果可以反映在理解程度和记忆驻留效果上。根据文献[5],由视频传递的信息能被理解83%,由听觉传递的信息能被理解11%,由触觉传递的信息能被理解的占3%,其余的只占3%。从记忆驻留效果来看,以谈话方式传递信息,2h能记住70%,72h能记住10%;以观看的方式传递信息,2h后能记住的占72%,72h能记住的占20%;而以视听并举的方式传递的信息,2h后能记住85%,72h能记住65%。很明显,视觉和听觉的相互影响,起到了关键的作用,这就是所谓“感觉相乘”的效应。

3 流媒体网络教学平台模型

流媒体教学平台的部分网络结构如图1所示。

图1 流媒体网络教学平台架构

图1采用的是带有无线节点接入的分布式网络结构[6],其中,网络教学现场位于学校的多媒体演播厅,将采集到的多媒体信息先汇集到流媒体服务器中,然后通过Portal端口接入到校园网络。学生利用便携式多媒体终端设备,通过无线信道的网络AP(Access Points)节点接入到校园网络。此外,校园网与外部Internet设有网络关口(Gateway),可以为非本地校园网的用户提供远程教学服务。

4 无线宽带流媒体接入技术

4.1 流媒体无线接入技术在网络教学中的应用

随着异构网络的大量涌现,大学校园网络不再仅局限于传统的有线局域网(LAN),采用各种技术的无线局域网(WLAN)已经得到广泛的使用,而且这一趋势逐渐被推广到一些城市的社区当中。无线网络和无线接入技术的应用,使得用户可以随时随地使用网络,极大地提高了用户对信息获取的方便性。相信不久以后使用无线接入方式的用户数量很快会超过有线接入方式,就如同在过去十年间手机用户数量超过固定电话用户数量。可以肯定的是不论在校园、社区,还是在乘车行驶路上或飞驰火车上,无线接入方式是便携式终端最佳接入核心网络的方式。我们有理由相信无线接入技术很快会在网络课堂教学中得到应用,那么针对网络教学,尤其是多媒体的网络教学所采用的无线接入技术有如下特殊的设计要求。

基于无线接入技术的网络教学平台应用先要弄清楚两个基本问题:第一,网络教学不仅传输简单的文本、字符、图形和图片信息,还要传输大量的音频、视频等流媒体信息,流媒体其数据结构特点是数据传送持续时间长,且单位时间占用带宽大,这对接入网的传输技术指标提出了很高的要求;第二,无线网络和传统有线网络相比,无线信道含噪声大,频率资源有限,所能提供的传输带宽相对较少。这造成了一方面音频、视频等流媒体信息对网络带宽有很高需求;另一方面无线带宽资源又很有限的矛盾。那么如何利用现有资源争取最佳的网络接入带宽便是无线宽带流媒体接入技术要解决的核心问题。

4.2 当前流行的无线接入技术及其特点

无线接入技术标准举例见表1。

表1 无线接入技术标准举例

目前,无线接入技术包括WLAN(WiFi-IEEE 802.11,WAIP,HiperLAN)、GPRS、3G/4G、WAP(构成WPAN)、Bluetooth(蓝牙,构成WPAN)、IrDA(红外,构成WPAN)、HomeRF(构成WPAN)、UWB(超宽带,构成WPAN)、Wi-Max(802.16,构成WWAN,WMAN)、卫星(构成WWAN)等[7]。

依据表1,在选择无线网络接入技术标准进行实际应用时,需要考虑如下因素:

1)传输速率;

2)传输误码率;

3)传输的距离;

4)不同接入点的切换速度;

5)每个区域服务的用户数目;

6)为音频、视频等流媒体所能提供的服务质量(QoS),如延时抖动。

“延时”指数据从网络的发送端到达网络的接收端所经历的时间,即端到端通信的时间。“延时抖动”指数据包在网络传输的过程中,未在事先指定的时间点上到达,或迟或早。抖动越大,迟或早的时间间隔就越大。

4.3 多媒体教学与WLAN的流媒体接入技术

在目前的无线接入技术标准中,笔者认为IEEE关于WLAN的一系列标准更值得关注,尤其看好该标准在多媒体网络教育平台构建中的应用。IEEE 802.11是IEEE最初制定的一个无线局域网标准,主要用于解决办公室局域网和校园网中用户终端的无线接入,业务主要限于普通数据存取,速率最高只能达到2Mbps。2Mbps带宽意味着只能为一个用户提供标清的压缩视频服务,不能满足多用户接入和稍远距离接入的要求。IEEE 802.11a(Wi-Fi5)标准传输可达25Mbps,支持语音、视频业务,同时一个扇区可接入多个用户,每个用户可带多个用户终端。IEEE 802.11e是为满足多媒体服务质量(QoS)方面的要求而制订的WLAN标准,它的分布式控制模式可提供稳定合理的服务质量,而集中控制模式可灵活支持多种服务质量策略,保证影音传输及时性,定量保证多媒体的顺畅应用。IEEE 802.11g是为了更高的传输速率而制定的标准,通过采用OFDM(正交频分复用)技术支持高达54Mbps的数据流,该技术被应用3G终端标准中,可获取多路实时影音信息。IEEE 802.11n标准速率已经超过100Mbps,此外,IEEE 802.11p被用于汽车通信等特殊的领域,无线接入技术向更广阔的应用领域延伸。最终能够真正实现随时随地的多媒体信息的接入。

在各种媒体中,与视频媒体相比,其它媒体数据量很小,占用传输带宽也非常小[8]。然而在网络教学中,对视频图像的单画幅尺寸以及质量的要求都比较高。比如视频中要显示清晰的文字信息需要对图像的分辨率和保真度有比较高的要求,视频的压缩倍数不能太高,否则信息丢失过多,影响知识的准确传达。当然,即使是经过压缩的视频对带宽资源的消耗也非常大。一般对于电视会议系统,视频压缩之后的带宽在2Mbps左右就可以满足使用。

3G网络最初宣称有2Mbps的速度,这足以传送高质量的视频,但是UMTS(Universal Mobile Telecoms System)网络的速度现在已经被降低不到400kbps,一旦大规模使用,速度可能只有400kbps的三分之一,只能勉强传送高质量音频。GPRS是一种用于2.5G网络的过渡技术,目前,由于在中国大陆地区3G业务刚刚开展,无线数据业务仍然依赖于GPRS。由于GPRS提供的数据带宽仍然很低,虽然可以用于手机终端低分辨率地进行视频播放,但这种媒体播放并不是真正意义上的实时展现,更不用说实时传送高质量的视频流。笔者比较看好WLAN的应用前景,在美国已广泛实现了IEEE 802.11用于家庭、咖啡厅、机场和办公室的连接,正在掀起下一代宽带无线城域网建设的浪潮。在中国很多企业、高校和部分的城市已经率先应用WLAN技术接入到我们的商业和教育网络中。WLAN所能提供的带宽以及业务的种类在不断地增多,相信不远的将来,网络教育很快就能成为WLAN的新业务之一。

5 流媒体对网络传输服务质量的要求

5.1 流媒体在时间上的连续实时性特征

在多媒体网络教学中,对音频、视频等流媒体的传输是必不可少的。同时应注意到各种媒体具有不同特点和性质,在现代教学中文字、照片、绘画、图表、音响、音乐、语音、视频和动画等媒体表达几乎都会用到,应根据教学的需要将其灵活组合应用。现代网络传输媒介几乎可以承载所有媒体类型数据,这是相比较于广播电视等传统媒体的优势所在。但同时考虑到不同媒体类型在网络系统中实现采集、处理、传输、存储和显示等处理过程所需要采取的技术策略是不同的,要综合这些技术应用于教学平台实现是一个复杂的系统工程,其中,音频视频等时间连续型媒体数据传输是多媒体系统实现最为关键的核心问题,同时音视频媒体也是多媒体网络教学中知识表达的亮点。

前面曾对媒体类型作了分类,这里根据与时间的关系将媒体重新划分为两类:一是静态媒体,信息的再现与时间无关,如文本、图形、图像等;二是连续媒体,具有隐含的时间关系,如声音、动画、视频等。其中,音频、视频等连续媒体需要依赖一定的播放时间才能得以展现,如视频需要播放25幅/s图像,声音采集的时候也需要满足一定的采样频率,才能使用户最终得到满意的服务质量,此外连续媒体以流媒体的方式在网络中进行传输。

流媒体被处理时有如下特点。音频和视频数据流包括了连续媒体数据中简单而周期性变化的数值,例如音频采样或者视频帧。每一个媒体的逻辑数据单元都必须通过一个严格定义的截止时间来表示[9],例如,必须按照恒定的速度播放一段音乐。此时,必须将一些实时技术运用于网络系统中所有参与连续媒体数据处理的设备,即端到端数据通路上的所有资源,如CPU、存储器、I/O设备、网络和媒体播放器等。

音频、视频在时间轴上这种连续性特征给采集、处理、传输、存储等操作提出新的要求:网络的各个节点元素信息处理速度要加快;通信带宽要加大;网络抖动要低。其中,处理速度和通信带宽两项指标是对网络系统的一个普遍要求,网络抖动则主要针对音视频等实时连续型媒体数据的传输要求,这一特性会在接下来的同步技术中进一步说明。

5.2 流媒体的同步技术

同步技术也是网络教学应用平台实现的关键技术之一。多媒体对象的表现允许在正常表现时间基础上有一定的时间变化,这意味着在一定范围内的流内延时抖动和流间扭曲是能被人们所接受的(流内指单条媒体流,流间指不同媒体流,流指时间连续性的音视频媒体)。例如,人的视觉可接受的视频最大延时抖动为10ms,而可接受的视频和音频的最大扭曲是80ms,并且当音频略超前于视频时,同步效果反而最好[5]。

5.3 流媒体对网络服务和协议的要求

多媒体网络教学平台在使用音视频媒体信息时,对网络的服务和协议提出特殊的要求。首先对定时信息敏感,音频视频的数据通信需要处于一定的截止时间限制的界限之内,这一需求意味着端到端的延时抖动必须是有界限的,相互关联的数据流之间如果有同步相位差,那么这一相位差也应当是有界限的;其次,整个系统对数据吞吐量有很大的需求,需同时满足视频传输、存储、处理和演示要求;再次,由于音视频信息需要一定时间得以展现,因此,在这段时间内有关对媒体的服务都要得到保证,意味着处理和通信服务必须在应用程序处理和传输音频视频媒体的整个时间范围内都提供服务保障;最后,非压缩的音视频媒体对可靠性的要求不同于传统媒体,尤其在有很强的延时抖动的要求下,部分可靠也是可以接受的。

6 双向交互教学对流媒体服务质量的要求

教学中经常会出现教师和学生互动的环节,要实现课堂上师生间自由的交互,需要网络具备较低的延时。这是因为在网络教学中,教师和学生以及学生之间分处于不同的地理位置,当通信双方位置较远,会使得信息传播用时很长。如果通信双方进行频繁双向交互(如语音会话),当数据传输的延时较长时会造成通信双方在话语交流过程中有明显的语音滞留等待的感觉。传统的网络广播电视教学采用单方向广播式的数据传输,缺乏双向交互,因此不会出现上述问题,但这种方式教学缺陷明显:教师不会实时得到学生的反馈信息,也就是平常所说的学生哑巴式教学。

6.1 传输延时对交互性能的影响

上述分析中,可以看出网络通信的低延时是实现高质量双向交互式教学的关键。解决网络延时问题同样是一个复杂的系统工程,解决策略可通过3方面来降低延时:

1)降低端到端的延时。影响网络延时的因素很多,它涉及到通信“端到端”网络路径上的每一个节点和元素。如网络链路与协议、路由器、交换机、服务器的硬件、软件体系结构等。只有将端到端上每一个延时环节都尽可能地降低,才能使得整个通信路径上的延时降低。

2)面向连接,资源预留。在用户数据传输之前,提前搭建好网络的通信路径,减少数据包寻址、路由、排序校验的时间。进一步在连接建立阶段对网络的资源(如带宽)提前进行预留,这意味着处理和通信服务必须“在应用程序处理和传输音频视频媒体的整个时间范围内”都提供服务保障。也就是说,针对音频和视频这种对定时敏感和高数据吞吐量的要求要在很长时间范围内都能得到实现和维持,这一点与一般型的数据传输应用有很大不同。

3)优化错误控制机制,减少重传。非压缩的音视频连续型媒体传输故障恢复需求通常比传统的数据传输的故障恢复需求低。这是因为一方面连续媒体数据之间具有时间冗余性,即使丢失信息,也可以利用时间冗余信息将丢失信息还原;另一方面音频、视频等连续媒体在短时间内的故障并不会直接导致整个传输过程的中断,只要音视频的服务质量没有降低到用户无法忍受的地步即可。

6.2 交互同步性

交互同步需要处理用户在多媒体表现过程中的输入,而用户输入操作本身就具有时间不确定性动态性。因此在整个媒体集成处理过程中,网络教学平台都要动态地保持课件的多媒体同步。在分布式的网络多媒体系统中,影响多媒体同步因素贯穿于端到端通信的整个链路中。例如,从一个存储设备存取多个同步多媒体流,存取延时、媒体流间的存取冲突和竞争都会破坏多媒体同步;当前分时操作系统不支持多媒体同步基于时限的实时处理要求;计算机网络通信系统具有很强的异步特性,表现在它有较大的随机延迟和延迟抖动以及会丢失数据,这些均会导致多媒体同步异常。故网络教学系统平台需要支持多媒体同步的采集、同步存储、同步处理、同步通信和同步播放的同步技术。

7 结 语

对流媒体在教学中的应用意义和基于流媒体技术的教学应用平台实现的关键技术展开了讨论。基于这些流媒体技术的教学平台,可以实现跨越空间、时间的教育传递过程,实现一种随时随地并有较强交互性的教学方式。与传统教育相比,包含流媒体的网络教育具有开放性、灵活性、交互性、分散性等特点,打破了传统封闭式的办学模式,有利于集中优秀的教学资源,最终能够为整个大众教育带来方便。

[1] G Abowd,C Atkeson,A Feinstein.Teaching and learning as multimedia authoring:the classroom 2 000project[C]//Proceedings of the Fourth ACM Multimedia Boston MA USA,1996:224-279.

[2] X Zhang,Q Gao.The exploration and practice of multimedia teaching in course of microcomputer principle and application[C]//International Conference on Education Technology and Training,2009:189-191.

[3] D Qing,Y Lei.Design and implementation of classroom multimedia teaching equipment management system based on embedded system[C]//International Conference on Industrial and Information Systems(IIS),2010:136-139.

[4] R Wallace.A framework for understanding teaching with the internet[J].American Educational Research Journal,2004,41(2):447-489.

[5] 张维明,吴玲达.多媒体信息系统[M]北京:电子工业出版社,2002.

[6] A Leon-Garcia,I Widjaja.Communication etworks fundamental concepts and key architectures[M].Second edition.[S.l.]:McGraw-Hill,2004:447-489.

[7] Y M Wang.Competition among wireless access technologies[J].ZTE Communications Technology,2004(B10):21-25.

[8] 张海涛,郭大波.多媒体通信技术的现状与待解决问题[J].长春工业大学学报:自然科学版,2011,32(5):449-452.

[9] R Steinmetz,K Nahrstedt.Multimedia system[M].[S.l.]:Springer Press.Ltd.,2004:521-525.

猜你喜欢
音频无线传输
《无线互联科技》征稿词(2021)
混合型随机微分方程的传输不等式
牵引8K超高清传输时代 FIBBR Pure38K
无线追踪3
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
基于ARM的无线WiFi插排的设计
基于Daubechies(dbN)的飞行器音频特征提取
关于无线电力传输的探究
音频分析仪中低失真音频信号的发生方法
支持长距离4K HDR传输 AudioQuest Pearl、 Forest、 Cinnamon HDMI线