李文月
摘 要:随着网络建设以及信息化教学方法在高校教学过程中的应用普及,越来越多的高校使用在线巡课系统对教师的教学过程进行跟踪和管理,以便发现课堂教学中的亮点、问题和不足。文章提出的在线巡课系统,基于声源定位的技术,对传统的在线巡课系统做出了改进,解决了已有巡课系统中“只闻其声,不见其人”的问题,能够更直观地跟踪到教师的教学过程,包括教学行为以及师生互动过程,有效提升教务人员巡课效果和体验感受。
关键词:声源定位;在线巡课;云台控制
近年来,信息技术的高速发展带动了高校教育形式和方法的改革,为高校教职工以及学生提供了优质的信息化教学环境和硬件设备。集教、学、管、评于一体的智慧教室学习平台以服务教学为核心,可以支持不同用户角色业务应用,覆盖教学全环节,极大地提高了教育教学及管理水平。
在线巡课是督导评教的一种新型手段,教学主管可快速定位到问题课堂,进行有针对性的远程教学督导、远程教学评价,也可更好地感受课堂教学状态、发现教学问题。现有的在线巡课系统主要是作为智慧教室中的一个模块出现[1],目前的在线巡课系统可以满足巡课人员的基本需求[2],但是对于一些智慧教室中的前端摄像部分,普遍存在跟踪不准确、不及时的现象,严重影响了巡课系统的用户体验和效果。
为了提高在线巡课系统的巡课效果及用户体验,本文提出了一种基于声源定位的高校在线巡课系统,可以借助麦克风阵列声源定位技术对发言者进行定位,根据定位结果控制摄像头的移动,使发言者始终处于巡课界面之中。
1 关键技术介绍
1.1 语音增强技术
语音增强是一种从带噪的语音信号中通过抑制、降低噪声等方式来提取出感兴趣目标信号的技术。常用的语音增强技术主要包括两大类[3]:单通道语音增强和多通道语音增强。(1)单通道语音增强方法,主要包括典型的谱减法、以统计理论为基础的算法等,针对的是主要目标语音的加性噪声干扰,效果并不稳定,无法像人耳那样提取出感兴趣的声音。(2)多通道语音增强方法,指的是麦克风阵列语音增强法,主要包括固定波束形成法、自适应波束形成法、仿生学法以及盲信号分离法等[4]。本系统采用固定波束形成法,也称为延时-求和波束形成器,是麦克风阵列语音增强技术中最简单且易于实现的一种方法。
1.2 声源定位技术
声源定位是一种信号源位置估计技术。在声学环境下,声源位置信息的估计在很多场景中都有非常重要的应用,例如摄像机的自动跟踪、人机交互中的自动跟随等。目前,常用的基于麦克风阵列的声源定位技术主要包括[5]:基于时延估计的定位算法,基于最大输出功率的可控波束形成方法,基于高分辨率谱估计的定位方法。
本文采用基于时延估计的定位方法,非常类似人耳的声源定位方法,结合声音在空气中的传播速度记忆以及测量得到的声源信息到达各麦克风的时间差,来实现声源定位。基于时延估计的声源定位主要包括时延估计和位置估算两部分,下文将会详细介绍。
2 系统设计
基于声源定位的在线巡课系统设计如下:首先,通过声源定位模块得到声源位置;其次,根据定位得到的声源位置控制PTZ(Pan/Tilt/Ioom)摄像头的运动方向和距离,使得课堂中正在发言的教师或学生始终在巡课人员的监控视野中。完整的系统框架如图1所示。
图1 基于声源定位的在线巡课系统框架
在基于声源定位的在线巡课系统中,教室端的麦克风先进行语音信号的拾取,经过语音增强处理后的“纯净”语音经声源定位模块处理之后,获得声源位置,然后根据声源位置来控制摄像头移动,使“发言者”始终处于巡课界面中,最后完成教学过程的视频采集,经互联网传输给远端的远程呈现模块。
3 系统实现
基于声源定位的在线巡课系统主要包括:语音增强、声源定位以及摄像头控制3个模块。本系统的语音增强模块采用固定波束形成法,主要介绍声源定位和摄像头PTZ控制的实现原理。
3.1 聲源定位模块
该系统的声源定位首先是通过麦克风阵列估计出同一声源信号到达麦克风的时间差;其次,利用估计出的时延差以及麦克风的位置信息,在一定的准则和条件下估算目标声源位置。本系统中的声源定位包括时延估计和声源定位两部分:
(1)时延估计。本系统采用比较传统的基于广义互相关的时延估计法,原理是在功率域对接收到的信号进行加权处理,达到在频域上抑制噪声和增加信噪比的目的。该算法的基本原理如下[6]:
3.2 摄像头PTZ控制实现
基于声源定位的在线巡课系统,利用声源定位模块得到的“发言者”的坐标,计算该位置与摄像机预设位置的偏差及方向,通过串口通信自动控制云台转动[8]。同时,还可以由巡课人员手动对摄像机进行控制,该模块的工作流程如图2所示。
摄像头控制模块在获得声源定位模块获得的声源三维坐标(xS, yS, zS)之后,先是检测自动跟踪功能是否正常,若不正常则启动手动控制功能;然后检测自动调焦功能是否正常,若不正常则启动手动控制调焦功能。若以上功能均正常,则按照声源位置来控制摄像头的运动,使得发言者始终处于巡课界面之内。
4 结语
基于声源定位的高校在线巡课系统利用麦克风声源定位对“发言者”进行位置估计,然后根据获得位置的三维坐标来对PTZ摄像头进行控制,使得“发言者”始终处于巡课界面之内。本系统可以在增加少量硬件设备的基础上,有效解决巡课过程中“只闻其声,不见其人”的问题,提高巡课效果以及巡课人员的巡课体验。
[参考文献]
[1]王蓓蓓.校园云录播平台应用系统设计与实现[D].天津:天津大学,2014.
[2]張凯,杨再明,宋慧宁.可视化巡课系统的设计与实现[J].管理信息化,2017(13):66-68.
[3]郭永进.声源定位与语音增强的研究及SOPC实现[D].长沙:湖南大学,2013.
[4]秦艳华.基于麦克风阵列的声源定位技术研究[D].北京:北京邮电大学,2019.
[5]李扬.基于小型麦克风阵列的声源定位系统设计与实现[D].哈尔滨:哈尔滨工业大学,2014.
[6]唐浩洋,陈子为.基于麦克风阵列的GCC时延算法分析[J].计算机系统应用,2019(12):140-145.
[7]刘路路.基于麦克风阵列的声源定位技术研究[D].西安:西安电子科技大学,2019.
[8]陈双叶,王善喜.PTZ摄像机跟踪运动目标的智能控制算法的研究[J].计算机科学,2015(11A):135-139.
Abstract:It is understood that in the process of school teaching, more and more senior high schools use online tour department administrative teachers in the teaching process, the students have been in-depth guidance and management, so the bright spots, problems and shortcomings in the process of school teaching are obvious. Based on the technology of sound source location, the online course patrol system proposed in this paper improves the traditional online course patrol system, solves the problem of “only hearing the sound, but not seeing the person” in the existing course patrol system, and can more intuitively track the teaching process of teachers, including the teaching behavior and the interaction between teachers and students, so as to effectively improve the effect and experience of the course patrol of teaching administrators.
Key words:sound source location; online patrol class; Pan Tilt Zoom