基于机器学习技术的机车音频文件自动分析系统的研究

2018-01-28 21:47汤立新
电子技术与软件工程 2017年18期
关键词:语音识别

汤立新

摘要

为保障列车运行安全,机务部门陆续投入使用了各种行车音视频监控设备,为确保行车安全发挥了重要作用,逐步建立了安全音视频监控设备记录数据分析制度,为规范机车乘务员标准化作业取得了较好效果,但目前对于海量的机车音视频的分析工作主要由人工完成,分析效率低等问题,展开对机车音频文件智能化分析的研究,以自动识别机车音频文件中的各类语音信号,一个是将分析人从繁杂而枯燥的任务解脱出来,由机器来完成这部分工作;另夕1—个是可以在海量的音频数据中快速定位,及时发现问题有效处置,从而能够高效的完成各种日常音频文件的分析工作,全面提升分析工作效率,大幅度提高机务安全管理水平。

【关键词】数据智能化 语音识别 系统自动校时 标准化作业管理

1引言

随近年来,随着铁路交通的发展,列车的数量不断增加,列车的速度不断提高,对于列车运行安全提出了更高的要求。为保障列车运行安全,机务部门陆续投入使用了各种行车音视频监控设备,为确保行车安全发挥了重要作用,逐步建立了安全音视频监控设备记录数据分析制度,为规范机车乘务员标准化作业取得了较好效果。由于录音笔、机车视频监控设备和LKJ监控记录装置各具时钟系统,时间难免产生误差,分析时存在时间混乱,数据失真的情况。同时机车乘务员的值乘状态预警分析是铁路安全运输的重要环节,是保障铁路安全运输的关键,目前对机车乘务员值乘状态的预警分析主要是人工盯控,缺少智能化设备。此外,机车乘务员作业过程中的关键项点,如分相前,呼唤“过分相注意”,禁止双弓标前,呼唤“单弓好了”等发生时,需要对关键项点进行相应的呼唤应答。为了检查机车乘务员是否作业规范,需判断机车乘务员是否在关键项点是否进行相应的呼唤。然而在目前铁路系统中,普遍使用人工方式完成,不仅浪费人力成本,且耗时长,易出错,效率低下。针对以上现状,有必要开展对机车音频文件自动分析系统的研究。该系统代替传统人工操作,高效完成各种日常音频文件的分析工作,实现对机车乘务员标准化作业过程进行有效的卡控和管理,全面提升分析工作效率,大幅度提高机务安全管理水平。

2主要系统构成与研究内容

2.1主要系统构成

机车音频文件自动分析系统包括录音笔、数据服务器、机车音频分析台。

在机车驾驶室装配录音笔,采集行车期间驾驶室内音频信息。通过该系统综合分析机车乘务员作业音频数据、LKJ运行记录数据,准确定位关键时间、关键地段和关键项点,自动纠正录音文件的时间偏差,判断机车乘务员呼唤应答情况,智能分析机车乘务员的作业情况。

在机务段信息中心部署数据服务器,用于音频数据、作业数据分析结果的存储,并向各个查询端提供音频数据信息的流媒体传输服务。

在机务段音频分析中心和各运用车间,安装部署机车音频分析台,可进行机车乘务员作业现场音频信息与LKJ运行记录文件关联分析和智能分析。

2.2系统主要功能

(1)利用己配备的录音笔对机车乘务员的呼唤应答标准化作业状况进行录音。实现机车乘务员作业过程中关键事件的自动提取分析功能,能够自动读取机车乘务员当次作业的LKJ运行记录文件,根据设定逻辑规则,自动提取作业过程中关键事件信息,如:进入调车事件、出入库事件、车位对中事件、降级、开车、停车、侧线运行、临时限速等事件信息,并可根据事件自动定位播放当时的音频信息。

(2)实现机车乘务员作业过程中关键项点呼唤应答的自动分析,根据LKJ运行记录文件定位关键项点時间,在录音文件中,限定在关键项点的时间段内,用语音分析技术来判断音频信号流中的语音和非语音信号。根据呼唤应答语句(根据字数、语句)的最短时间来规定各关键项点的呼唤应答时间的阀值,短语阀值,说明机车乘务员没有按要求进行呼唤应答。

(3)实现作业项点分析记录网络化存储功能,项点的分析结果和相应的音频信息采用网络化的方式集中存储,管理人员可以使用系统平台通过网络对各个分析结果、音频文件进行集中查看、分类查询、验证。

(4)实现基于音视频分析结果的大数据分析;系统自动分析数据进行整理、分析、和推断。找出对应的规律和趋势,对应一些关键人、关键车队、关键地点进行预警提醒,同时为制定作业规范、提供数据支持,从而采取预防措施,避免事故重复。

2.3关键技术研究

2.3.1录音文件数据与LKJ运行记录的相互关联

将录音笔的数据与LKJ运行记录文件数据的相互关联,充分考虑机务各个部门的业务需要,充分保证数据的共享和功能互操作,本系统采用统一的基础平台,包括操作系统平台、数据库平台和应用平台。采用统一平台,可避免不必要的系统间数据的转换、功能的接口、以及系统升级扩展时大量的维护工作量,保证系统的一致性和稳定性。

2.3.2录音文件的降噪处理

由于机车驾驶室内声源环境复杂,录音笔在采集音频信息中往往会包含各种噪声信息,干扰后续的系统分析工作,影响分析结果。本系统采用一种快速降噪方式,根据公式(1),采用时遇到频域的变换方式,估算出噪声的频域与能量特征。然后根据公式(2)的条件,对音频文件中的每一帧信号进行分析,去除其中的噪声部分,保留主要信息。

上式中,N为音频文件的总帧数,Xi(k)为音频文件中第i帧信号,D(k)为噪声估计值,α为过减因子,β为补偿因子,降噪效果如图(1)所示。

2.3.3机车乘务员作业过程中关键项点呼唤应答的自动分析

人在发音时,根据声带是否震动可以将语音信号分为清音跟浊音两种。浊音又称有声语言,携带者语言中大部分的能量,浊音在时域上呈现出明显的周期性;而清音类似于白噪声,没有明显的周期性。发浊音时,气流通过声门使声带产生张弛震荡式振动,产生准周期的激励脉冲串。这种声带振动的频率称为基音频率,相应的周期就成为基音周期。基音周期作为语音信号处理中描述激励源的重要参数之一,在语音合成、语音压缩编码,语音识别和说话人确认等领域都有着广泛的应用。endprint

首先定位LKJ运行记录文件中的关键项点的时间。同时与录音文件中该关键项点时间关联。以基音周期为主要特征,结合时域特征中能量、过零率、熵、等参数和频域特征中的频谱能量、频谱幅度、共振峰等参数以及它们的衍生参数,来判断音频信号流中的语音和非语音信号。同时与关键项点呼唤应答时间的相关参数进行对比,实现机车乘务员关键项点呼唤应答的自动分析。

2.3.4机车录音笔和LKJ监控装置的时间同步

如图2所示,首先从接收机车录音笔输入的语音信号中采集LKJ监控装置发出的语音提示信号;然后对输入的语音信号和语音提示信号进行端点检测,其目的是要在一段输入的音频信号中将语音信号同其他非语音信号分类开来。语音信号在长时间内表现为一个非平稳过程,具有较强的时变性,但在短时内具有平稳性。采用短时自相关函数,语音信号的xi(N)的短时自相关函数Rw(k)可由式(3)定义。

由图3所示。带噪语音的短时自相关系数具有明显的周期性,每个峰值点较为明显。而噪声信号的自相关函数不具备明显的周期性,且除了在零点处出现的最大值为1的峰值外,其余峰值均不明显。利用自相关系数特征,可以较好的区别每一帧语音信号是否包含语音信息。端点检测结果如图4所示,语音时长4minl5s。

选取目前工业界主流应用的梅尔系数特征(MFCC)如图5,即计算信号的能量普并使用一组梅尔三角带通滤波器进行带通滤波后所得的特征参数,结合其他辅助特征如基音周期,共振峰估计等提取语音提示信号的特征。然后使用机器学习算法进行訓练,级联多个分类器得到一组分类器模型。

利用一个滑动时间窗口(如图6),计算窗口内输入语音信号的特征与训练模型进行匹配和识别,识别出输入语音信号中的语音提示信号及该语音提示信号在录音记录中的时刻;最后将检测到的录音记录中的语音提示信号所在时刻与LKJ运行记录文件中该语音提示信号所在的时刻进行同步,从而实现机车录音笔和LKJ的时间同步。

5结束语

随着我国铁路规模的不断扩大,机车数量的不断增加,各类日常机车信息管理工作的要求与难度也与日俱增。对机车音频文件自动分析系统的研究,可提高日常工作效率,减少人力成本,便于管理。借助铁路大数据平台的不断完善,对该系统的深入研究将提升机务安全管理智能化水平,在实际工作中具有重要的实用价值。

参考文献

[1]陈泽伟,曾庆宁,谢先明,龙超.基于自相关函数的语音端点检测方法[J/0L].计算机工程与应用,2017(03):13.

[2]曹正凤.随机森林算法优化研究[D].首都经济贸易大学,2014.endprint

猜你喜欢
语音识别
空管陆空通话英语发音模板设计与应用
通话中的语音识别技术
基于LD3320的非特定人识别声控灯系统设计
航天三维可视化系统中语音控制技术的研究与应用