广告信息识别系统的研究与设计

2016-05-30 03:06宋明杰杨闯王瑞祥刘朝晖阎少宏
科技尚品 2016年2期
关键词:语音识别广告

宋明杰 杨闯 王瑞祥 刘朝晖 阎少宏

摘 要:以广告信息监测为主要目的,完成了信息监测系统的结构和功能的设计,基于音频匹配算法(DTW)的语音识别技术,开发了一套针对广告信息识别的信息管理系统。该系统包括一套完整的软硬件设施,为广告监播部门和人员提供实用、功能丰富的管理工具,实现广告信息的识别、监测、预警、报告等的智能化处理,经过随机抽取样本的检测,准确率基本稳定在86%,经验证效果显著。

关键词:广告;监播系统;语音识别;信息监测

21世纪是信息的时代,信息成为各个领域乃至各个国家的重要战略资源,信息的安全传播是信息安全的重要组成部分,关系到国家安全和社会稳定。随着经济的发展,广告成为社会生活的重要组成部分,而其带来的社会问题也更加突出,特别是虚假广告信息和非法小电台播报的非法信息,严重影响人们的日常生活,并为社会带来很多不稳定因素,广告检测、监测成为监管部门亟待解决的问题。由于广播信息具有传播范围广、制作成本低、部分非法电台较隐蔽等特点,电波信号不易察觉,且大量储存将消耗很大的储存资源。目前,广播监管仅局限于对异常电台频率的监管。

基于上述分析,设计了电台广播信息识别(监播)系统,考虑到数据量大和电台数众多,分别开发和使用了数据预处理系统、多路分频器和实时信息分析系统平台,并进行了性能分析,为实现人工智能广告信息监播提供解决方案。

1 工作原理及算法

1.1 语音识别原理

语音识别技术经过近40年的发展,已经成为声学、数字信号处理、概率统计、语言学、人工智能等多学科交叉的一项综合性技术,基于语音识别技术研发的系统成功应用于很多场景,为语音识别技术在广告信息监播领域的应用作重要铺垫。

语音识别系统整体上由两大部分组成:训练和识别。训练时对预先收集的海量语音、语音数据库进行信号处理和建模,提取语音识别系统所需的“语言模型”和“声学模型”。识别过程是对用户输入的音频资料提取特征向量,利用训练好的“语言模型”和“声学模型”进行统计模式识别,得到其包含的文字信息。线性预测(LPC)、梅尔倒谱系数(MFCC)等作为特征向量的组成部分。

1.2 改进的DTW算法

本次试验采用了一种整体路径约束DTW算法(ADTW),利用平行四边形限制动态规整范围,如下图1所示:

平行四边形之外的路径点对应的帧匹配距离不需要计算,也无需保存所有的距离和积累距离矩阵,充分利用这两个特性,可以减少计算量和储存空间,可提高识别速率、节约存储空间。把实际的动态弯折分为三段:和,其中:

和都取最相近的整数。由此也得出对M和N长度的限制条件:

当不能满足以上条件时,则认为两者差别过大,无法进行动态弯折匹配。此时,在x轴上的每一帧不需要与y轴上的每一帧进行匹配比较,而只需与y轴上间的数据帧进行比较,两者的计算公式如下:

当出现的情况时弯折匹配三段分别是和。对于x轴上每前进一帧,尽管与之比较的y轴上的帧数不同,但弯折特性是一样的,积累距离矩阵更新可用以下公式实现:

模版匹配ADTW算法提高了原有的DTW算法,限制了识别区域,在保证正确的前提下大大减少了计算量,节约了存储空间,提高了运行速度。

2 系统组成和软件设计

广告信息识别系统主要包括信号采集模块、存储磁盘列阵、广告样本数据库、音频匹配服务器、监管数据库、操作员终端和自动警报系统。考虑到信息采集时数据占用空间巨大,而硬盘对于大数据的存储速度随数据量和时间的增加而减小,因此采用循环分散式存储技术,将采集到的信息分成信息块,一次存放在不同的磁盘中。下图2给出了系统结构图:

2.1 多路分频器(VGA分频器)

VGA分频器又称VGA信号宽带矩阵切换器,将多路电视、电台信号从输入通道切换到相应的信道上,使各路信号之间彼此独立地进入到信号调节器中,保证信号的独立性,并减少长距离信号传输造成的信号衰减现象。

2.2 信号解调器

经分频器分发出来的载波信号在计算机识别之前,需经过解调器将载波信号还原为计算机可以识别的“0”和“1”信号,或模拟信号,这个过程称为“解调”,也称A/D转换。

2.3 信号采集服务列阵

信号采集服务器主要进行语音识别的准备设备,完成原始数据的采集、备份,音频特征的建模,为后续的语音识别做准备工作,主要有以下功能特点:

语音信号采用G.722的高压缩格式,占用磁盘空间小,失真率低;

采用磁盘列阵存储方式,存储速度快;

支持分段节目录制;

具有很好的扩展性,方便存储识别扩容。

2.4 广告监管服务器

广告识别服务器是整个广告信息识别的核心组件,完成语音文件匹配、识别结果保存和语音识别数据库的更新。功能特点如下:

语音识别广告准确率稳定在85%左右(主要受方言和普通话标准程度的影响);

高性能运算平台,具有高稳定性和可靠性,免维护,可7×24h不间断运行;

并行优化运算,可对数据进行快速、稳定处理。

2.5 操作员终端

系统中,相关广告人员的日常工作都在操作员终端上进行,由随系统开发的操作员终端软件提供简洁、明了的人机交互界面(图3为操作员终端界面),功能如下:

以波形和文字相结合的方式显示选择监管频道的声音文件,使声音看得见;

支持拖拽定位功能,可快速寻找定位广告位置;

对新的广告样本进行特征提取并建立新的广告样本,更新语音识别数据库;

监管数据的查看,生成报表。

3 结论

本文针对广告信息识别的特点和要求,利用梅尔倒谱系数等10个参数作为特征参数,构建语音识别算法,针对广告监播的特点和要求,设计出一套改进监播体系,然后简单介绍了各部分的组成及功能,从整体的性能分析来看,监播系统的优点突出:如识别率高、数据处理速度快、原始数据保存妥善;系统的高稳定性和升级的扩展性,支持关键词搜索等等。随着市场的快速发展和技术的不断提升,越来越多的新技术可应用到本系统中,使系统更加适应市场需求,并有较好的市场前景预期。

参考文献

[1]沈昌祥,张焕国.信息安全总述[J].中国科学 E辑:信息科学,2007,37(2):129-150.

[2]李志华,张宪平.我国电视广告的当代特征和发展策略[D].山西大学,2012.

[3]刘潇,和应民.语音识别关键技术研究[D].哈尔滨工程大学,2006.

[4]徐刚,周志芳.语音信号近似度模型匹配研究[D].华北电力大学,2013.

[5]雷静.语音识别技术的研究和基本实现[D].武汉理工大学,2002.

(作者单位:华北理工大学 数学建模创新实验室)

猜你喜欢
语音识别广告
通话中的语音识别技术
“看”与“凝视”中的美
广告图形设计教学之创意性思维研究
省级党报广告品位提升与影响力拓展
媒介自建:湖南媒介型广告公司发展新路径探究
广告语对广告效果的影响初探
面向移动终端的语音签到系统
农业物联网平台手机秘书功能分析与实现
基于LD3320的非特定人识别声控灯系统设计
基于语音识别的万能遥控器的设计