房若宇,李钰杰,施相宇,姚星星
(1.浙江大学 物理学院,浙江 杭州 310058;2.浙江大学 竺可桢学院,浙江 杭州 310058)
作为一种用途广泛的电子测量仪器,示波器可把电信号转换为可视的图像进行直观观察和定量分析,因此在大学物理实验教学中必不可少[1-4],并且应用于有关教学设备的构建和教学系统的设计[5-6],以及基于计算机仿真软件应用的实验教学[7,8]。除了示波器的使用这一常规教学实验之外,若干基于示波器的拓展性实验如光学波片原理的演示、空气中超声速的测量和简谐振动合成的观察等被设计和应用于教学之中[9-12],在此基础上达到了较好的教学改革的效果[13-14]。相较于传统的模拟示波器,数字示波器具有不同的原理和电路结构,能够将输入信号转换为数字信号进行显示[1,15-17],具有波形参数测量、数据存储和波形分析等多重功能。本文设计和实践了一个新的使用数字示波器进行语音识别的教学实验。通过压电陶瓷把人声带的振动转换为电信号输入数字示波器以分析受试者的声音特征,并构建了相应的语音样本数据库,进而通过分析受试者的声音特征实现了对特定测试者的语音识别。
本文系通过压电陶瓷的压电效应把人发声部位的机械振动信号转换为电压信号输入数字示波器进行声音特征的分析。
压电陶瓷材料被拉伸或压缩时,其相对的两个表面会出现等量异号极化电荷;外力越大,表面极化电荷越多。压电陶瓷被施加外电场时得到极化,此时如受到外界力的作用,电畴的界限将发生移动,方向发生偏转,导致极化强度改变,从而在垂直极化方向的平面上引起极化电荷变化而产生可被数字示波器识别的电势差。因此,使用压电陶瓷片,借助数字示波器可测量声带振动。
声音的三种基本特性为音色(决定于发声体的材料和结构)、音调(决定于频率)和响度(决定于振幅)。对于不同的人来说,可通过声音的波形图象和发音频率进行声音识别。实验中将压电陶瓷片贴在受试者喉部靠近声带处,发声时声带产生振动。振动幅度越大,对应响度越大,转化为示波器信号时对应的电压值也越大;声带振动越快,对应频率越大,在示波器上显示的波形的频率越高。
实验采用RIGOL DS2072A型数字示波器,有关参数为:模拟带宽70 MHz,模拟通道数2,最高实时采样率2 GSa/s,最大储存深度56 Mpts,最高波形捕获率50,000 wfms/s。
实验所使用的压电陶瓷片(型号:FT-27T-4.1A1;外径27±0.1 mm,内径9±0.2 mm,谐振频率4.1±0.5K Hz,谐振阻抗300 Ωmax)及其接线方式如图1所示。金属震动片及压电陶瓷片总厚度为0.35±0.05 mm,金属震动片厚度为0.15±0.05 mm。
图1 压电陶瓷片及接线方式
乐音以A=440 Hz为标准,每跨一个八度,对应的频率翻倍。一个八度对应12个半音,分别为:
C#CD#DEF#FG#GA#AB
这十二个半音,若f1与f2距离n个半音,则由:
(1)
可求出所有的音阶。实验中为了验证用数字示波器显示的图形来测量频率的准确性,由一位受试者唱一个八度的音阶进行检测。
测量前,调节示波器参数,使水平方向扫描速率为500 ms,垂直方向衰减约为20 mV。将压电陶瓷片紧贴在受试者喉部靠近声带处,保持按压力度适中且较为恒定。当发声结束后示波器屏幕显示完整的波形。
为测量同一发声者所发出的不同频率的声音特性,在受试者先聆听一段标准音阶后,再发出较为标准的音阶,并按上述同样的方法进行测量。通过读取n个周期的总时长,计算得到受试者发出的每个音阶对应的平均频率。
同一受试者以轻、中、响三种音量发出同一种声音,由数字示波器记录相应声音的波形。用光标法测量电压峰-峰值ΔY,所得数据如表1所示。可见随着音量增加,示波器测得的电压ΔY值也随之增大。因此用数字示波器测量声带振动时,能够反映人声的响度特性。
表1 不同音量下的压电效应电压
为测量同一受试者所发出的不同频率的声音的特性,记录该受试者发出标准音阶的声音的波形,测量n个周期的总时长计算得到每个音阶对应的平均频率,数据结果如表2所示。通过比对测得音阶频率和标准音阶频率,发现二者基本吻合(图2)。
表2 同一受试者不同音阶的振动频率
音阶
可见数字示波器能够很好地对受试者的音高进行定量测量。音量和音高作为人声的两个重要特征,分别通过数字示波器测得信号的幅度和频率得到了较为准确的记录和反映,证实了数字示波器采集人声样本是可行的。
为实现人声识别,首先需要建立含多个受试者声音样本的数据库。实验采集了含5个受试者声音频率特性的语音样本数据库。让各受试者以数字“1”“5”“8”“9”为发声内容,通过数字示波器采集相应的声音频率,如表3所示。
表3 5位受试者的声音频率样本数据
实验随机抽取了数据库中的一位受试者作为测试样例,按照上述方法采集其声音样本,数字示波器采集的其读出四个数字的声音的波形如图3所示。其读出数字“1”“5”“8”“9”的声音频率分别为164.5,156.3,130.9和152.4 Hz。图4为测试样本频率和数据库样本频率对照结果,可见测试样例曲线(灰色)和样例1的曲线(黑色)几乎完全重合。
图3 被测试者读出四个数字的声音波形
为了进一步衡量该测试样本和数据库中已有样本的相似度,我们分别引入欧氏距离:
(2)
和曼哈顿距离:
(3)
其中,i为数据库样本序号,j为测试内容,f′为测试样本频率,f为数据库中的样本频率。计算结果表示于表4和图5。
表4 声音样本的欧氏距离和曼哈顿距离
计算得测试者声音样本的欧氏距离和曼哈顿距离分别为3.002和7.160,通过比对可知该两个数值和1号样本最为接近(表4,图5)。事实上,抽取的测试者确实是1号受试者。以上实验结果证实了使用数字示波器分析声音的频率特征能够有效地进行人声识别。
数字
组别
本文利用压电陶瓷片把人发出声音的机械振动转化为电信号,通过数字示波器分析声音的音质特征,实现了对声音响度和音调的定量测量,获得了和理论值相符的结果。另外,通过建立含多个测试者的语音样本数据库,通过对于测试者声音频率的比对成功实现了对特定测试者的语音识别。该实验不仅丰富了示波器的实验教学内容,同时也拓展了数字示波器的应用场景。