韩吉辰
声音是一种振动波,具有一定的能量,利用声电传感器(比如简单的话筒)就可以变成电信号,从而控制某个动作。
我们许多人都见过一种有趣的“声控娃娃”,你对它拍一下手掌,它就会哈哈大笑,有时你打一个喷嚏或外面放一颗爆竹,它也会哈哈大笑;另一种高级“声控娃娃”、“声控狗”、“声控猫”则只对掌声反应,拍一下手掌它就动起来,再拍一下手掌就停止,其他响声对它不起作用,原来这种声控技术复杂一些,它可以自动识别声音的频率,手掌的声音和其他的声音的频率,是有区别的。
家庭使用的“声控电灯”,是用一个特制的发声哨音控制,也可以根据人的脚步声控制,使用起来十分方便;“声控电扇”可以利用掌声控制开关和转速;还有“声控照相机”,可以根据掌声控制快门,使照片拍得更加自然。此外还有“声控收音机”、“声控彩色电视机”、“声控空调”、“声控微波炉”和“声控喷泉鱼缸”等等。
科学家还发明了具有兼容性的“声音遥控器”,它可以同时适用8种家用电器,遥控器中先进的语音识别系统,可以对不同用户的声音进行识别,最多可以识别4个用户。这个遥控器还可以对语音进行自动编程,并可以进行修改,它最多可以识别54个声音指令。
利用“口令”的声控技术
真正可以听懂语言的声控技术就复杂多了。我们知道,语言千变万化,但是最基本的发音只有几十个拼音字母,称为“语音代码”。科学家将常用单字、词汇编成数据输入电脑,当对它口授一个字词时,电脑会紧张地与“字典”中各字词对照,找出相应的字词并送出电信号,接通相应的开关,从而控制相应的动作。
这种会听话的机器用途广泛,例如“声控电话”,只要对着话筒说出电话号码。就会自动接通。纽约电话公司生产的一种声控电话机,具有更高的“智能”,双职工家庭中的孩子,遇到事情,只要拿起电话高叫一声:“妈妈!”便可与他们正在工作的妈妈通话。
在“声控电梯”中,只要说:“先上5楼,再到8楼!”就会按序自动执行;有一种“声控轮椅”能按口令前进后退或转弯,给残疾人带来了方便;还有一种“自动声控洗衣机”可以按照口令进行一系列程序完成洗衣工作;在高级办公室或高级病房中,有一种“声控机器人”能听懂几十条口令,甚至能做到“人机对话”,很受欢迎。
世界上第一辆能用人的语音控制的新型汽车,最近由英国埃塞克斯的一家汽车配件供应厂研制成功。让汽车进行语音辨别的基本程序是:驾车人的口令事先存贮在汽车的微电脑中。驾车时,只要重复所需的口令,电脑马上会将你说的口令与原先存贮的口令作比较。如果吻合,汽车就会按照口令的要求自动操作。人的口令是由话筒传达的,声控系统辨别口令的时间只需1秒,汽车在0.5秒内即能产生反应。
最近,德国也开发出“车载语音识别导航系统”,可以识别800个地名,驾乘人员只需说出目的地,导航系统便能很快找出最佳路线,在行驶过程中的每一个路口均给出语音提示,并在屏幕上显示出相关路线。
飞机在飞行或空战中,一旦飞行员负了伤,是非常危险的。现在,飞行员可以用声音来继续驾驶飞机了。语音识别器将飞行员的讲话声音与贮存的声音相比较,只要声音一致,飞机就能自动地完成各种动作,从而化险为夷,安全返回。而在航天飞机中,由于飞行速度必须达到极快的“第一宇宙速度”,在飞行过程中,宇航员处于超重或失重状态,行动十分不便,于是科学家研制了“航天专用声控机”。它能听懂14条口令:指令、停止、前进、后退、向左、向右、旋转、保持、开动、俯仰、偏航、下降、上升、移动,以及由它们构成的有意义指令,如向上移动,向右旋转等,使宇航员以口代手,既方便又安全。更为先进的声控装置还在研制中,将使人类飞向茫茫宇宙变得更加安全可靠。
“能听会说”的计算机
声控技术的发展使“语音写作”成为现实,我们对着计算机读完一篇文稿,屏幕上立即出现相应的文字,随即,计算机将文稿朗读一遍,以便进行校对。然后,作者在手写输入板上用笔进行修改后,即可发出打印指令,一篇稿件就这样完成了。
这是中国科技大学最近研制成功的“能听会说”的计算机的特殊功能。对每个词汇的识别时间为0.3秒。只要操作者使用标准语,以播音速度念出单词或句子,电脑便能将语音信号转换成文字,显示在屏幕上。系统还设有瞬时反馈装置,当电脑不能正确识别某一语句时,屏幕右下角的卡通人便会用手搔搔头皮,并发出“听不懂!”的呼声,表示不能理解你的意思。你只好再重复一次。这项技术也可以用于“语音排版”上面,非常便捷。
有一些高级医院开发的声控电脑管理系统,可将病人口述的病情以及医生的诊断和处方显示在屏幕上并打印出来。声控技术的发展出现了能够进行人机对话的产品,即机器人能够听懂人的语音命令,并作出相应的反应(如做动作、说话发声等),比如只要你向它发出问候,它就会迅速而准确地作出回答,声音近似于播音员的嗓音。一个小朋友念了一句唐诗“白日依山尽”,机器人竟机灵地接了一句“黄河入海流”,博得周围人们的阵阵赞叹。
能识别主人的“声控技术”
一般声控装置只认口令,谁发话它都执行。但有些场合,人们希望它只听一个人或指定的几个人的命令。你想,任何人一喊“芝麻开门”,山门就大开,这样的装置多不保险啊!于是声控技术出现新产品,就是“声纹锁”。我们每个人的声音各不相同,和指纹一样,一般终身不变,称作“声纹”。经过高科技处理的声纹图谱能够提供一种有效的个人识别方法。将主人的“声纹”预留在声控装置中,只有主人说一句话,它才打开,其他人说同样一句话,它却无动于衷。这样的防盗门和保险箱就更加安全了。国外流行一种“声控信用卡”,将卡放入银行出纳机内,对微型话筒说口令,装置识别无误后,进行交易。如果换一个人持卡去说同样的口令,出纳机拒绝交易。这种能识别主人声音的声控技术很受欢迎。发展很快,还出现能识别特定的“几个”主人声音的“声纹锁”,非常灵活又非常可靠。
还有一种手机特有的声控技术,预置近40个声控指令,可通过简短的词语激发设定的功能。如果你只设定本人“声纹锁”,那么别人就无法使用这个手机,非常安全。
核武器具有极大的威慑力量,也具有巨大的破坏力,因此核武器的使用必须极为慎重,一般直接由国家最高领导人本人掌握。于是,对于核武器的启动发射设计了复杂的开启程序,除了使用一套严密的加密系统以外,还使用先进的“声纹”系统加大安全性。只有当最高领导人“本人”亲自发出口令,系统与原来储藏的“声纹”核对无误后,核武器才能最终启动。
德国一家大企业安置了一套“电子门卫”,语音识别器中贮存了本单位几百名职工的“声音特征”。只要是本单位的职工,对着岗亭中的话筒自报姓名,门就打开:请进!几百名职工的声音它都能识别,即使有的职工患病声音嘶哑,它也能识别放行(这叫模糊识别技术)。但是如果是外单位的人,假冒职工姓名,它却让来者吃“闭门羹”:“对不起,不认识你!”这套声控系统实施以来,没有发生任何事故,受到欢迎。那么,这套先进的“声控电子门卫”叫什么名字呢?就叫“芝麻,开门!”
责任编辑:庞云