刘许亮,朱焕立
(黄河水利职业技术学院,河南 开封 475003)
语音通信技术在图书馆业务系统中的应用
刘许亮,朱焕立
(黄河水利职业技术学院,河南 开封 475003)
建立一种基于移动短信和语音电话平台的高校图书馆业务系统,语音电话系统应用语音合成(TTS)技术实现交互式对话服务,移动用户通过无线通信网络电信通信网关与公用电话交换网(PSTN)网电话语音卡建立连接,通过用户数据库对书目数据库的访问,达到对图书业务办理的目的。
图书馆业务;电话语音;移动短信;TTS技术;图书业务办理
高校图书馆服务模式已经从传统的服务模式转向计算机网络环境下的数字化图书馆服务模式[1]。对于数字化的图书馆,在安全保护、访问许可和记账服务等完善的权限处理之下,经授权的信息利用计算机网络实现共享。但是,这种模式必须以计算机及计算机网络建设为基础,受限于计算机和计算机网络设备。
随着移动终端设备的发展,无论是高校图书馆服务的趋势要求,还是高校信息化的环境及现状,建立基于图书馆业务的移动短信平台和语音电话平台都有着很好的现实意义和使用价值。笔者应用语音合成(Text To Speedn,简称TTS)技术,建立了一种基于移动短信和语音电话平台的高校图书馆业务系统。
1.1 系统结构设计
基于移动短信和语音电话平台的高校图书馆业务系统整个构架包括学校图书馆端、运营设备端、师生用户端3个部分。在学校图书馆端,设置有移动代理服务器(Mobile Agent Server,简称MAS)和语音电话服务器,分别实现以移动短信和语音电话为平台的数据通信。这两个服务器通过局域网(Local Area Network,简称LAN)访问图书管理信息数据库,实现图书馆的业务办理。系统结构如图1所示。1.1.1 学校图书馆
学校图书馆包括原有的书目信息数据库服务器、书目管理系统服务器、MAS服务器以及系统应用软件所运行的服务器,即移动短信管理服务器和带有语音电话卡的语音电话管理服务器。这些功能相对独立的设备都通过校园局域网相互通信,紧密联系。
1.1.2 运营设备端
运营设备端是指提供移动语音、移动短信服务和固定电话服务的运营商设备端以及他们各自的通信网络。这些设备用于保障语音电话、移动短信能通过路由器Router或虚拟专用服务器(Virtual Private Server,简称VPS)访问Internet,以实现和企业端的数据交换。
1.1.3 师生用户端
师生用户端包括固定电话和移动电话。用户通过固定电话或移动电话拨打图书馆语音电话卡线路电话号码,再根据系统提示,通过按键实现数据交换。移动电话可以使用短信与移动短信系统进行数据交互。
1.2 语音电话系统的应用结构
语音电话系统就是计算机电信集成技术(Computer Telecommunication Integration, 简 称CTI)的一个具体应用,即使用电话语音卡,利用TTS等技术实现一个具有一定应用范围的交互式应答系统[2]。这个系统的特点就是,结合计算机网络中的具体数据库应用,实现具体业务系统在语音通信网络中的应用。图书馆语音电话系统应用结构如图2所示。
图1 图书馆业务系统结构框图Fig.1 System structure of library
图2 图书馆语音电话系统应用结构示意图Fig.2 Library voice call system application structure
用户通过电话首先与图书馆语音电话服务器上的语音电话卡建立语音及按键通路。固定电话用户直接通过公共电话交换网与语音卡建立连接,移动用户通过无线通信网经电信通信网关与公用电话交换网 (Public Switch Telephone Network,简称PSTN)连接[3],然后,通过同样的方式与电话语音卡建立连接。图书馆语音电话系统通过录放音模块、按键检测选择相应的用户服务功能,然后利用数据库接口通过局域网访问书目数据库,再把相关信息通过TTS模块发送给语音卡驱动系统,由语音卡驱动系统完成用户的服务请求[4]。
语音平台的功能是:读者通过拨打图书馆固定服务电话,获取图书馆相关信息服务,并且通过语音留言,实现与图书馆的交互服务。语音平台服务流程是:(1)读者通过电话输入语音和按键信息。(2)系统把输入的语音汇总到图书馆语音文件服务器上,把要求输入的用户信息保存到图书馆语音用户数据库里,并根据这些信息,向图书馆书目数据库查询读者信息。(3)后台管理者通过局域网录入登录信息,并将登录信息汇总到登录数据库,完成信息的验证。(4)系统把相关信息通过电话向读者完成语音输出,并把语音留言通过校园网向后台管理者输出。
2.1 语音平台的功能结构框图
图书馆语音平台对外提供的语音服务包括:图书的借阅查询、图书的挂失与续借、读者自行维护账号信息。为了便于运行后的维护,图书馆语音系统的后台管理模块应提供账号管理,信息统计等功能,具体模块功能结构如图3所示。
图3 语音系统功能结构框图Fig.3 Voice system function structure
2.2 语音平台的主要功能结构
系统从功能上可分为语音服务和后台管理两大模块。语音服务模块主要包括读者注册、密码修改、借阅查询、阅览证挂失、读者留言功能。后台管理模块主要是对系统日常运行的维护,主要包括后台账户管理、留言管理和信息统计。
2.3 语音平台的构建
2.3.1 语音卡设备的选型
语音卡设备选择三汇语音盒SHT-2B/USB。该语音盒内置功放和扬声器(可用于模拟响铃),配置放音输出口,可直接驱动耳机或话机手柄的扬声器,具有外线振铃检测、座位摘挂机检测和振铃输出、电话线路电压检测、板性反转检测等性能。它还具有内外线停电直通功能、主叫信息接收功能,支持DTMF和FSK模式,同时支持4通道全双工录音/放音功能和主叫信息接收/发送功能等。
2.3.2 语音平台的选择与开发
对于免费的CTI开发平台,蓝星际语音平台是个很好的选择。蓝星际语音平台是一个完整的CTI解决方案[5],使用该平台可以方便地开发互动式语音应答(Interactive Voice Pesponse简称IVR)呼叫中心等各种应用。最关键的一点是,蓝星际语音平台对三汇SHT-2B/USB有着较好的支持。
2.3.3 提示语音的录制
由于使用TTS技术将文本转化成语音的效果不如真人录音的效果,在一些固定提示的语音上,采用真人录音,可以提高系统的服务效果[6]。根据所选语音卡的特点,对录音文件使用8 k采样率,单声道,8bit格式的 WAV文件。录音工具采用GoldWave。
2.3.4 数据库操作
本系统涉及两个数据库的连接,语音用户数据库和书目数据库。语音用户数据库拟采用较为方便的微软的文件数据库Access 2003,书目数据库是SYBASE公司的Sybase 12.52。这里拟采用的连接方式是微软的 ActiveX数据对象 (ActiveX Data Objects,简称ADO),它提供了编程语言和统一数据访问方式OLE DB的一个中间层,允许开发人员编写访问数据的代码,此时只用关心到数据库的连接,而不用关心数据库是如何实现的。
语音用户数据库的连接驱动为 Microsoft.Jet. OLEDB.4.0,书目数据库的连接驱动为 SYBASE ASE ODBC Driver。
高校基于计算机网络、移动电话和固定电话的服务各有优势又相互补充,把这3种服务方式结合起来,不仅满足了读者多种方式的服务需求,也大大提升了图书馆的服务水平。
[1]李琦.利用语音卡增强图书馆在线服务功能[J].现代图书情报技术,2004(05):91-92.
[2]袁军,张思民.嵌入式中文TTS系统的研究与实现[J].电脑知识与技术,2008(06):1345-1346.
[3]刘昆.多媒体短信MMS系统的研究与实现[D].西安:西安电子科技大学,2006:45-46.
[4]李楠.基于CTI技术的呼叫中心的设计与实现 [D].大连:大连理工大学,2009:48-50.
[5]李德成.CRM呼叫中心系统设计与实现[D].北京:北京交通大学,2008:50-52.
[6]张亚鑫.基于CRM理念的银行呼叫中心系统的设计与应用[D].北京:北京交通大学 2008:43-44.
[责任编辑 杨明庆]
TN912
B
1008-486X(2015)01-0038-03
2014-05-06
河南省教育厅科学技术研究重点项目:计算机与电信网络数据交互技术在图书馆业务中的应用(12B520027)。
刘许亮(1982-),男,湖南邵阳人,讲师,硕士,主要从事计算机应用、嵌入式系统方面的教学与研究工作。