苏立伟, 刘振华, 陈海燕
(广东电网有限责任公司 客户服务中心, 广州 528000)
随着电力改革发展,电力企业与客户的沟通交流越来越多,95598客户服务热线仍是电力企业与客户之间进行沟通交流使用频率最频繁的服务渠道。尽管电力企业与客户之间的互动渠道日益增多,但相较于其他沟通方式,语音交流具有交互便捷、蕴含丰富信息等优点[1],对于客服而言,能更直接明了地了解到客户意图。调查发现:一个具有10个坐席的呼叫中心一天的话务量是5 000通电话,话音量约为500个小时[2]。
电力企业的运营管理中,客服人员与客户的对话质量将直接影响客户的用电体验,客服人员的服务质量在电力企业的发展进程中有着至关重要的作用[3]。绝大部分隐藏在语音文件中的价值信息未被有效挖掘。运营商针对目前大量录音数据暂无系统化的分析、质检、运营解决方案。如何通过智能语音分析的技术应用,实现基于智能语音分析的客服智慧运营管理解决方案, 从而有效提升智能化运营手段、强化内部管理、聚焦客户服务心声,提高客户服务满意度,有效降低客户投诉率[4]。客服中心对通话音频进行质检,就是对95598服务热线的客服人员的话务质量进行监测与评分,通过监测客服人员的服务水平,以考核结果来定量评价客服人员的工作质量,依据公平客观的结果来评估客服中心的运行情况[5],以确保客服人员的总体服务水平,提高客户的满意度。
传统的质检方法以人工抽样质检录音,客服人员每天处理数万通电话,而质检人员对所有的通话录音只能通过随机抽样的方式进行人工测听,这种方法不仅工作量大、覆盖面窄、抽检率低,同时由于质检人员的判断具备主观性,难以有效客观地对整体服务质量进行合理评价。一通录音平均时长为120秒, 通过语音质检可以直接定位到问题工单, 每通约节约66秒, 每天将节约23.8小时[6]。
问题语音检出方法设计方案
针对传统的质检方法所存在的缺陷,本设计提供一种问题语音检出方法和装置,属于呼叫系统技术领域。其中,问题语音检出方法包括:向呼叫中心获取录音音频数据;将获取的录音音频数据转化为文本格式的数据;所述文本格式的数据中包括坐席文本数据和客户文本数据;采用预设的质检匹配算法对坐席文本数据进行评分,得到录音音频数据的服务质量分值;如果所述服务质量分值小于设定阈值,发出问题提示,以提示用户对所述录音音频数据进行人工质检[7]。通过对录音数据的监测、提炼, 定期整理出涉及公司业务流程、管理漏洞、产品缺陷、服务短板等方面的问题, 为提高公司整体服务能力、减少服务短板提供依据[8]。本发明实施例提供的问题语音检出方法和装置,对录音音频数据自动进行识别和评分,可以实现全面覆盖,检出问题通话录音,提示用户对问题通话录音进行人工质检,大大减少了质检工作人员的工作量。
1) 向呼叫中心获取录音音频数据
与95598呼叫平台录音数据库实现无缝对接和交互,根据录音编号信息,查询该录音在呼叫平台的存储路径信息。根据录音存储路径,获取录音文件及对应XML文件(包含用户来电信息)[9]。并将所有录音文件进行转码(8K 16bit编码格式),使用SFTP传输方式上传至语音分析引擎作保存及语音识别。
2) 转译录音音频数据
通过语音转译引擎将获取的录音音频数据转化为结构化的文本格式数据;所述文本格式的数据中包括坐席文本数据和客户文本数据[10]。将非结构化的录音音频数据转化为结构化的文本信息数据是实现该问题语音检出方法的一项核心功能,转译成结构化文本信息数据后,有利于录音定位、问题检出、便捷检索等[11]。
3) 录音预质检
采用预设的质检匹配算法对所述坐席文本数据进行预质检评分,并检出录音存在的差错问题,得到所述录音音频数据的服务质量分值;如果所述服务质量分值小于设定阈值,发出问题提示,以提示用户对所述录音音频数据进行人工质检。
通过上述三步,将对从呼叫中心所获取的全量录音音频数据进行全自动质检,保证录音覆盖面广、质检客观,并有效检出录音中存在的差错问题,同时在转译文本数据中标记差错位置,有利于后期进行人工质检时进行定位与质检,保证其准确性与工作效率。
本设计提供了一种问题语音检出方法。当成功从呼叫中心获取所需录音音频数据,则需要后续一系列适当的操作将问题录音成功检出。
2.1.1 语音转文本方式一
根据所述录音音频数据中包含的不同语音的音色、音调及用语,将所述录音音频数据区分为坐席音频数据和客户音频数据;
将所述坐席音频数据转化为坐席文本数据;
将所述客户音频数据转化为客户文本数据[12]。
2.1.2 语音转文本方式二
将获取的录音音频数据整体转化为文本格式的数据;
对所述文本格式的数据进行语义识别和上下文匹配,将所述文本格式的数据区分为坐席文本数据和客户文本数据。
2.2.1 录音预质检方式一
采用余弦相似性算法和/或汉明距离算法对所述坐席文本数据进行评分,得到所述录音音频数据的服务质量分值。
2.2.2 录音预质检方式二
采用余弦相似性算法判断所述坐席文本数据中所包含的预设的标准用语的数量;
根据所述标准用语的数量,确定所述录音音频数据的服务态度分值;
采用汉明距离算法判断所述坐席文本数据中所包含的客户信息是否正确,确定所述录音音频数据的服务有效性分值;
根据所述服务态度分值和所述服务有效性分值,得到所述录音音频数据的服务质量分值[13]。
2.2.3 录音预质检方式三
对所述服务态度分值和所述服务有效性分值进行加权处理,得到所述录音音频数据的服务质量分值。
2.2.4 录音预质检方式四
采用关键词匹配算法,判断所述坐席文本数据中是否包含预设的服务禁语;
如果是,从所得的服务质量分值中扣除设定的第一分值。
2.2.5 录音预质检方式五
当采用关键词匹配算法,判断所述坐席文本数据中不包含预设的服务禁语时,采用同义词匹配算法,判断所述坐席文本数据中是否包含预设的服务禁语;
如果是,从所得的服务质量分值中扣除设定的第一分值。
以提示框的形式,显示包含所述录音音频数据编号的问题提示信息。
本设计提供了一种问题语音检出装置。该装置包含问题语音检出的流程中各模块功能,能有效将问题语音检出。
用于向呼叫中心获取录音音频数据。该方法可以在计算机中通过执行应用程序实现,该应用程序自动向呼叫中心获取录音音频数据。呼叫中心可以是与各个坐席通话终端连接的中心服务器或存储器。
获取的录音音频数据中包括通话时间、通话终端号及通话录音,还可以包括坐席服务人员的工号。
用于将获取的录音音频数据转化为文本格式的数据;所述文本格式的数据中包括坐席文本数据和客户文本数据。
具体可以根据录音音频数据中包含的不同语音的音色、音调及用语,将录音音频数据区分为坐席音频数据和客户音频数据,然后将坐席音频数据对应转化为坐席文本数据,将客户音频数据转化为客户文本数据。或者,可以将获取的录音音频数据先整体转化为文本格式的数据,然后对文本格式的数据进行语义识别和上下文匹配,将文本格式的数据区分为坐席文本数据和客户文本数据。
用于采用预设的质检匹配算法对所述坐席文本数据进行评分,得到所述录音音频数据的服务质量分值。
可以采用余弦相似性算法或者汉明距离算法对坐席文本数据进行评分,得到录音音频数据的服务质量分值。也可以采用余弦相似性算法判断坐席文本数据中所包含的预设的标准用语的数量;根据标准用语的数量,确定录音音频数据的服务态度分值;采用汉明距离算法判断坐席文本数据中所包含的客户信息是否正确,确定录音音频数据的服务有效性分值;根据服务态度分值和服务有效性分值,得到录音音频数据的服务质量分值。
3.3.1 余弦相似性算法
采用余弦相似性算法判断坐席文本数据中所包含的预设的标准用语的数量,即采用余弦相似性算法将坐席文本数据中的词句与预设的标准用语进行比对。
将坐席文本数据中的词句作为第一向量,将预设的标准用语作为第二向量,通过计算两个向量的夹角余弦值来评估二者的相似度。具体来说,余弦函数是三角函数的一种,在Rt△ABC(直角三角形)中,∠C=90°,∠A的余弦是它的邻边比三角形的斜边,即cosA=b/c,也可写为cosA=AC/AB。余弦函数:f(x)=cosx(x∈R)。
对于二维空间,根据向量点积公式,可以得知 ,假设向量a、b的坐标分别为(x1,y1)、(x2,y2),则。
设向量A=(A1,A2,…,An),B=(B1,B2,…,Bn),则,其中,Ai、Bi指词频。
如果坐席文本数据中的语句与某个预设的标准用语的余弦相似度达到0.75,则认为坐席文本数据中包含该预设的标准用语。统计坐席文本数据中所包含的预设的标准用语的数量,数量每增加一个,服务态度分值就增加一个设定值。数量越多,录音音频数据的服务态度分值越高。
3.3.2 汉明距离算法
汉明距离算法判断坐席文本数据中所包含的客户信息是否正确。SimHash(汉明距离)算法将一个文档转换成64位的字节,然后通过判断两个字节的汉明距离确定相似度。通过simhash算法可以分别计算出坐席文本数据中所包含的客户信息的simhash值和预存的客户信息的simhash值,通过计算出的两个simhash值来计算两者之间的汉明距离,根据汉明距离来比较两者之间的相似度。汉明距离是指两个相同长度的字符串相同位置上不同的字符的个数。
汉明距离算法主要包括分词、hash(哈希算法)、加权、合并和降维五个步骤。首先针对坐席文本数据中的一段语句,进行分词,得到有效的特征向量,然后为每一个特征向量设置1-5等5个级别的权重(如果是给定一个文本,那么特征向量可以是文本中的词,其权重可以是这个词出现的次数)。
用于如果所述服务质量分值小于设定阈值,发出问题提示,以提示用户对所述录音音频数据进行人工质检。
判断服务质量分值是否小于设定阈值;如果是,发出问题提示,以提示用户对录音音频数据进行人工质检,以提示框的形式,显示包含录音音频数据编号的问题提示信息。
本次设计研究应用于95598电力客服智能质检系统的问题语音检出方法,构建基于语言智能处理技术的新一代智能客服,形成跨语言、全流程、深层次的客服智能化理解、处理与服务能力[14]优化传统以人工抽样质检录音的质检方法,避免质检覆盖面窄、抽检率低、问题检出率低的情况,通过全量自动质检录音,能够有效自动检出全量录音中存在问题,发出问题提示,以提示用户对所述录音音频数据进行人工质检。通过这种方法,能够避免质检人员随机抽检的主观性与随机性,有效对整体的客服服务质量进行客观合理的评价。
利用设计的问题语音检出装置将问题语音检出方法实施,通过将95598录音文件转译为结构化的文本,改变传统的人工抽检,采用预设的质检匹配算法对全量文本数据进行预质检并检出存在问题的录音并提示用户,便于后续的人工质检工作。经由智能质检系统, 同时结合业务模型, 对全量录音将被筛选分析, 此时研究将传统的随机抽样方式转变成程序进行, 然后筛选出可能有问题的通话记录再交由人工进行质检大大提高了质检的覆盖面积, 根据系统词语库设定敏感用词以及抽样方法的筛选, 使得每个客服的质检范围都是一致的, 使质检更加具备公平性与针对性, 为市场需求以及倾听用户需求提供有效的数据[15]。
目前问题语音检出方法主要应用于95598电力客服智能质检系统中,在应用效果日趋成熟后,可将其推广至电力行业的其他客服渠道中如统一服务平台的各远程渠道、营业厅的客服渠道等,力求能对所有渠道的客户服务内容进行收集与分析,获取具备业务价值的数据,并持续提升南方电网的客户服务水平。