陈海燕, 乔麟, 苏立伟
(广东电网有限责任公司 客户服务中心, 广州 528000)
目前,广东电网95598服务热线采取19个地市局集约运营模式,高峰期日均排班320席,日均人工业务2万宗。由此可见,95598客户服务热线是公司与客户接触的重要渠道,但95598客户服务热线当前普遍存在服务质量检测失实、来电原因数据失真、客户需求缺失等短板问题。呼叫中心作为企业用户信息及服务信息的主要入口,采用传统的数据采集、数据整理和分析的方法,效率低,成本高,无法从海量信息中精准提取有效信息,受到传统数据采集限制,数据采集多采用隔壁样本化,无法实现大数据筛选及精准分析[1]。
通过计算机网络形成的管理系统已经成为信息生产和管理,客服人员每天处理数万通电话,而质检人员对这些通话录音只能通过人工测听的方式进行抽查,测听抽检比率低,质检工作量大,效率低且覆盖低,难以有效评价整体服务质量[2]。有时可能是一种很模糊的录音,不一定都是存在重大的问题,可能是一些表达的方式不好,表达中出现了不该出现的用语,这些都是通过人工不断都去检测,可能要不断地重复地收听一段录音,现有的语音手动抽检测听的方式效率低下并且覆盖率低,这样手动人为地检测受到人为因素影响很大,可能在某一时间段漏掉一些关键的词,无法准确地检测不良的录音[3]。针对客户心声,隐藏着大量的价值信息,如何收集、分析客户心声为深入剖析业务流程,系统及产品等存在的问题,协助决策领导针对性的问题解决[4]。
随着信息技术的不断发展,新的应用技术不断涌现,新兴的业务需求的也不断出现。为了跟上时代的步伐,为客户提供更加优质的服务,满足更多客户的要求,95598热线需要有效的方法、技术手段和工具支撑,积极采用新技术,不断的对客服工作进行升级补充,实现对客户精细化服务的全面支撑。通过自然语言处理对录音文本进行处理,自然语言处理(NLP, Natural Language Processing) 是人工智能和计算机科学的重要研究方向,主要包括文本分类,语音识别,中文自动分词,机器翻译,文本校对、信息抽取等方面的技术[5]。
针对上述现有技术中存在的问题,本设计提供了一种基于语音分析的智能评分方法,可以进行全量覆盖质检,质检效率高,节约了质检工作人员的工作量,并提高质检质量。
将这种基于语音分析得智能客服评分方法应用于95598客户服务热线的智能质检系统中,对全量95598录音及工单数据进行语音分析,结合质检模型实现全自动化的质检评分流程。并且实现录音转文本后,还对语音数据进行更深层的数据挖掘与跟踪分析,通过对热点分析技术、语音关键词联想技术、客户数据跟踪分析研究等,得到的结果可以应用于便捷地开展业务和用于模型配置,有利于对95598热线进行有效的监控和对异常事件的响应,同时也可较全面的刻画出客户的特征,挖掘隐藏在大量通话录音中的信息,大大提升95598客户服务的精益化管理水平[6]。
系统架构如图1所示。
图1 系统架构图
通过使用语音转写引擎与自然语音处理算法作为系统支撑工具,结合95598服务热线录音及客服工单数据,进行全面的质检工作。语音转译可将非结构化的语音信号转换为结构化的文本信息, 是建立文本索引的基础。然而在95598话务中转译难度较大, 原因一是话音差异, 必须以场景分割实现分离;二是受限于方言;三是囿于复杂的汉语同音词及声调, 混淆性大幅提升[7]。以自动化代替现有人工的质检工作,质检人员只需要看结果即可[8]。从而使质检更具有针对性,大大提升质检的覆盖范围及质检效率。且本系统还具备分析能力,有效针对各种重复来电进行重复来电分析,及时发现客户的不满需求,有效提升95598客户服务的精益化管理水平。并且使用语音分析技术,将非结构化录音数据转化为文本数据,为大数据分析应用和后续智能客服体系的搭建夯实基础。
系统功能架构如图2所示。
图2 系统功能架构图
呼叫中心录音通过网络传输至索引建立服务器集群中,索引服务器对送入的语音进行识别等过程后生成相应的索引文件,索引文件中包含了语音中的所有信息,并存储至检索服务器集群中,当用户需要进行检索时候,通过连接检索服务器进行查询。检索服务器根据用户的需求对从生成的索引文件中进行快速的查找,并将查询结果返回至用户,同时针对索引及转写结果进行相关质检和分析应用的开展。
语音分析录音数据工作流程如图3所示。
图3 语音分析工作流程
1)语音转写
语音转写是语音分析中最重要的步骤,是建立文本索引,将非结构化的语音文件转换为结构化的文本信息的核心功能。
首先将分离后的语音通过声学模型转换为对应的汉语音标符号,音标信息再通过超大词汇网络的语言模型识别出最终对应的文本内容。这个过程中,需结合业务中涉及的各地、各区域地方口音适配,来优化声学模型使其能够广泛覆盖中国地方口音,还需要结合业务知识和热线服务范围,进行语言模型优化以提升语音转写准确率[9]。如图4所示。
图4 语音转写示例
2)场景分割
在目前的热线平台录音中,记录了客服人员和客户的全部对话,并按照录音流水进行存储,同一个录音中同事包含了客户和客服的录音[10]。在语音分析应用中,我们需要对两方的通话内容进行分离,进而针对性的对客服人员服务质量进行监控,以提升热线整体服务水平;而对客户语音内容进行热点问题分析、主要意见/建议、知识挖掘等应用,如图5所示。
图5 场景分割示例
3)索引建立
语音分析系统可以检测出录音文件中用户及热线服务人员都没有说话的静音时间等,这些信息最终生成标准XML格式的索引文件,索引文件的内容通常包括:
转译文本内容;
声道信息;
工单内容;
4)关键词检索
实现关键词检索功能,对指定的关键词列表,得到包含该关键词列表中任意一个或多个关键词的数据列表,以及关键词在对应数据中的出现位置(时间起止点)[11]。
5)热点分析技术
通过引入一种候选短语获取的语音热点分析技术,对海量录音中一定时期热度高的那些短语,比如人名、地名、业务名称、投诉等,进行自动的筛查,展示当前录音的热点词和热点行为等,有利于对95598热线进行有效的监控和对异常事件的响应[12]。
6)便捷测听技术
提供嵌入一种便捷测听技术,在对录音中非结构化的语音文件转换为结构化的文本信息后,通过提供多种便捷测听的方式[3]。实现对文字化的录音进行拖动、跳转、关键词附近和全文测听等操作支持,供质检人员使用,从而提升质检效率[14]。
本设计提供了一种语音系统预质检评分方法,用于对坐席服务人员的通话录音进行预质检评分。所述方法包括:
1)向呼叫中心获取录音音频数据;
2)将获取的录音音频数据转化为文本格式的数据;所述文本格式的数据中包括坐席文本数据和客户文本数据;
3)采用预设的质检匹配算法对所述坐席文本数据进行评分,得到所述录音音频数据的服务质量分值;
4)将所述服务质量分值与所述文本格式的数据对应进行存储。
本设计提供了一种语音人工质检评分方法,用于对坐席服务人员的通话录音进行人工质检评分。所述方法包括:
1)从存储系统中获取已经过系统预质检评分的录音音频数据与转译文本数据;
2)按业务需求由人工对录音进行筛选与分配;
3)质检员按质检评分标准对分配的录音进行人工质检;
4)将人工质检评分后的录音音频数据与转译文本数据对应进行存储。
本设计提供了一种语音人工复检评分方法,用于对坐席服务人员的通话录音进行人工复检评分。所述方法包括:
1)从存储系统中获取已经过人工质检评分且由人工提出复检申请的录音音频数据;
2)由质检值长与质检主管复检人工复检评分;
3)将人工复检评分后的录音音频数据与转译文本数据对饮进行存储。
系统整体质检流程如图6所示。
具体流程描述如下:
(1)首先,系统自动将全量录音根据评分项进行语音预质检;
(2)人工分配已预质检的录音给人员进行人工质检。
(3)坐席对经过人工质检的录音提出复检申请,由坐席值长进行初次审核,是否同意该复检申请。如同意则流转到值班经理处理,如不同意将结束复检申请。
(4)复检申请流转到值班经理处进行二次审核,如值班经理同意则将复检申请流转到质检值长进行人工复检评分,如不同意将结束复检申请。
(5)坐席查看二次质检结果后,仍然对质检结果不满,线下找到值班经理,说明理由情况,如值班经理同意,可由值班经理发起终审申请,由仲裁小组进行第终审复检评分,结束整个过程。如不同意也结束复检申请。
图6 语音评分流程
本次设计基于语音的智能客服评分方法应用于智能语音质检系统中,将95598录音文件转译为结构化的文本,改变传统的人工抽检,采用预设的质检匹配算法对全量文本数据进行预质检评分后,再进行指定分配人工质检。这种方法大大提高了质检的效率与覆盖面积。同时由主管负责指定分配录音的类型,使得人工质检的的效果更具备公平性与针对性。构建基于语言智能处理技术的新一代智能客服,形成跨语言、全流程、深层次的客服智能化理解、处理与服务能力[15],同时对全量录音数据、人工质检录音数据分别进行数据挖掘与分析,准确获取客户意图与需求,为精准营销服务提供有效的数据支撑。
目前基于语音分析的智能客服评分方法应用在95598服务热线录音的智能质检系统中,在应用效果日趋成熟后,可将其推广至电力行业的其他客服渠道中如统一服务平台的各远程渠道、营业厅的客服渠道等,力求能对所有渠道的客户服务内容进行收集与分析,获取具备业务价值的数据,并持续提升南方电网的客户服务水平。