铁路智能客服关键技术研究

2019-09-19 11:07张志强汪健雄
铁路计算机应用 2019年9期
关键词:客服语义语音

张志强,汪健雄,靳 超

(中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081)

新一代客票系统承担了铁路12306互联网售票、窗口售票、自动售取票、电话订票等多种渠道售票业务,目前,高峰日发售全国铁路客票超1 200万张,尤其是互联网/手机APP渠道占售票总量的比例最高约75%,已经成为广大人民群众铁路出行购票的主要渠道。由于售票量剧增,铁路客运业务规则复杂,铁路客票系统规模不断扩张,导致12306互联网售票系统(简称:12306系统)网络客服的需求量与日俱增,给铁路客服人员增加了大量的工作。由于人工客服存在维护成本高、服务时间受限、培训成本高、线路忙、人为错误不利于控制等问题,急需采用技术手段解决人工客服存在的问题。

中国铁路近年来为提升客运服务质量,不断引入智能技术,持续开展智能客服语音平台研究和建设。智能客服的发展是随着人工智能及计算机硬件、软件、网络技术不断发展而逐步推进的,随着智能客服机器人在各个领域的成功应用,其价值已逐渐被社会所认可。在经历了基于历史、上下文理解概念、句子基于知识推理的简单自然语言处理和搭建模型让机器学习推理等阶段,利用深度学习搭建神经网络解决困扰着人们的模型学习复杂、模型维护复杂的问题,还为语言交互、图像识别、人脸识别等领域带来了全新的突破。铁路智能客服基于语义理解和语言处理技术,利用深度学习和多场景交互技术,形成用户画像,使其具备快速反馈及精准推送能力,与人工座席协同工作。本文对铁路智能客服的关键技术进行探究,提出铁路智能客服总体框架,构建多渠道智能客服,为铁路12306系统智能客服提供有力支撑。

1 铁路智能客服设计

1.1 总体架构

总体架构设计是在保证安全的前提下引入“互联网+”,构建统一接入、统一转办、统一输出、统一监督、统一考核的智能客服体系,如图1所示。

图1 铁路智能客服总体架构图

(1)多媒体受理

支持热线电话、Web端、移动终端、第三方即时通信平台等多渠道的统一接入。

(2)业务层

包括咨询、查询、投诉、建议的受理、转派、处理、评价和考核。

(3)应用层

采用自助语音、文本智能问答、人工、转工单等方式对外提供服务。

(4)智能交互层

包括语音合成、语音识别,以及自然语言理解引擎等。

(5)支撑层

为前台应用提供支撑,包括渠道管理、会话管理、座席管理、工单管理、知识管理、流程管理、统计分析、系统管理、系统接口等模块。

(6)数据层

包括基础知识库、领域知识库、交互数据库以及语言语义库,文本数据库可以通过转换形成语音库,是语音输出的基础。

图2 业务处理流程图

1.2 业务流程

用户通过各种接入渠道输入语音或者文本信息,通过交互平台以语音导航、人工客服、智能问答等方式进行接待,根据咨询的业务分类(咨询、查询、投诉、建议)转接到相关业务知识库、相关业务部门人工座席等,根据具体情况,以语音、智能问答的方式进行实时回复,以工单的方式进行延时回复。具体流程设计如图2所示。用户可以通过铁路12306系统客服电话、12306系统APP语音交互或者其他语音输入模块向智能终端表达自己的需求,包括咨询或者办理各种业务,铁路智能客服通过语音识别和语义理解后,与后台的知识库进行对接,获取用户的关注信息后反馈给用户。这样的交互过程贴合用户的使用习惯,方便快捷,可有效提升客服的准确性和效率。

1.3 主要功能

(1)自然语言处理

通过实时捕获座席和用户对话,通过语音识别和语义去理解通话,具备处理自然语言中广泛存在的各种各样歧义性或多义性的能力,构建座席的人工智能(AI)助理,协同作业,提高效率。

(2)知识库管理

存储、组织、管理各种互相联系的知识片集合,包含覆盖程度较为全面的常用业务词汇和常用链接。

(3)最佳答案推荐

回答用户提出的问题时,采用场景式多轮会话交互模式,基于历史、上下文理解概念和句子,基于知识推理增强泛化能力,最终提供最优答案。

(4)在线留言与转接

当在线客服提供的结果无法解答用户问题时,允许用户在线留言或转接人工客服,解答用户问题。

(5)评估分析

将用户多种信息内容结构化,打上各类标签,并进行深入的挖掘分析,形成用户画像进行评估判断,可自动为每个用户的服务与政策制定等提供数据与决策支持。

2 智能客服关键技术

2.1 语义理解与语言处理

语义理解类似于人类阅读理解,当语言符号出现时,人类唤起大脑中语言符号所代表的含义,以此含义为代表去理解语言符号所代表的客观事物。通常为了降低语义理解实现难度,可通过人工构造数据集、应答所需要的单词、意境以及相应的问题回答,常见的任务形式包括人工合成问答、Cloze-style queries和选择题等方式[1]。

通过对铁路12306系统客服语料(含网站、APP、语音渠道)进行标注和分析,总结客服交互式语句的特点及对话特点,并采用深度学习技术进行12306系统客服领域的实体识别,提出针对12306系统客服环境的语义理解方案,解决旅客属性混杂、口音众多、口语表达不符合规范的语法导致的模糊性和二义性问题

2.1.1 语义三角模型与语义网

语义三角关系定义了概念以及概念和概念之间的关系。这种定义使人与人之间、人与计算机之间能基于共享的概念进行语言交流,让机器通过理解人的认知模型,建立机器理解人类自然语言的框架模型,如图3所示。

通过语义三角模型将事物根据属性划分归类成语义网。语义网又称本体,语义词典,是共享概念模型的明确的形式化规范说明。语义网定义了概念,以及概念和概念之间的关系,这种定义使得人和人之间,人和计算机之间能基于共享的概念进行语言交流。语义网由类(class)或概念(concepts)、关系(relations)、函数(functions)、公理(axioms)、实例(instances)组成。

图3 三角模型

语义网分为领域语义网和通用语义网,用于分层分领域建模。通用语义网由来自互联网积累的、商用多年以上被业界所共识的物体概念与状态及其间的关系组成;领域语义网由各领域在生产中积累、加载的信息构成。铁路12306系统领域类关系展示如图4所示。

图4 铁路12306系统语义网分类关系示例

2.1.2 智能语音交互

为使得智能客服像真人一样有听说能力,需要综合语音合成、语音识别等智能技术[2]。语音识别技术是让机器通过识别和理解过程将语音信号转变为相应的文本或命令,目的是将人类语音中的词汇内容转换为计算机可识读的输入,并可以识别语音内容、说话者、语种等信息,用于识别不同客户语音所蕴含的语义。语音合成可以将输入的文字信息转化为自然流畅的语音,替代人工为客户提供标准化的语音应答。铁路人工客服采用智能语音交互服务,实现客户语音的“可视化”,完成客户咨询问题词条及关键字的识别,辅助座席人员快速进行相关知识库、知识节点的搜索匹配,提高客户座席人员的工作效率和服务能力。

2.1.3知识搜索排序

知识搜索是增强智能客服响应问题的即时性和准确性的关键技术。采用“语义相似度”和“业务相似度”相结合的评分排序算法,满足客户对搜索排序的个性化要求,具体步骤如下:

(1)根据搜索内容和知识本身的语义关系得到两者的相似度,通过相似度排序得到智能搜索的雏形;

(2)根据知识搜索的点击率、热点知识得到问题和知识之间相关度的指数,有效区别排序权重;

(3)划分知识等级时,与销售业务相关的权重比管理类知识划分的权重更高;(4)将过期知识的权重降低,提高知识有效性;(5)对个别知识的搜索权重可以通过规则来配置设定。

2.1.4 语音情感识别

在铁路智能客服中引入语音情感识别,可根据用户情感的变化提供更人性化的服务,有效提高铁路智能客服的服务质量,提升用户满意度。例如,当语音情感识别程序检测到当前用户存在不满情绪时可及时转接至人工服务。而当话务员遭遇态度恶劣的客户时,自身情绪容易发生波动,系统可以提醒其保持冷静。

情感识别本质上是模式识别,核心在于寻找合适的识别模型[3]。目前,主要采用模式分类方法,其中,人工神经网络、隐马尔可夫模型、支持向量机等方法取得了较好的效果。

2.2 深度学习

2.2.1 深度学习模型

铁路智能客服采用深度学习模型,可分为一维匹配模型、二维匹配模型、推理模型[4],其中,一维匹配模型和二维匹配模型是基础模型,推理模型则是在基础模型上重点研究如何对内容进行推理。

(1)一维匹配模型

一维匹配模型的基本思路为:假设用户问题记为Q,而某段文本中存在某个单词Di可能是问题Q的答案的可能性记为F(Di,Q),或者理解为语义和问题Q整体语义的匹配程度,用点积表示为:

对每个单词的匹配函数值通过归一化指数函数进行归一化,该过程被称作为注意力(Attention)操作,用于增强单词是该问题答案的可能性。对于整个文本中某单词多次出现的情况,其注意力操作结果不同,即该单词在上下文中对应答案的概率,最后将同一单词的注意力概率值累加作为该单词是问题Q答案的可能性,问题答案则被认为是可能性值最大的单词。多数主流模型基本都采用一维匹配模型结构,主要区别主要是匹配函数的定义不同[5]。

(2)二维匹配模型

二维匹配模型与一维匹配模型不同的是:其采用问题表示法进行问题表达。相较于一维匹配模型将问题的语义表达为一个整体,二维匹配模型文本中的每个单词都采用独立的单词表达(Word Embedding)向量表示。由于Word Embedding向量是每个单词及其上下文语义的二维结构,引入了更多细节信息,整体而言,二维匹配模型效果优于一维匹配模型。

(3)推理模型

自然语言推理是判断两个句子(Premise,Hypothesis)或者两个词之间的语义关系。自然语言文本不能明确地定义并表达符号之间的逻辑关系,所以,自然语言表达有相当大的模糊性,推理过程的实现难度较大。目前,主流的推理模型有AMRNN[6]、GA Reader[7]和 IA Reader[8]。

推理过程更适用于有一定难度的问题,通常对于简单问题没有明显作用。其推理作用效果与数据集难度相关联,以常见的通用推理 数据集为例,Google采用的新闻语料库CNN数据集整体偏容易,因此无需复杂的推理步骤也能得到正确回答,而在Facebook采用的新闻语料库CBT数据集上,有推理过程的评价指标比无推理过程评价指标提高了2.5%~5%[9]。

2.2.2 自动巡检机制

(1)通过网页爬虫、文档录入等数据预处理手段进行碎片化加工后,形成专业领域的知识库,对过期知识进行下架或删除处理;

(2)自动对未识别的问题集进行非结构化分析,形成主题类别和优化建议,便于采编人员对重点问题进行优化。

2.2.3 自我调整

自我调整是采用场景式多轮会话交互模式支持图形化配置对话的流程,采用寒暄等场景对用户进行甄别,从而不断调整机器的对话方式,实现对用户的逐步引导。

2.3 精准营销

2.3.1 用户画像

通过与用户的交流可以收集到用户的基本信息,智能客服对这些信息进行建模,抽象出用户的标签,形成用户画像[10]。

(1)数据收集

主要收集网络行为数据、用户偏好数据、用户交易数据等。

(2)建模

行为建模是对收集到的数据进行处理,该阶段注重的是大概率事件,通过算法模型尽可能排除用户的偶然行为。

(3)成型

画像成型是行为建模的深入,对收集数据进行处理后对用户进行标签化,根据用户的基本属性(例如年龄、性别、地域等)、心理特征、兴趣爱好等方面细化分类。用户画像无法100%准确描述一个人,只能尽可能准确。因此,需要不断收集数据、根据变化的基本数据不断修正,才能使得用户画像越来越立体、越来越真实。

2.3.2 营销推送

当用户画像成型后,使用大数据可视化分析,针对某个标签或是某个群体,细化出不同类别的用户,评估用户的趋势行为及价值空间,对接业务接口,推送最新资讯或公告,做出针对性的营销[11]。

3 结束语

基于铁路智能客服关键技术的12306系统客服平台已经在中国铁路上海局集团有限公司试运行,取得了良好效果,为铁路企业与海量用户之间建立了基于自然语言、快捷有效沟通的技术渠道,同时,为铁路企业提供了细粒度知识管理技术和精细化管理所需的统计分析信息,有效解决了传统人工服务维护成本高、服务时间受限、培训成本高、线路忙等诸多问题,减少了人为错误,规范了服务标准,达到了精准营销和服务整合的目的,提高了铁路12306系统客服接通率和满意度,提升了铁路用户体验,树立了铁路良好社会形象。随着科技进步持续升级,将构建多渠道全方位智能客服,为铁路客服和出行旅客提供更便捷、更友好、更准确的全流程解决方案。

猜你喜欢
客服语义语音
真实场景水下语义分割方法及数据集
语言与语义
语音推销
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
建议
“吃+NP”的语义生成机制研究
出大事了等