运营商问答系统融入AI打造智能客服

2018-07-10 03:26:24中国移动苏州研发中心程广兵
通信世界 2018年14期
关键词:知识库客服检索

中国移动苏州研发中心|程广兵

近年来,国内外各大公司在问答系统领域的激烈竞争从侧面印证了问答系统蕴涵的庞大商机。

智能问答系统是融合了自然语言处理技术和信息检索技术的人工智能产品。根据目标的不同,智能问答系统被分为开放领域与限定领域两类。本文介绍了限定领域的智能客服系统的算法结构,概述了架构中每个模块的功能。文章在最后简单介绍了本文作者参与开发的智能问答系统应用案例的解决方案。

随着互联网的快速发展和个人计算机的广泛普及,越来越多的消息和数据通过超文本传输协议以电子文档的形式发布。于是,用户可以通过互联网这种更加便捷的途径获取他们所需要的各类信息,与此同时,海量的数据资源汇聚在一起形成了信息大爆炸。如何准确并及时地在浩如烟海的信息世界中获取用户所需的信息,已经成为互联网发展至今的一大难题。信息检索技术就是解决这一难题的有效技术。

智能问答系统应用而生

搜索引擎技术作为一种成熟的信息检索技术,可以满足用户绝大部分的信息需求。但是,随着互联网数据的疯狂增长,搜索引擎的缺点逐渐显现。百度、谷歌、必应这类传统的搜索引擎,通常只能以关键词作为输入。而用户在检索信息时,需要将其查询凝练为若干简洁的关键词后提交给搜索引擎。对于普通用户而言,他们往往难以用少量的关键词来准确地表述其查询意图。此外,搜索引擎的返回结果不是一个简洁的准确答案,而是一个网页片段的列表。这些网页片段通常含有大量的噪声数据,用户仍然需要阅读这些网页片段乃至相应的原始网页,才能找到其所需的答案。

为了改善信息检索的用户体验,人们开始研究直接以自然语言作为输入与输出的问答系统,用户能够以文本或者语音的方式,使用自然语言直接地表达其查询需求。问答系统理解用户的查询意图后,通过一系列的检索、分析与处理,直接将以自然语言形式表述的准确答案返回给用户。因此,对用户来说,问答系统是一种更加方便、友好和精准的服务。

对于有人工客服的企业来说,问答系统可以为他们节约大量的人力,且问答系统更加稳定和高效。例如中国移动的传统客户服务方式包括10086的转人工服务、营业厅人工服务窗口等渠道,这些服务方式存在通讯费、培训费、人工资源等成本,且会受到时间(无法提供 24 小时服务)、场地(集中的客服办公场所)等条件的制约。随着企业客户量的增长,庞大的咨询需求往往让客服团队不堪重负。因此,在企业现代化、信息化、智能化发展的浪潮下,智能问答系统应运而生。

图 1 智能客服系统算法架构

近年来,国内外各大公司在问答系统领域的激烈竞争也从侧面印证了问答系统蕴涵的庞大商机:在通用领域苹果推出了Siri,微软推出了小冰和小娜,百度推出了小度。同时在限定领域的智能客服系统中有京东的JIMI机器人可以提供用户基本查询和聊天服务。阿里巴巴集团也在2015年推出了一款人工智能购物助理虚拟机器人,并取名“阿里小蜜”。据了解,阿里小蜜是一个无线端多领域私人助理,依托于客户真实的需求,通过“智能+人工”的方式提供客户极致的购物体验服务,提升客户留存并创造价值。另外专注于智能客服领域的企业小I机器人也为很多大的企业定制了客服机器人。

本文主要介绍限定领域的智能客服系统的一般架构、涉及的技术,最后介绍中国移动苏州研发中心自主研发的智能客服系统“知了”及应用案例。

智能客服系统算法架构

智能客服系统一般分为知识库梳理、问题理解、问题检索三大模块。系统整体的功能结构如图1所示。知识库梳理主要由知识库管理、知识维度、问答历史以及词类管理四个子模块组成。问题理解主要分为预处理、会话管理以及后处理三个部分,预处理部分主要有智能分词、实体识别两个子模块组成,后处理主要设置了智能纠错模块。目前问题检索部分这里没有细化,根据开发者使用的技术不同而不同,这部分在下一章会着重介绍目前主流的几种技术。主要为基于深度学习的问答系统、基于知识图谱的问答系统和基于统计学习的问答系统。

知识库构建

本部分所述限定领域智能问答系统的知识库有两种类型的知识源,第一种是根据FAQ形式组织好的常见问题集合,能够直接使用的知识源;第二种是由知识图谱构建的知识库。这里主要针对第一种构建第一种形式的知识库进行介绍,构建第二种知识库在下一章节再做介绍。知识库构建是智能答系统的预处理阶段,知识库的好坏将直接影响算法模型的效率以及准确率。

(1)知识库管理

知识库是智能问答系统的知识中枢,由分类、实例、属性、标准问题、扩展问题、标准答案组成。其中分类是标注人员或客户预先对知识库的各个问答对标注的分类信息,实例是指一个针对同一答案的不问问法的集合,属性是另一种分类信息,如移动营业厅中“和游戏”有:介绍、资费、办理以及退订等属性。标准问题和标准答案是指客户给出的常用知识问答对,扩展问题是指标注人员针对同一标注答案提供不同问法。

(2)知识维度

知识维度模块通过定义不同维度,对知识进行分类组织。例如可以有聊天库、机器人相关信息库、专业知识库。用户也可以根据需要自定义用户库。

(3)词类管理

词类管理模块实现对业务关键词、近义词、敏感词、前后缀和拼音词的符理。特定领域内部有许多领域内术语,词类管理通过人工手动添加的方式,增加词类信息。

(4)问答历史

问答历史模块记录所有用户跟智能机器人的聊天记录,基于此可以重点关注未解决问题,分析、改进智能机器人的智能化程度。基于用户志的推荐系统以及搜索引擎检索优化的成功应用体现了用户日志的重要性,高效、准确地记录和管理问答历史是提高智能机器人的重要过程。

问题理解

问题理解是指通过自然语言技术,将用户输入的查询语句所表达的意图转换到智能问答系统能够识别、理解的语义结构。本文所述智能问答系统中,问题理解功能主要依靠三个子模块完成。预处理模块将用户输入的查询语句通过智能分词、命名实体标注等方法转换为关键字、词序列。会话管理模块明确用户提出的问题,本文所述智能问答系统通过会话管理模块帮助表述不清自己意图的用户明确目的。后处理模块依靠纠错算法模型,允许用户输入拼写、表述有误的查询语句并返回正确结果。

(1)预处理

预处理阶段是指用户输入查询语句后,系统处理用户查询语句的模块,包括智能分词与命名实体识别两个阶段。第一阶段:智能分词,用户输入的检索语句是未经过分词的语句,将检索语句准确分词是之后所有算法能够正确实施的基本保障,分词时将词类管理中生成的特殊词以及词组添加入分词词典,并保持更新。第二阶段:实体识别,命名实体识别模块主要负责将语句中的人名、地名、机构名以及事先标注好的实体名识别出,并加以特殊标记。

(2)会话管理

会话管理中缓存了每个用户一定数量的历史聊天记录,当检索不到用户答案时,通过度量问答上下文,判断用户是否表意不清,反问用户是否想要咨询另一问题。会话管理模块见图2。

图 2 会话管理模块流程图

(3)后处理

后处理模块主要由智能纠错模块构成。智能纠错模块由拼音纠错和拼写纠错两个子模块组成。其中,拼音纠错模块主要用于纠正输入检索词中的输入法错误、含有拼音输入、以及口音等错误,模块使用注音程序将训练语料注音,通过拼音语料训练语言模型,将语言模型置信度较小的检索词替换为置信度较大的检索词,达到纠错目的。拼写纠错模块主要用于纠正输入的字形误差,在拼音正确的前提下,使用拼写纠错模块能够提高智能问答系统的回答准确率。会话管理模块见图3。

问题检索

问题检索模块是指处理完用户输入后,系统提供根据用户提出的问题进行查询以及排序并返回结果的过程。具体的技术细节在下一章节进行介绍。

知了智能问答机器人

中国移动苏州研发中心作为中国移动的全资子公司,是中国移动研发布局的重要一环,职责定位主要包括:集团客户产品、云计算及大数据平台、IT应用产品(网管、BOSS等)研发和运营支撑。因此面对集团公司对智能客服的需求,苏研自己研发了一款智能客服机器人“知了”。

知了是一款可以接入微信、网页等的智能问答系统,通过领先的语义理解和自然语言处理技术,实现企业级机器人的智能对话、个性化聊天。能够满足企业级知识智能获取、互联网产品智能客服、基于日志的智能运维以及智能聊天,从而有效降低企业服务型部门的人工成本,有效减少产品运营和运维成本。

知了智能问答产品主要服务内容包括:

●管理平台

●为业务人员提供知识管理平台

●多租户管理制,可提供企业管理账号和子账户

●知识批量导入,细致化管理

●未知问题智能学习

●数据监控分析

●个性化服务设置

●智能服务引擎(AI)

大云知了产品基于盘古分词库和先进的语义分析引擎技术作为支撑,为用户提供国内先进的人工智能服务,涉及的技术包括短文本分析、语义语法分析、词向量技术、深度学习等。

●知识库

强大的百度百科知识库、聊天库来支撑用户的提问需求;

面向企业的企业知识库,支持企业智能知识获取;

面向互联网产品知识库,助力产品智能运营客服;

基于日志的日志知识库,助力智能运维。

●多渠道对接

网页端,手机网页,微信端,APP端,并支持第三方集成和对接。

图3 会话管理模块流程图

知了智能问答机器人的典型场景有以下三部分。

●典型场景(一):企业内部服务咨询

通过批量添加企业内部服务知识,自动为员工提供咨询服务,解放企事业单位内部行政、人事、财务等部门被所有员工重复咨询的工作时间,提高服务部门的工作效率,减少人力运营成本。

●典型场景(二):企业运营小助手

整理互联网产品知识,形成产品知识库,为互联网产品提供智能机器人客服,在售前售后提供智能客服服务,减少产品人工运营成本。

●典型场景(三):日志智能运维

自动学习系统日志信息,从日志信息中发现问题与解决方案,整理成知识,实现日志智能运维,提供基于日志的智能运维服务。

编辑|王熙 wangxi@bjxintong.com.cn

猜你喜欢
知识库客服检索
语音推销
2019年第4-6期便捷检索目录
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
敬业的客服
高速公路信息系统维护知识库的建立和应用
专利检索中“语义”的表现
专利代理(2016年1期)2016-05-17 06:14:36
基于Drupal发布学者知识库关联数据的研究
图书馆研究(2015年5期)2015-12-07 04:05:48
基于广东“一张网”对内客服模式的探讨
一次深刻的淘宝经历
意林(2012年20期)2012-05-31 02:56:35
国际标准检索