铁路企业智能问询平台关键技术研究

2022-03-31 07:32张正普王晓冬郭奕聪
铁路计算机应用 2022年3期
关键词:识别

张正普,王晓冬,郭奕聪

(1.中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081;2.中国铁路网络有限公司,北京 100038)

目前,铁路企业规章制度繁多,制度条例冗细,不易管理和学习解读。制度之间存在较强关联性,需对各项制度进行系统地学习,才不会造成工作审批流程、审批单等的缺失或错误;制度及工作审批流程经常随着上级单位的管理需求变更而进行改变,易造成员工对制度更新的信息接收滞后,从而影响工作效率;各项制度分管管理部门不同,管理较分散,无统一问询、解答出口。铁路企业智能问询平台旨在采用人工智能技术为企业的客户及内部管理提供便捷、准确和高质量的服务,拓展服务渠道,提高员工工作效率,增强企业效能,提高客户满意度。

智能语义语音作为智能问询平台的核心技术,又称为机器人智能语音交互技术,是以语音作为载体,使机器具备能说会听、学习思考的能力,从而实现人类与机器之间类似人类交互之间的自然语音交互过程。通过智能语音交互技术建设智能问询平台具有重要意义[1,2]。

1 需求分析

铁路企业业务部门向管理部门咨询政策主要通过现场问询和电话咨询2种方式实现,均靠人工完成,存在着工作量大、服务质量难以控制等问题。通过企业内部管理部门人工解读规章制度以及制度条例方式,为业务部门提供释疑工作,总结与业务部门沟通模式分为问答型多轮对话、预知型问题引导;根据服务内容,可分为咨询、求助和建议等3类。

(1)咨询类。业务部门询问条例及规章制度信息,包括企业管理条例。

(2)求助类。业务部门向管理部门寻求帮助,包括需要管理部门配合、助力业务工作的进展。

(3)建议类。业务部门提出管理建议,包括服务质量的改善、管理水平的提升等。

梳理企业内部管理要求,结合铁路企业管理特点,总结分析平台功能需求,需实现系统统一前端入口,基于智能服务引擎及统一管理后台,实现铁路企业智能问询平台的整体功能。

2 平台设计

2.1 平台总体框架

铁路企业智能问询平台的总体框架,如图1所示。

图1 铁路企业智能问询平台总体框架

(1)基础硬件设备支撑:为平台的开发及运行提供服务器、存储和网络等基础的硬件支撑,可兼容互联网数据中心(IDC,Internet Data Center)或第三方基础设施即服务(IAAS,Infrastructure as a Service)平台。

(2)开发支撑:为系统研发提供研发平台,二次开发接口、测试工具及预发布环境。

(3)语义引擎集群:引擎集群部署,为不同管理部门提供相应服务,以满足语义引擎使用的高可用性。统一形成处理自然语言和集成各种专业处理引擎的基础平台。

(4)业务逻辑:基于语义引擎集群式的部署方式,为业务部门提供业务功能,如自然语义识别、推荐语义、通用领域语料和数据报表等。

(5)用户管理台:为系统管理员提供相关功能,包括机器人管理、知识管理、应用管理和素材管理[3]。

(6)接入渠道:支持全渠道服务应用接入,并支持第三方服务应用的接入。

2.2 平台功能架构

铁路企业智能问询平台自终端到后台分用户平台层、公共服务层和基础支撑层3个层面,为企业管理提供的功能,如图2所示。

图2 铁路企业智能问询平台功能框架

(1)用户平台层面主要涵盖智能问询、智能服务热线及系统管理功能,为企业管理提供高效率、高质量的服务。

(2)公共服务层主要涉及推送服务、渠道接入推送服务、等服务内容。

(3)基础支撑层由接口平台、统一管理后台模块、语义引擎等业务功能模块组成。

接口平台实现智能问询平台与各渠道终端的业务逻辑开发和展现,支持全渠道服务应用接入,并支持第三方服务应用的接入。

统一管理后台可以管理和维护引擎的运行,配置引擎运行所需系统参数,管理和配置知识库,以及对终端用户交互日志信息的统计分析。

语义引擎主要为分词引擎、语义分析引擎及搜索引擎结合超大规模的词典,统一形成处理自然语言和集成各种专业处理引擎的基础平台,综合了多种学科的知识,进行高度智能化的语意分析,准确定位知识库内对应业务答案。

3 关键技术

铁路企业智能问询平台的核心技术是智能语义分析模型的搭建,用以提供对非结构化大数据智能理解与自动化处理能力,实现文本知识多维度的业务标签标记,将无序的非结构化信息转换为满足企业管理业务需求的结构化数据,实现上下文语义分析、关键词识别、模糊问题识别,进而提供语义识别、智能语音等平台业务逻辑。

3.1 问答数据的语音识别

语音识别利用信号处理方法对说话人的语音进行检测、特征提取、降噪等预先处理,从而获取最合适识别引擎处理的语音[4],如图3所示。图中,IVR为互动式语音应答(Interactive Voice Response);ASP为自动语言识别(Automatic Speech Recognition)。

图3 智能语音实现流程

在实际应用中,语音信号的压缩率介于10~100之间。语音信号包含了大量不同的信息,提取哪些信息,用哪种方式提取,需要综合考虑各方面的因素,如成本、性能、响应时间和计算量等。语音训练模型[5]是通过输入大量的语音语料构建声学模型,从而完成语音到音节的分节计算。当语音经过前端处理及特征提取后,将获取的特征向量与声学模型及发音词典进行比对搜索。

语音合成技术将文字序列转换成音韵序列,由语音合成系统根据音韵序列生成语音波形,对语音信号进行分析处理,去掉与语音识别无关的冗余信息,获得影响语音识别的重要信息,同时对语音信号进行压缩,将任意文字信息实时转化为标准流畅的语音。

3.2 问答数据中的语义识别

通过语音识别获取的音频信号输入,完成特征提取,声学模型提取有代表的特征向量,语音解码搜索对特征向量,语言模型分数、若干字词在字典得分,最后输出得分高的作为识别结果。在问答库中选出与输入问题相似度最高的问题,返回相似度最高的问题所对应的答案[6],智能语音识别流程图,如图4所示。

图4 智能语音识别流程

传统文本匹配技术有词袋(BOW,Bag-of-Word)模型、向量空间模型(VSM,Vector Space Model)、词频—逆向文件频率(TF-IDF,Term Frequency-Inverse Document Frequency)、BM25、Jaccord、SimHash 等,主要解决字面相似度问题,由于中文含义的丰富性,通常很难直接根据关键字匹配或者基于机器学习的浅层模型来确定2个句子之间的语义相似度。

为此采用深度学习文本匹配模式进行语义表示,能够节省人工特征提取的成本。从大量的样本中自动提取出词语之间的关系,并能结合短语匹配中的结构信息和文本匹配的层次化特性,发掘出隐含在大量数据中含义不明显的特征。

在已知输入序列的情况下,采用RNN-T(RNNT,Recurrent Neural Network Transducer)模型进行语义识别输出标签的概率分布[7]。RNN-T的结构将前馈网络和 softmax通过 audio encoder的输出和 label encoder的输出结合起来,从而在每一个时间节点得到一个在输出标签上的概率分布。

4 应用场景

4.1 平台部署及性能情况

智能问询语音平台目前已在中国铁道科学研究院集团有限公司等多个铁路企业机构使用。结合铁路网络环境及网络安全[8],铁路企业智能问询平台项目的部署方案,如图5所示。

图5 平台部署架构

该部署方案全部服务器集中部署在铁路各企业数据中心,前端交互应用服务器放置在铁路网络隔离区(DMZ,Demilitarized Zone),将核心引擎及管理后台服务器放置在铁路数据通信网络(DCN,Data Communication Network)区,对前端交互应用服务器开通基于TCP协议的公网访问权限,以保证对APP、Web渠道服务器的正常访问。

前端用户通过3G/4G网络或有线接入方式,经过常规的F5硬件负载均衡服务器后,访问前端业务通信服务器,参照100/S并发访问量计算,搭配前端业务通信服务器,同时配备核心引擎服务器。前端业务通信服务器可访问数据库环境,数据库服务器利旧,安装于各企业数据中心现有存储环境中。另外,配备管理后台服务器(本项目集成部署在前端交互应用服务器中)。管理后台服务器与前端业务通信服务器、数据库、核心引擎服务器之间进行通信控制。数据库与核心引擎服务器之间不产生通信关系。

本智能问询平台针对数据高效检索及分析能力进行测试,平台在并发性、实时查询能力、可靠性等满足日常业务需求。实际使用过程有着良好的效率,2 000用户级的高并行处理能力,秒级的查询返回速度,7x24 h的可靠服务,支撑问询智能化辅助。

4.2 平台应用场景

针对企业制度中的一个知识点,用户通过不同的问法提问,平台识别用户的真实意图。用户输入的问题中主语、宾语、谓语缺失一项等情况下,平台通过自然语言技术中的句法依存分析发现缺失关键信息,则根据上轮交互的信息对本轮交互进行实体补全,再给出正确答案。当用户咨询某个问题,并且该问题有一个或多个必要条件是关键信息时,如果用户在输入的过程中缺失必要条件,平台通过特征提取技术不能获得关键的信息,就会通过反问机制与用户再次交互,获取必要条件,直到所有必要条都满足的情况下,才会给出正确答案。

平台在识别用户意图时,可通过对用户话术的分析,进行知识展现,包括针对性的图文营销内容、问题答案、所需操作快捷链接、建议问列表等。用户的输入中含有多个关键词,识别并理解句子的真实意图。平台在识别用户真实意图时,需要依赖自然语言中的特征(关键字)来识别,通过机器学习的算法,支持无特征识别用户意图。当无法确定具体用户问题时会自动给出建议问,引导用户锁定问题,进而锁定答案。

5 结束语

本文讨论了智能语音语义在铁路企业智能问询平台的实现逻辑。人工智能技术为企业的客户及内部管理提供便捷、准确和高质量的服务,拓展服务渠道。铁路企业智能问询平台的研究与使用,提高了员工工作效率,增强企业效能,提高客户满意度。未来,将持续推进铁路企业智能问询平台在企业管理服务上的深度应用。

猜你喜欢
识别
科技文档中数学表达式的结构分析与识别
园林树木学教学现存问题的探讨
玉米常见病虫害的识别与防治
上市公司会计舞弊识别及防范
微表情识破谎言的发展与应用
法学意义上的弱者识别问题研究
上市公司会计舞弊的识别与治理
青岛市中山公园园林树木易混淆品种识别
论犯罪危险人格的识别