基于多源数据汇集和决策树的满意度提升技术

2023-09-14 14:20刘敏张晓川杨旭
现代信息科技 2023年13期
关键词:决策树

刘敏 张晓川 杨旭

摘  要:在IT服务过程中,普遍存在满意度数据采集单一、满意度分析不全面、满意度预测机制简单,以及缺少满意度智能纠错机制等问题,为此设计一种基于多源数据汇集和决策树的满意度提升技术,利用满意度决策树模型,对多IT系统和多渠道来源的满意度数据进行了归一化处理和融合。提出满意度智能计算模型,为满意度管理、预警、智能微调及自动纠错提供计算基础。引入剪枝优化的记忆化搜索算法,对满意度数据进行智能纠错。通过建立分层次、多角度、全方位的满意度管理模式,有效提升IT系统服务满意度,具有广泛的应用前景。

关键词:多源数据汇集;剪枝优化;智能纠错;内部满意度;决策树

中图分类号:TP39    文献标识码:A  文章编号:2096-4706(2023)13-0126-06

Satisfaction Improvement Technology Based on Multi-source Data Collection and Decision Tree

LIU Min, ZHANG Xiaochuan, YANG Xu

(China Mobile Communications Group Guangdong Co., Ltd., Guangzhou  510623, China)

Abstract: In the process of IT services, there are many problems such as single satisfaction data collection, incomplete satisfaction analysis, simple satisfaction prediction mechanism, and lack of intelligent error correction mechanism for satisfaction. Therefore, a satisfaction improvement technology based on multi-source data collection and decision tree is designed. Using satisfaction decision tree model, the satisfaction data from multiple IT systems and multi-channel are normalized and integrated. Propose an intelligent calculation model for satisfaction, providing a computational basis for satisfaction management, early warning, intelligent fine-tuning, and automatic error correction. The memoization search algorithm for pruning optimization is introduced to intelligently correct the satisfaction data. By establishing a hierarchical, multi-angle, and comprehensive satisfaction management mode, IT system service satisfaction can be effectively improved, which has broad application prospects.

Keywords: multi-source data collection; pruning optimization; intelligent error correction; internal satisfaction; decision tree

0  引  言

数字化大潮为业务部门提供了精细运营、改善管理的新手段。而业务部门为了改善部门绩效,吃足数字化红利,抛出了海量且持续快速增长的IT需求。IT部门在巨大的压力下不堪重负,而业务部门对IT需求支撑和系统服务方面,却越来越不满意。因此如何高效精确地进行IT内部服务满意度管理势在必行。

现有主流的满意度管理,都是针对公司某一产品使用的外部用户进行满意度管理,通过电话、问卷等方式,收集外部用户对公司产品的使用满意度数据,生成满意度结果,并对这些外部用户进行关怀。缺少对IT服务面向的公司内部员工的满意度管理,导致公司内部需求响应、IT投訴方面的问题得不到及时解决。

现有主流的满意度管理实现功能比较单一简单,通过录入满意度调查问卷、采集某个IT系统的满意度信息生成满意度结果数据,没有从公司整体角度出发考虑满意度管理,对公司涉及的多个业务系统也没有进行综合考虑和满意度关联管理。满意度数据来源单一,数据不全面,没有进行通盘考虑和关联分析,这些因素都会影响最终的IT内部服务质量。

1  现有IT满意度管理存在的问题

我们在IT服务过程中,面临缺乏有效的内部员工满意度管理,满意度数据采集单一、满意度分析不全面、满意度预测机制简单、缺少满意度微调纠错机制等问题。

1.1  缺乏有效的内部员工满意度管理

现有主流的满意度管理,都是针对公司产品使用的外部用户进行满意度管理,并对这些外部用户进行关怀。缺少对IT服务面向的公司内部员工的满意度管理,致使公司内部需求响应、IT投诉方面的问题得不到及时解决。

1.2  满意度分析不全面

现有技术方案中的满意度原始数据采集来源都比较单一,采集来源来自某个系统或某批次满意度调查数据的录入,没有进行多系统的通盘考虑和满意度关联分析,没有从公司整体角度出发考虑满意度管理。

1.3  满意度预测机制简单

现有技术方案只涉及满意度排名或某一项业务或人员满意度情况,只是简单地进行满意度标准值和满意度权重值进行计算,在满意度预测的精确性和全面性方面,存在较大的改善空间。

1.4  缺少满意度微调纠错机制

现有技术方案输出的满意度结果数据出现误差或纰漏情况,需要人工介入调整,修正难度大而且容易出现差错。

2  满意度提升技术方案

为了解决上述技术问题,在目前主流满意度架构模型的基础上,结合运营商的业务支撑系统、经营分析系统、在线支撑系统、IT工单系统等满意度数据收集处理流程特点,提供了一种基于多源数据汇集和决策树的满意度提升技术,具体为:

1)多源系统的满意度数据获取和融合:针对公司内部IT使用人员,支持从多个IT系统中获取满意度原始数据,并对结构化、半结构化、非结构化等多种满意度数据进行标准化和归一化处理和融合。

2)决策树存储和智能计算:满意度原始数据在标准化、归一化处理后,构造决策树模型和各项满意度指标智能计算方法,输出人员部门、IT服务、时间等多维度系统满意度数据和满意度发展趋势信息,为满意度预警算法和满意度微调算法奠定了存储基础和计算基础。

3)基于决策树模型的满意度预警机制:基于决策树模型,对满意度偏低、满意度大幅度下降的人员部门、IT服务进行实时预警,同时针对多系统和多人员的满意度情况进行通盘考虑和关联分析,从公司整体角度找出不满意本质原因并进行针对性解决。

4)基于记忆化搜索的满意度智能纠错机制:基于剪枝优化后的记忆化搜索算法,进行满意度智能微调和自动纠错,在满意度数据出现偏差时及时准确地修正,保障满意度预警和不满意因素处理的准确性,避免出现IT服务的重大偏差及系统的重大故障。

通过打造了一套完备的IT内部服务满意提升技术,不断提高IT内部服务满意度,让IT系统的使用更符合实际应用和业务要求,减少公司的业务损失,达到降本增效目的。

3  满意度提升技术实现

3.1  多源系统的满意度数据汇集和融合

本系统从多源系统里获取满意度原始数据,包括业务支撑系统、客服系统、经营分析系统、IT工单系统以及满意度数据录入等多个渠道,实时获取需求、投诉、故障等满意度原始数据。获取的数据包括结构化、半结构化、非结构化数据,通过识别、解释、归一化处理后生成标准化满意度原始数据。

多源系统满意度数据的汇集和融合主要流程如图1所示。每个子系统采集过来的满意度原始数据格式不一样,从接口内容协议配置中获取对应的协议解释信息,从中分拣出与满意度相关的时间、员工、渠道、系统、业务、满意度情况等关键信息,通过满意度基础信息标签库、人员信息标签库进行进一步解释处理,将业务类型、员工归属等信息细化和融合,生成满意度标准化原始数据。采集过来的满意度原始数据如无法解释处理,通过人工介入处理后再生成满意度标准化原始数据。

3.2  构建满意度决策树存储模块

满意度记录存储数据为:时间、系统、满意度一级分类、满意度二级分类、满意度三级分类、员工姓名、员工部门、部门归属、是否满意、备注等。存储模块中引入数据管理模块,管理模块主要负责数据清理备份、索引优化等数据管理任务。

满意度决策树存储模块是满意度提升技术的核心,根据归一化、标准化后的满意度原始数据计算各个时间点或时间段内、业务、员工、部门等多个维度的满意度标准分、权重值、权重比和预警值等满意度指标信息,用决策树数据结构进行存储,后续通过智能计算,为满意度分析预警装置生成满意度决策点、满意度热点报表、明细报表、不满意占比图表、满意度趋势图和分级预警等提供数据支撑。

本模块引入满意度标准分、权重值、权重比和预警值四个满意度概念词,并以决策树数据结构进行存储:

1)满意度标准分S:某个员工或部门对某个IT服务小类的满意度归一化和标准化的得分。第i个节点(可为某个员工或某个部门)员工或部门第j个满意度指标(可为满意度一级指标、二级指标或三级指标)在时间k点(可为时间区间或某个时间点)满意度标准分Sijk计算式如下:

N为该节点下不满意人员数,当N为1时表示一人不满意;M为在该时间点的满意度采集量;Pj为第j个满意度指标权重系数;引入对数函数log2N为不满意人数越多不满意度得分越高。

2)满意度权重值W:根据IT服务的重要程度,通过与满意度标准分关联计算出可以衡量某个员工或部门某个IT服务小类的与满意度重要程度相关的满意度得分数值。用满意度权重值可以算出各员工部门或IT服务分类的满意度排名情况。

第i个节点(可为某个员工或某个部门)员工或部门第j个满意度指标(可为满意度一级指标、二级指标或三级指标)在时间k点(可为时间区间或某个时间点)满意度权重值Wijk计算式如下:

Oij为该节点微调系数,初始值为1,人工介入后需增加该节点权重值,可将Oij设置大于1,反之设置为0至1之间。

3)满意度权重比V:根据某个人员或部门某个IT服务小类的满意度权重值,计算出其在某个IT系统、某个IT服务或某个部门的占比情况。

第i个节点(可为某个员工或某个部门)员工或部门第j个满意度指标(可为满意度一级指标、二级指标或三级指标)在时间k点(可为时间区間或某个时间点)满意度权重比Vijk计算式如下:

4)满意度预警值E:通过关联满意度权重值计算得出的某个人员或部门某个IT服务小类的预警评估值,用该数值与事先配置的预警阈值进行比对后进行预警处理。

第i个节点(可为某个员工或某个部门)员工或部门第j个满意度指标(可为满意度一级指标、二级指标或三级指标)在时间k点(可为时间区间或某个时间点)满意度预警值Eijk计算式如下:

其中,N为该节点下不满意人员数。

5)差值增量趋势率Q:计算某个时间段内时间点从1到n的满意度权重值差值增量趋势率计算式如下:

通过提取不同开始时间点到指定结束时间的满意度权重值,经过多次迭代计算可以提高趋势预测数据精准率,差值增量趋势率绝对值越大满意度波动越大,满意度权重值差值增长率为正表示满意度权重值在增加,满意度在下降,满意度权重值差值增长率为负表示满意度权重值在降低,满意度在上升,有正有表示在上下波动。

各个系统上的每一种满意度指标或IT服务类型不同,紧急程度和重要程度都不同,IT服务越敏感、影响程度越大对于满意度的影响程度越大,在不满意投诉量相等的情况下越容易触发预警。因此引入满意度权重系数来计算满意度评分信息,IT服务越重要满意度权重系数越大。

满意度权重系数在满意度指标关键信息模型中进行配置管理。满意度指标关键信息模型主要包括满意度唯一标识、满意度归属的IT系统、IT服务分类、指标级别、权重系数、预警阈值等信息。举例说明如表1所示。

满意度计算评测模块通过构造树形数据结构模型,使用因子分析和聚合聚类分析方法对满意度标准化原始数据分析计算,将员工、IT服务小类设计为两个不同维度的基础因子,以这两个因子的不同组合组成细粒度满意度数据,然后根据员工组织结构和IT服务分类等级梯度自下向上聚合聚类,计算出不同员工组织结构、不同IT服务大小维度的粗粒度满意度数据。

3.3  记忆化搜索算法智能微调和自动纠错

满意度分析预警模块生成满意度告警数据后,IT负责人对这部分数据进行及时分析、核实和处理。IT负责人通过故障处理、流程优化、人员关怀等措施提高了某个IT服务或某个部门员工满意度后,满意度决策树上的某些节点上的满意度标准分、权重值需要进行相应的微调或纠错。

满意度数据的智能微调纠错功能由满意度微调纠错模块实现。满意度决策树上的每个节点每个满意度指标对应一个满意度微调系数,满意度微调系数默认为1。IT负责人可在客户端修改微调系数并输入微调系数生效的开始时间点和结束时间点,这样可对某个员工或部门对某个IT服务在某段时间内的满意度评分数据进行微调。

IT负责人提交满意度微调系数修改后,满意度数据开始重新计算,从满意度决策树上此节点出发到树根路径上所经过的所有节点都需重跑满意度数据。后续触发满意度分析预警装置重新处理更新满意度数据和预警信息。相关节点满意度数据智能微调纠错关键点和流程:

3.3.1  剪枝优化

我们在求树的深度时使用深度搜索算法对不满意数据进行了一次遍历,用于记录搜索结果,在微调纠错模块中复用这个搜索结果,在后面的搜索中进行剪枝优化。如图2所示,比如OA系统的页面出错故障,对本次满意度预警和满意度微调无关,可以直接剪枝。

3.3.2  记忆化搜索

在搜索微调每个节点时,先判断该节点的值是否曾经微调过,如果曾经微调过,直接拿过来使用;如果没有微调过,递归微调,并存储该微调结果。具体步骤如下:

1)创建访问路径堆栈用于存储满意度决策树上的被访问节点,和搜索结果(用于剪枝)。

2)采用深度優先遍历算法(DFS搜索算法)从树根开始遍历满意度决策树,当往下搜索时向堆栈添加被访问节点元素(堆栈的入栈push操作),向上返回时删除最后一个被访问节点元素(堆栈的出栈pop操作),直至搜索到目标节点。如图3所示。

搜索过程中,会进行相应的剪枝处理,提高搜索效率。如图4所示,叶子节点T6为目标调整节点,那么会对T1和T2及他们的分支都进行剪枝处理,提高搜索效率。

3)如果目标节点为叶子节点则返回访问路径堆栈,计算过程中先判断该节点的值是否曾经微调过,仅对没有微调过的节点进行重新计算。如图5所示,叶子节点T6为目标调整节点,返回的访问路径堆栈元素为T0、T2、T6,对这三个节点进行满意度微调。

4)如果目标节点为非叶子节点,为保证能使满意度决策树上的上下节点数据保持一致,该目标节点下的所有节点都应重新计算满意度数据。对于非叶子的目标节点,采用广度优先遍历算法(BFS搜索算法)从目标节点开始继续遍历以此节点为树根节点下的所有节点,每访问的一个节点都依次存放到访问路径堆栈中。

如图6所示,非叶子节点T2为目标调整节点,返回的访问路径堆栈元素为T0、T2、T6、T7,对这四个节点进行满意度微调。

5)根据返回的访问路径堆栈从最后一个元素开始重新按照满意度标准分、权重值、预警值计算公式重新计算并更新该节点的满意度数据,完成满意度智能微调纠错。

4  结  论

基于多源数据汇集和决策树的满意度提升技术,针对公司内部员工对IT服务的不满意进行预警,从公司整体角度考虑进行预警,着眼于精确预警和多系统、多人员的关联预警。

该技术利用满意度决策树模型,对多IT系统和多渠道来源的满意度数据进行了归一化处理和融合,处理效率高,分析和统计满意度方便,是满意度预警算法和满意度微调算法的数据存储基础。引入了剪枝优化的记忆化搜索算法,通过该算法进行满意度数据的智能纠错,在满意度数据出现偏差时及时准确地进行修正,保障满意度预警及不满意因素处理的准确性,大大减少的人工检查和人工修正工作量,节省人力成本。

该技术适用于针对多IT系统的服务满意度管理涉及的系统设计、满意度指标计算、满意度数据智能纠错范畴,立足于公司或部门整体角度考虑的IT系统服务不满意问题解决,从时间、IT服务大小类、部门架构等不同维度的满意度进行监控、本质原因分析和报表输出,可有效提升IT系统服务满意度,具备广泛的使用前景。

参考文献:

[1] 王冠宇.ExtJs框架在社区信息服务系统满意度中的应用研究 [J].网络安全技术与应用,2012(6):36-38.

[2] 张佳钰,寇金桥,刘宁钟.基于滤波器分布拟合的神经网络剪枝算法 [J].计算机技术与发展,2022,32(12):136-141.

[3] 周翔宇,高仲合,赵镥瑶,等.剪枝优化的文本区域检测算法 [J].计算机与数字工程,2022,50(9):2059-2064.

[4] 李屹,魏建国,刘贯伟.模型剪枝算法综述 [J].计算机与现代化,2022(9):51-59.

[5] 王伟,王彬.基于记忆化搜索的RFID防碰撞算法 [J].计算机工程,2017,43(8):132-137+143.

[6] 万朵,胡谋法,肖山竹,等.面向边缘智能计算的异构并行计算平台综述 [J].计算机工程与应用,2023,59(1):15-25.

[7] 聂婕,左子杰,黄磊,等.面向海洋的多模态智能计算:挑战、进展和展望 [J].中国图象图形学报,2022,27(9):2589-2610.

[8] 韓廷锦.基于多源数据融合的智慧公共文化服务体系研究 [J].信息技术与信息化,2022(12):132-135.

[9] 潘建宏,王磊,樊家树,等.一种基于知识图谱技术的多源异构数据融合、共享方法 [J].电子设计工程,2022,30(23):185-188+193.

[10] 钱肖,马翔,吕磊炎,等.基于知识图谱的电网调度告警关联规则与决策树算法 [J].电气传动,2022,52(22):60-65.

作者简介:刘敏(1975—),女,汉族,浙江台州人,工程师,硕士,研究方向:大数据、人工智能等;张晓川(1971—),男,汉族,广东龙川人,正高级工程师,硕士,研究方向:大数据、人工智能等;杨旭(1976—),男,汉族,湖南长沙人,工程师,学士,研究方向:大数据、人工智能等。

收稿日期:2023-02-09

猜你喜欢
决策树
基于决策树和神经网络的高血压病危险因素研究
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
面向分布式数据流大数据分类的多变量决策树
基于改进决策树的故障诊断方法研究
决策树多元分类模型预测森林植被覆盖
基于决策树的出租车乘客出行目的识别
基于决策树的复杂电网多谐波源监管
基于模糊关联规则和决策树的图像自动标注
基于肺癌CT的决策树模型在肺癌诊断中的应用