艾 勇
(中南民族大学 计算机科学学院,武汉 430074)
呼叫中心又称为客户服务中心,它是一种基于CTI(Computer Telephone Integration)技术、充分利用通信网和计算机网的多项功能集成,并与企业连为一体的一个完整的综合信息服务系统[1].呼叫中心可以用电话自动查询方式代替传统的柜台业务,能够每天24小时不间断地随时提供服务,用户只要通过电话就能迅速获得信息,解决问题方便、快捷,增加用户对企业服务的满意度.
借助呼叫中心,用户可以按照呼叫中心的语音提示接入数据库,获得所需的信息服务,解决部分用户的疑问.尽管如此,通过呼叫中心的自动服务还无法完成用户的所有业务,很多业务还需要人工来完成,因此呼叫中心还是需要安排话务员来接听用户的电话并解决用户的疑问.现在,很多呼叫中心的话务员都达到数千人,若使用传统的经验式排班模式,不但会使工作量加大,而且会增加话务预测的偏差,无法满足实际生产需要.
话务量数据是呼叫中心坐席数安排的前提,呼叫中心可以针对不同的话务量安排对应的坐席,使得在满足呼叫中心的服务水平的前提条件下,实现呼叫中心人力资源的最优配置.因此,如何能准确预测呼叫中心话务量是一个重要且亟待解决的难题.
话务量预测是基于对历史记录数据挖掘分析后建立的概率统计模型,通过对数据多维度的挖掘分析,抽取其中蕴含的多种影响因素和其特有的变化规律,建立准确的话务量预测模型.目前,计算或预测话务量常采用时间序列预测方法[2],将话务量的历史数据看成时间序列,利用加权平均数对时间序列进行平滑修匀,再利用数理统计方法进行回归处理,拟合数学模型,根据数学模型预测未来的话务量[3].
本文首先采用基于时间序列的指数平滑预测方法对于电力呼叫中心的话务量进行预测,根据话务量预测准确率,分析话务量预测不准确的原因,修正话务量预测模型,提出适合电力呼叫中心的话务量预测框架,并通过对比实验结果的分析得到不同时期话务量的特征.
指数平滑法是Robert G..Brown在1959年提出的,该方法认为时间序列的态势具有稳定性或规则性,所以时间序列可被合理地顺势推延;该方法认为最近的过去态势,在某种程度上会持续到未来,所以最近的数据拥有较大的权重[4].
指数平滑方法是根据历史资料的上期实际数和预测值,用指数加权的办法进行预测.该方法的优点是只要有上期实际数和上期预测值,就可计算下期的预测值.它既不需要存贮很多历史数据,又考虑了各期数据的重要性,且使用了全部历史资料.
指数平滑方法,根据平滑次数不同,有一次指数平滑法、二次指数平滑法和三次指数平滑法等.
1) 当时间数列无明显的趋势变化,可用一次指数平滑预测;
2) 当时间序列的变动出现直线趋势时,需要进行二次指数平滑;
3) 当时间序列的变动表现为二次曲线时,需要进行三次指数平滑.
呼叫中心的话务量具有周期性的特点,即每天各个时间段的话务量具有相似性,因此话务量预测应该分时段进行.考虑到各个时间段的话务量没有呈现直线变化或二次曲线变化的趋势,因此话务量预测采用了一次指数平滑法.
一次指数平滑模型预测法是预测方法中的一种,它是由移动平均法模型发展而来的,其预测值的计算公式为:
Yt+1=αXt+(1-α)Yt,
(1)
Yt+1=Yt+α(Xt-Yt).
(2)
由公式(2)可知它提供的预测值是前一期预测值加上前期预测值中产生的误差修正值.在上式中,Yt和Yt+1为时刻t和t+1的预测值,Xt为时刻t的原始真实值,α为加权系数(阻尼系数),0<α<1.
从公式(1)可以推出:
Yt+1=αXt+α(1-α)Xt-1+α(1-α)t-1X1.
(3)
由(3)式可知,加权系数分别为α,α(1-α),α(1-α)2……是按几何级数衰减,越近的数据权数越大,越远的数据权数越小,也就是说,近期历史影响较大,远期历史影响相对较小.
本文采用某市95598呼叫中心2005年至2006年的话务量进行测试,测试的目的在于测试指数平滑预测方法的准确性.实验中对于每个时间段采用多个阻尼系数模拟,在本实验中,预测值和真实值误差在20%内视为预测结果正确,根据前6天各个时段的话务量预测第7天的各时段话务量,以6月9日为例,阻尼系数0.2、0.4、0.6和0.8的预测结果如表1.
表1 不同阻尼系数下的预测值
根据以上计算方式,可以得到6月9日至6月12日的预测准确率如表2.
表2 不同阻尼系数下的预测准确率
从表2可以看出,即使考虑20%以内误差视为预测准确,各实验结果的预测准确率也较低,无法达到实际工作的要求.为了提高预测准确率,需要根据具体的情况对实验参数修正,提出适合于电力呼叫中心的话务量预测模型.
在指定话务量预测模型之前,需要对电力呼叫中心的话务量特征进行分析,定位影响话务量的关键因素.
电力呼叫中心主要承担了网上业务办理,信息咨询、故障报修、投诉等服务,在这些业务中,对话务量有不确定性影响的主要是停电信息咨询、故障报修等,而这些业务影响的原因受多方面影响.
1) 天气:在恶劣天气(如暴雨、狂风等)下,电线容易被树枝等物体压断,造成区域性断电;
2) 季节:我国水力发电是电力的一个重要来源,每年的7月至9月是迎峰度夏期,12月至2月是枯水期,这两个周期性的季节变化会对水力发电产生影响,造成供电不足;
3) 节假日:节假日(春节、元旦、周末等)对于用电量的需求和工作日不一样,节假日的停电或故障会导致话务量激增;
4) 供电量:电力局每天对各区域供电量会对话务量产生影响,城市区域计划停电会明显比农村区域的计划停电产生更多的咨询电话;
考虑到以上因素对话务量的影响,为提高话务量预测准确率,达到实际生产的需要,本文对话务量预测模型进行修正,提出修正后的话务量预测模型如图1.
图1 修正后的话务量预测模型
本模型通过对历史数据(包括历史话务量,天气信息,停电信息等)进行整理,并根据实时的天气信息、停电信息对话务量进行预测,并将预测值和真实结果进行比较,从而修正预测模型[5],通过对历史数据的训练,得到符合于特定地区话务量特点的预测模型,为话务员排班提供科学依据.
本文根据提出的话务量预测模型,对不同时期的话务量进行预测,根据历史数据,采用正常时期的话务量数据作为训练集,分别预测正常时期、枯水期和迎峰度夏期的话务量.
本实验采用2006年3月1日至31日话务量作为训练集,来预测2006年4月1日至30日话务量,预测结果如图2所示,其准确率达到了63.33%.
图2 预测正常时期结果示意图
考虑到周末对预测值的影响,本实验去除周末,仅计算工作日的预测结果,采用2006年3月1日至31日的工作日话务量作为训练集,来预测2006年4月1日至30日的工作日话务量,预测结果如图3所示,其准确率达到了90%.
图3 预测正常时期工作日结果示意图
从以上实验结果的对比实验可知周末话务量对预测结果存在影响,根据工作日预测工作日的准确率较高,能够达到日常工作的要求.
迎峰度夏期话务量激增,通过正常时期工作日的训练集来预测迎峰度夏期,准确率较低,需要采用迎峰度夏期的日常数据作为训练集来预测.采用2005年8月1日至31日的工作日话务量作为训练集,来训练2005年9月1日至30日的工作日话务量,预测结果如图4所示,准确率达到72.23%.
图4 预测迎峰度夏期工作日结果示意图
通过以上两个实验的对比分析,我们可以知道,迎峰度夏期的话务量和正常时期的话务量特征存在不同,应该可以采用不同的预测方法.
本实验采用2005年11月1日至30日的工作日话务量作为训练集,来训练2005年12月1日至31日的工作日话务量,预测结果如图5所示.
图5 预测枯水期工作日结果示意图
从本实验结果来看,通过正常时期的话务量来预测枯水期的话务量,其准确率达到了81.82%,主要原因在于枯水期为冬季,用电量不如迎峰度夏期,因此话务量和正常时期工作量差不多.
为对比实验,本实验采用2006年2月1日至28日的工作日话务量作为训练集,来训练2006年3月1日至31日的工作日话务量,预测结果如图6所示,准确率为78.26%.
图6 枯水期预测正常时期工作日结果示意图
通过以上两个实验对比可知,枯水期和正常时期工作日的话务量不存在明显区别,可以互相用作训练集来预测话务量.
本文的实验主要用来验证指数平滑预测算法在电力呼叫中心应用的可行性,通过以上3组对比实验可以得到以下结论.
1) 工作日和周末的话务量存在明显区别,无法互相作为训练集来预测话务量;
2) 正常时期和迎峰度夏期的话务量存在明显区别,在预测时无法互相作为训练集;
3) 正常时期和枯水期的话务量没有明显区别,可以互相作为训练集来预测.
话务量数据是呼叫中心坐席数安排的前提,目前,计算或预测话务量常采用时间序列预测方法,本文首先采用基于时间序列的指数平滑预测方法对于电力呼叫中心的话务量进行预测,根据话务量预测准确率,分析影响话务量的因素,修正了话务量预测模型,提出适合电力呼叫中心的话务量预测框架,并通过对比实验结果的分析得到不同时期话务量的特征.
[1]Zazzera A C.Integrated voice and business transaction reporting for telephone call centers [P].USA: 005511117A, 1996-04-23.
[2]Chatfield C.Time-series forecasting[M].Boca Raton:CRC Press,2001:12-25.
[3]牟 颖,王俊峰,谢传柳,等.大型呼叫中心话务量预测[J].计算机工程与设计,2010(21):4686-4689.
[4]Brown G.Statistical forecasting for inventory control [M].New York: McGraw-Hill, 1959:2-15.
[5]安立奎,钱伟懿,韩丽艳.集群系统中基于MPI的关联规则挖掘算法[J].三峡大学学报:自然科学版,2010(1):95-97.