施滢萍,徐晓敏
(北京信息科技大学 信息管理学院,北京 100192)
近年来,网络购物需求的爆发式增长,使得我国快递业务量从2014年开始,连续5年稳居全球第一。同时,快递服务质量成了本行业进一步发展的关键。从消费者角度对快递服务质量影响因素进行研究,实现对快递服务质量的监测,具有重要意义。
关于服务质量影响因素的研究始于国外,Parasuraman等[1]于1988年提出了SERVQUAL(服务质量)模型。文献[2-3]通过因子分析测试,研究了SERVQUAL模型的适用性。Cronin等[4]认为服务质量取决于消费者对实际服务的满意度,由此提出了SERVPERF(绩效感知服务质量评价)模型,该模型沿用了SERVQUAL模型的指标项。在快递服务行业,文献[5-10]在2个模型基础上,通过导入物流特性,采用问卷调查法和因子分析法等来分析快递服务质量影响因素,并进行了实证研究。在关于快递服务质量影响因素的研究中,多数采用技术手段对客观性影响因素进行规范和检测,对主观性影响因素的分析相对较少。然而,服务质量是客观性与主观性的统一体[11],二者缺一不可。
本文利用在线评论数据,对快递服务质量影响因素加以分析,实现从消费者角度对快递服务质量的主观性影响因素分析,以及利用技术手段实现客观性影响因素检测,从而形成较为全面的快递服务质量影响因素集。以此为媒介来监测消费者对快递服务质量的满意度,为快递企业完善快递服务运作系统提供重要参考依据。
本文主要通过3个步骤进行分析:数据获取→数据处理→数据分析。研究框架如图1所示。
图1 快递服务质量影响因素研究框架
1)数据获取。利用网络采集工具对消费者在线评论数据进行抓取,作为快递服务质量影响因素研究的数据源。
2)数据处理。对抓取到的数据进行清洗,对高频特征词进行统计,并构建语义网络图,进一步分析快递服务质量影响因素,生成影响因素集。
3)数据分析。借助情感分析法获取消费者对影响因素的满意值,以此为样本数据,对影响因素集进行关联性分析,将影响因素分类,确定权重,进行影响程度分析。
本文利用八爪鱼数据采集器抓取某网店2017年5月至2017年12月某双肩包销售的消费者在线评论数据2300条。
2.2.1 数据清洗
将获取的文本数据导入SQL Server数据库中,编写SQL语句删除重复数据和缺失数据。数据重复有两种情况,一是关键字段(用户名、评论正文、商品类型、时间)完全重复;二是部分关键字段重复,如只有用户名、商品类型、时间字段重复,但评论正文不重复,则将这类重复数据忽略,无需删除。利用SQL语句将完全重复数据删除。查询关键字段“评论正文”是否有缺失值,删除该字段存在缺失值的整条数据记录。
2.2.2 高频特征词统计
将清洗后的在线评论数据表中的评论正文内容保存为txt文件,然后导入ROST Content Mining6软件。文件格式为一行一句的未分词文本文件。选择功能“提取高频词-过滤无意义词”,得到过滤后的有效词表,在过滤词表中手动添加一些跟研究主题无关的词,增加有效词表的过滤意义。选择功能“TF/IDF批量词频分析”,得到大量特征词以及特征词的TF-IDF值,结合过滤后的有效词表,选取TF-IDF值较高且与研究内容关联度较高的60个高频词形成高频特征词表,如表1所示。
2.2.3 语义网络分析
通过语义网络图能描绘消费者对快递服务质量的实际感知情况,直观清晰地呈现各个高频词之间的相互关联性。网络图中,每个结点表示一个高频词,两个结点之间的信息关联通过一条带标记的有向直线相连。运用ROST CM软件,将提取的高频词进行语义网络分析,基于未分词文本和过滤后的有效词表,生成行特征词表,启动ROST CM包含的NetDraw功能,根据高频特征词表1,剔除无意义的词,生成图2所示的高频特征词语义网络。从图中可看出,“物流”、“质量”、“很快”、“快递”、“收到”在图的中心位置,表明这些是消费者关注较高的服务质量影响因素。如,有向直线“快递”指向“很快”,根据对词意的分析,以及结合在线评论原文,所包含的信息可表示为:消费者的快递能在承诺时间内送达、快递员有及时上门送件、节假日延迟发货时间短、快递所需要的派送周期短等快递服务质量影响因素。
2.2.4 生成影响因素集
通过语义网络图中高频特征词之间的关联性来分析可能存在的快递服务质量影响因素,结合在线评论原文的描述,目前快递行业关于快递服务质量的普遍问题,以及前人关于快递服务质量影响因素的相关研究,基于SERVPERF模型理论归纳整理得到如表2所示的快递服务质量影响因素集。
表1 高频特征词表
图2 高频特征词语义网络
表2 快递服务质量影响因素集
2.3.1 关联性分析
1)数据来源。本文采用探索性因子分析法对快递服务质量影响因素集进行关联性分析。关于分析所需数据,大部分学者采用网上问卷调查法获取,按具体影响因素项设计相应问题,对影响因素的满意程度按“非常满意”、“满意”、“一般满意”、“不满意”、“非常不满意”进行打分,采用李克特五点量表法(5级Likert法)[12],具体量化赋值分别为5分、4分、3分、2分、1分,每个题目设置5个选项。问卷调查的方式数据来源过于片面,缺乏主观性以及对快递服务质量的实际感知。本文借助情感分析法,提取在线评论数据中关于快递服务质量的特征信息和情感信息,赋予具体数值来得到消费者对各项快递服务质量影响因素的满意度,以此作为因子分析的样本数据。从消费者对快递服务质量的实际感知出发,保证了数据来源的真实性和有用性。
2)探索性因子分析。利用SPSS22.0对影响因素集进行探索性因子分析,对影响因素集进行分类。探索性因子分析法是一种能找出多元观测变量本质结构的有效方法。它通过分析变量间的依存关系,将关系复杂的变量综合为少数几个核心因子,来反应全部变量传递的主要信息。基本模型如图3所示,每个观测变量在一个假设因子上的负荷不能为零,X1、X2、X3是假设因子ξ1下属的观测变量,X4、X5是假设因子ξ2下属的观测变量。往下推理,即各观测变量与公共因子间的关系为:
X1=λ11ξ1+λ12ξ2+...+λ1 mξm+d1…
(1)
Xk=λk1ξ1+λk2ξ2+...+λkmξm+dk…
(2)
式中:Xi为各观测变量;ξm为公共因子。
图3 探索性因子分析模型
在进行探索性因子分析前,首先要对因子分析的条件进行检验,判断原有变量间是否存在相关关系。本文选用KMO检验和Bartlett球形检验方法来对因子分析的条件进行检验。KMO检验值在0和1之间,值越接近1,变量间的关联性越强,原有变量越适合作因子分析。Bartlett球形检验用于检验各变量是否独立,若Bartlett检验的显著性概率小于用户中心的显著性水平0.05,那么拒绝零假设,说明变量间有公因子,适合做因子分析;反之则不适合。本文借助SPSS22.0软件进行检验,得到KMO检验值为0.704,大于0.5,适合进行因子分析。Bartlett球形检验,近似卡方值为341.154,显著性概率为0.000,小于显著性水平0.05,适合作因子分析。利用主成分分析法,以特征值大于1作为提取规则,按照最大方差法进行旋转,通过25次最大收敛性迭代后,获得5项主成分因子,其特征值分别为3.943、2.102、1.984、1.897、1.073,方差贡献率分别为38.868%、22.041%、19.684%、13.943%、1.461%,5个主成分因子解释了原有变量总方差的95.997%,原有变量的信息几乎没有丢失,保留度极高。
3)影响因素分类。根据因子分析结果,将快递服务质量影响因素集归为5个维度(主成分因子),即有形性、响应性、可靠性、保障性、移情性。各影响因素与维度之间的所属关系通过每一项影响因素在主成分因子上的因子载荷量来选取,因子载荷量则通过主成分分析法进行旋转操作得到。选择在主成分因子上呈现较高的因子载荷量来归类各维度包含的影响因素,维度和影响因素之间所属关系为:
响应性包括:A1:快递员及时上门取(送)件;A2:节假日延迟发货时间短;A3:订单派送状态的反馈及时性;A4:所需派送周期短。
可靠性包括:B1:能在承诺时间内完成快递服务;B2:配送地点的准确性;B3:快件包装完整性;B4:快件无丢失现象;B5:顾客取件时间合理;B6企业信誉良好。
保障性包括:C1:快递服务价格标准合理;C2:快递员操作规范性;C3:顾客个人信息保护性;C4:合理赔偿快件损坏费用。
移情性包括:D1:派送突发情况处理;D2:快递人员服务态度;D3:顾客投诉处理及时性;D4:可提供个性化服务;D5:根据顾客需求调整配送时间。
有形性包括:E1:快递企业具有先进高效的设备;E2:业务覆盖广,目的地基本无限制;E3:服务单据信息清晰明确;E4:快递人员着装整洁。
2.3.2 影响程度分析
常用的权重确定方法有专家打分法、因子分析法、层次分析法、回归分析法等,这些方法都是利用技术手段来实现,客观性较强,较少使用实际样本数据来确定权重。本文在样本数据的基础上,根据各主成分因子(维度)对所有影响因素的方差贡献率来确定维度权重,5个主成分因子的累计贡献率为95.997%。对方差贡献率进行归一化(各维度的方差贡献率与方差累计贡献率的比值)处理[13],得到维度权重归一化表如表3所示,影响因素与维度间的主体结构跟SERVPERF模型量表相似。从表中可知,响应性在总体权重中占比最大,达到40.49%,但没有超过50%,说明在消费者看来,其他影响因素权重也有一定的重要性,将维度对服务质量的影响程度依次排序为:响应性>可靠性>保障性>移情性>有形性。
表3 快递服务质量影响因素维度权重分布
本文利用SPSS22.0对确立的快递服务质量影响因素集进行可靠性(信度)分析,用维度的Cronbach’s Alpha系数来检验信度,得到各个维度的Alpha系数均大于0.7,整体Alpha系数为0.986,如表4所示。由此可认为影响因素集有很高的信度,具有较好的内部一致性。
表4 评价指标信度检验
影响因素集效度检验主要通过因子分析中的KMO值和Bartlett 球形检验的显著性水平来判断。KMO系数为0.704,大于0.5,在可接受范围内。Bartlett 球形度检验的显著性概率为0.000,达到显著性水平。因此,可认为影响因素集有较高的效度。
本文选取购物平台下消费者的在线评论作为分析快递服务质量影响因素的数据源,既体现了数据来源的真实性,又弥补了其他学者对快递服务质量影响因素研究中缺失的主观性影响因素,实现了服务质量主观性和客观性影响因素的统一。通过对在线评论数据的分析,从构建的语义网络图中,可以清晰地看出消费者对哪些影响因素关注度较高,为形成快递服务质量影响因素集提供了重要参考依据。将利用情感分析法得到消费者对快递服务质量影响因素的满意值,作为关联性分析的样本数据,分析结果对原有变量的保留度极高,说明设计的影响因素在整个快递服务过程中参与度较高。对分类后的影响因素集进行信度检验,检验结果较好,说明利用在线评论数据构建的快递服务质量影响因素集有一定的严谨性和合理性。通过各维度的权重可知,维度对服务质量的影响程度,后续的研究可考虑具体影响因素的权重,进一步分析影响因素对整体快递服务质量的影响程度,为快递服务质量评价研究提供重要依据。