奉国和 杨 洋 冯 霞
(1.华南师范大学经济与管理学院信息管理系,广州,510006; 2.中国民航大学中国民航信息技术科研基地,天津,300300)
我国客户价值研究文献的可视化分析
奉国和1杨 洋1冯 霞2
(1.华南师范大学经济与管理学院信息管理系,广州,510006; 2.中国民航大学中国民航信息技术科研基地,天津,300300)
客户价值是近年来客户关系管理研究的一个热点以及难点。利用工具SATI3.2,基于CNKI数据库对国内客户价值研究文献进行共词分析,并借助聚类分析和因子分析,研究关键词之间的关系,绘制该领域结构的整体可视化图,并探讨国内客户价值领域的研究现状与热点。
客户价值 共词分析 聚类分析 因子分析 可视化分析
客户价值分析是近年来客户关系管理研究的一个热点以及难点,它对企业战略决策及营销方案的制定有着重大意义。从研究的角度来讲,客户价值的研究已经融入其他相关领域的研究成果,包括经济学、统计学、计算机科学等学科的理论和方法,具有一定的前瞻性和可操作性;同时客户价值研究的成果已经被应用在相关领域中,并经过实践检验,证明了研究成果的重大意义,但仍存在一些问题,这也正是继续开展研究的必要性。
为了深入了解和揭示国内对客户价值及其相关问题研究的发展变化,本文利用文献题录信息统计分析工具软件SATI 3.2对国内客户价值相关文献中的高频关键词进行词频统计和共现分析,能够客观地反映出客户价值领域在国内的研究结构、热点、发展动态以及趋势,以期能对相关领域的研究提供参考。
2.1 数据来源
2.2 研究工具
共词分析一般采用自编的软件进行分析,如CnkiRef[1]、Bicomb[2]、SATI[3]等。而构建知识图谱目前使用的软件有: Pajek、Netdraw、HistCite、VOS等[4]。SATI是一款利用C#编程技术基于.NET平台开发出来的文献题录信息分析工具软件,由浙江大学信息资源管理系的刘启元和叶鹰教授共同开发[3],目前最新版本是SATI 3.2。本文利用SATI 3.2工具进行词条频次的统计和相关矩阵的生成,利用社会网络分析软件UCINET 6以及统计分析软件SPSS 20.0完成知识图谱可视化呈现。
2.3 研究方法
关键词是指那些出现在文献的篇名、摘要或正文中,对表征文献主题内容有实际意义的语词,亦即对揭示和描述文献主题内容来说是最重要的并可作为检索入口的那些语词,是论文主要内容的概括[5]。通过关键词,读者可以快速了解整篇文章的主题和研究重点[6]。因此,统计分析关键词出现的频率,并对其进行聚类,可以了解某个学科在特定阶段的研究重点和热点[7]。
词频分析法的核心思想是根据学术论文中的关键词或主题词在某一研究领域中出现的频次高低来确定研究热点和发展动向的一种方法[8]。而共词分析法则是指针对能够表达某一学科领域研究主题或研究方向的关键词属于共同出现在同一篇文献中的现象,分别统计两个关键词在同一篇文章中出现的次数,根据统计结果对关键词进行聚类分析,反应出这些关键词之间的亲疏远近关系,从而分析研究结构的变化[9]。 关键词能够反应某一学科的研究热点和方向,同时又避免了因该学科作品分散,被引情况不稳定所造成的无法了解学科研究热点的情况[10]。
2.4 分析步骤
以共词为基础进行可视化分析大致可以分为四个步骤,实际操作中有些步骤可以合并或重复使用:第一,确定客户价值研究领域的高频词,本文选定高频关键词作为研究依据,其高低反映了客户价值领域研究的关注度和集中程度的高低;第二,根据确定的高频词,构建共词矩阵;第三,利用SPSS软件分别进行因子分析、聚类分析、多维尺度分析,揭示共词矩阵中的信息;第四,对共词分析的结果进行阐释[11]。
3.1 词频分析
利用SATI3.2对已获得的文献题录信息中的关键词字段进行统计,因为在共词分析中高频关键词最能代表文献所在的主题领域,所以对高频关键词进行统计是统计过程中的重点。本文选取累计频次不小于10的关键词为高频关键词,最后得到高频关键词48个(见表1),这些关键词较大程度代表客户价值研究领域的研究热点。
3.2 建立共词矩阵并标准化
利用SATI3.2统计出48个高频关键词在870篇论文中两两出现的频次,生成48×48的共词矩阵。为真正揭示关键词之间的共现关系,我们利用Equivalence系数把原始矩阵转换成相异矩阵(见表2),来消除原始共词矩阵绝对值差异的影响。相异矩阵中的数值越接近1,表明两个词之间的关系越疏远。
3.3 多元统计分析
因子分析、聚类分析、多维尺度分析是共词分析法的核心内容。利用统计分析软件SPSS20.0进行因子分析、聚类分析,同时利用社会网络分析软件UCINET6进行整体可视化。
3.3.1 因子分析
利用SPSS20.0使用主成分方法进行因子分析,取13个因子时(如图1中自上而下第二条线所示),累计方差贡献率为91.667%;取3个因子时(如图1中自上而下第一条线所示),累计方差贡献率超过80%,图1为因子分析碎石图。
表1 客户价值研究领域高频关键词表
表2 Equivalence系数相异矩阵(部分)
3.3.2 聚类分析
聚类分析就是将关联密切的主题聚集在一起形成类团(研究领域)的过程[3],用于揭示客户价值研究领域的研究主题。本文采用最常见的系统聚类法对48个关键词进行分类(见图2)。
根据图中聚类的结果,可以得出在客户价值研究领域中,主要的研究热点可以分为三类:第一类,客户价值的界定研究,主要是对客户价值基本定义及研究范畴所做出的区分;第二类,客户价值研究的对象及其目标,主要包括了客户关系管理、创造客户价值、评价等内容;第三类,客户价值评价的方法以及应用研究,主要包括了数据挖掘、层次分析法、粗糙集、聚类分析等方法和商业银行、移动通讯等应用领域的研究。
图1 因子个数碎石图
图2 客户价值研究领域关键词聚类树形图
3.3.3 多维尺度分析
多维尺度分析(MultidimensionalScaling,MDS)又称ALSCALE(AlternativeLeast-squareScaling),也称为多维量表分析,通过测定主题词之间的距离来发现主题结构[18]。与聚类分析相似,其基本思想都是降维,在较低的维度下展示原数据之间的关系,但是与聚类分析相比,它能够更加直观地判断出某研究领域在学科内的位置[12]。将之前所得到的相异矩阵导入SPSS20.0中进行多维尺度分析,得到图3所示的多维尺度图谱,具体分析详见本文“3.3.6结果分析”部分。
3.3.4 核心-边缘结构分析
核心-边缘结构分析是根据网络中的节点之间联系的紧密程度,将网络中的节点分为两个区域,核心区域和边缘区域。处于核心区域的节点在网络中有比较重要的地位。核心-边缘(core-periphery)结构分析的目的是研究社会网络中哪些节点处于核心地位,哪些节点处于边缘地位。目前核心-边缘结构在文献计量学研究中已被用于合著网络中核心作者的确定[13]、互引网络中核心期刊的确定[14-15]、国际科技合作中各个国家相对位置的变化[16]等领域。在此笔者通过对共词矩阵的核心-边缘结构进行分析,确定客户价值研究领域中处于核心区域的关键词。
在UCINET中进行核心-边缘分析的菜单路径为Network>Core/Periphery>Categorical。根据实际意义,选择出现频次排在前100的关键词进行核心-边缘结构分析,分析结果为:客户价值、客户关系管理、客户细分、数据挖掘等35个关键词处于核心区域(见表 4)。
笔者根据社会网络分析中的核心—边缘结构理论,与48个高频关键词进行比较分析后发现,处于核心区域的35个关键词中有7个并非高频关键词(包括:电信企业、客户忠诚、客户经理、市场竞争、客户资源、差异化、潜在价值),说明这7个关键词虽然与其他关键词相比出现次数较少,但是在客户价值研究中却处于较为重要的地位。
3.3.5 整体可视化
为了进一步探讨客户价值研究结构(核心与边缘),本文利用Ucinet6绘制出客户价值高频关键词的整体可视化图,同时结合因子分析、聚类分析、多维尺度分析对客户价值的研究进行分析。整体可视化结果为图4。
图3 客户价值研究领域高频关键词多维尺度图谱
表4 核心-边缘结构分析后处于核心区域的关键词表
图4 国内客户价值研究领域高频关键词共现网络知识图谱
3.3.6 结果分析
如图4,在社会网络分析中,将关键词视为节点(actor),节点位置越居中越核心,关键词之间的共现关系被视为节点间的连线(tie),连线越粗关系越强[3]。结合图1,取3个因子时,可以概括该领域80%以上的信息,因此,图2中分为3类时相对合理。因此,笔者认为客户价值领域应该包括3个研究领域。结合图3和图4大致有以下3个研究领域。具体分析如下:
(1)客户价值的界定研究。客户是客户机制研究对象的主体,指在相关产品类目中购买本企业产品的组织和个人[17]。而对客户价值定义存在这三种观点:第一,“企业-客户”价值,认为客户价值就是客户方从企业所提供的产品和服务中所感知到的价值;第二,“客户-企业”价值,认为客户价值是客户为企业带来的价值;第三,“交换价值”,从企业和客户的关系出发,强调双方之间交换的过程。 虽然对客户价值的研究角度不同, 所得到的结论也有所不同,但客户价值最大化都是这些观点最终的落脚点(如图 2中所示)。
(2)客户价值研究的对象以及目标。该部分研究往往与客户价值的界定密不可分。由于客户关系管理的核心思想是“以客户为中心”,但并不是强调以所有客户为中心[18],并不是为所有客户提供完全相同的服务。因此,客户价值的研究也是客户关系管理研究中的一个重要的部分。如图4中所示,客户关系管理在整个客户价值研究中处于相对重要的地位。同时,正如在前一部分所述的是三种不同角度对客户价值不同的定义,不管是从何种角度出发,都要考虑到企业价值的存在,企业价值的存在是我们研究客户价值的基石,也是创造客户价值的起点。而创造客户价值是我们研究客户价值的目标之一。要想更好地实现这个目标、实现客户价值,也就需要我们对客户进行评价,从而甄别出价值较大的客户。
(3)客户价值评价的方法以及应用研究。客户价值评价的方法以及应用研究是客户价值研究领域中的一个重点以及难点。从图2中可以看出在客户价值研究领域中,客户细分、客户分类是客户价值评价中的重要组成部分。客户价值评价的方法种类较多,其中数据挖掘评价分析法又是客户价值研究领域研究的重点和热点。数据挖掘评价分析法是将数据挖掘的技术运用于客户价值的细分与评价中,通过客观指数反映客户价值的大小,对企业的营销策略的制定有着十分重要的意义。根据图2、图3和图4可以看出在数据挖掘评价分析方法中有以下热点:
·决策树,即利用树的结构将数据记录进行分类。演克武等[19]将ID3算法运用在航空市场客户价值细分中,利用决策树对旅客的特征数据进行分析。邹鹏等人将ID3算法与代价敏感性学习机制结合运用在客户价值细分中,取得了比较理想的结果[20]。
·粗糙集。该理论可以减少存储空间的压力,有利于数据的分析处理,对于海量数据的处理十分有利。李俊飞[21]建立了粗糙集和支持向量机的电力客户价值模型,刘东升等也建立了基于粗糙集和支持向量机的客户价值分类体系[22]。梁娜等[23]建立了粗糙集与CPN神经网络相结合的客户价值预测模型。陈亮[24]建立了基于粗糙集-神经网络技术的客户价值分类体系。
·聚类分析是对数据对象集合进行分析,根据对象之间的相似度(或相异度)将数据对象划分成多个类,使同一类中的对象之间具有较高的相似度,不同类中的对象相异度较大。聚类方法大致可以分为系统聚类和客观聚类两类方法,针对应用在客户价值研究领域中,文献调查发现K-均值聚类方法运用最多。如赵晓煜采用K均值算法对老客户进行聚类[25]。文献[26,27]用K-均值的方法构造了客户细分的模型。曾鸣等在电力客户价值评估中运用了K-均值方法实现了聚类分析[28]。曹国等[29]、彭艳艳[30]将其运用在商业银行客户价值评价中。
除了上述客户价值评价方法之外,客户价值理论的应用研究也是热点之一,尤其是客户价值理论在电子商务行业、电信业的应用。学者们通过对各个行业实际调查,结合客户价值理论,运用客户价值评价方法,构建了客户价值评价体系,在实践中取得了较为良好的效果。齐佳音等[31]在净现值评价体系的基础上加入销售量与客户发展潜力两项指标,完善了价值评价体系,弥补了净现值评价体系的不足。白爱民[32]将企业预期得益指标分为收益性、形象性、壁垒性、稳定性、战略联盟性五个子指标,将客户获取难度指标细分为建设成本、营销成本、竞争程度、客户响应四个子指标,建立起电信企业客户价值评价指标体系。谭海宁[33]则从客户当前价值、潜在价值和客户忠诚三个维度建立电信企业客户价值评价体系。胡新等[34]提出全面评价个人客户的客户价值,从而识别出真正的高价值客户,并制定相关的管理策略。
笔者利用共词分析方法,通过聚类分析和因子分析对我国客户价值研究领域的研究现状进行分析,研究结果表明,客户价值评价的方法以及应用研究是学术界最为关注的主题,是客户价值研究领域发展的主要领域。在客户价值评价方法以及应用研究领域中,客户细分、客户分类是对客户价值进行评价的前提和基础。而数据挖掘的相关方法,包括:决策树、粗糙集、聚类分析等方法,应用于客户价值评价领域又是客户价值评价近年来研究的重点之一。但是本文分析结果受到关键词规范化、样本数目的选择等因素影响,同时,聚类分析本身就是一个无监督的学习方法,要靠经验积累才能对聚类结果进行较好的解释。因此,本文只是从宏观上对客户价值研究热点进行分析,为研究者提供一个可借鉴方向,深入研究还需参考客户价值研究方面的文章。
[1] 周春雷,王伟军,成江东.CNKI输出文件在文献计量中的应用[J].图书情报工作,2007,7(07):124-126
[2] 崔雷,刘伟,闫雷,等.文献数据库中书目信息共现挖掘系统的开发[J].现代图书情报技术,2008(08):70-75
[3] 刘启元,叶鹰.文献题录信息挖掘技术方法及其软件SATI的实现——以中外图书情报学为例[J].信息资源管理学报,2012(1):50-58
[4] 秦长江,侯汉清.知识图谱——信息管理与知识管理的新领域[J].大学图书馆学报,2009,27(1):30-37
[5] 雷晓庆,刘晓雁.《图书情报工作》论文关键词特征的统计分析[J].图书情报工作,1998(5):19-20
[6] 邱小花,李国俊,肖明.基于Sci2的国外图书馆学情报学研究主题演变分析——以共词分析为例[J].情报杂志, 2013(12):110-118
[7] 肖明,李国俊,杨皓东.国内信息资源管理研究热点分析[J].情报科学,2011,29(4):534-538
[8] 马费成,张勤.国内外知识管理研究热点——基于词频的统计分析[J].情报学报,2006,25(2):163-171
[9] 冯璐,冷伏海.共词分析方法理论进展[J].中国图书馆学报,2006,32(2):88-92
[10] 梁晓婷,奉国和.当代知识图谱的构建方法研究[J].图书馆杂志,2013(05):10-16
[11] 张勤,徐绪松.定性定量结合的分析方法——共词分析法[J].技术经济,2010(06):20-24
[12]CottrillCA,RogersEM,MillsT.Co-citationanalysisofthescientificliteratureofinnovationresearchtraditionsdiffusionofinnovationsandtechnologytransfer[J].ScienceCommunication, 1989,11(2):181-208
[13] 李亮,朱庆华.社会网络分析方法在合著分析中的实证研究[J].情报科学,2008(04):549-555
[14] 宋歌,叶继元.基于SNA的图书情报学期刊互引网络结构分析[J].中国图书馆学报,2009(03):27-34
[15] 田大芳.图书情报学期刊互引网络结构分析.情报杂志,2009(06):48-51
[16] 魏晓俊,谭宗颖.基于核心-边缘结构的国际科技合作网络分析——以纳米科技(1996-2004年)为例[J].图书情报工作,2006(12):35-38
[17] 李志平,陈丽清.如何提升商业服务企业客户价值[J].商业时代,2005(32):27-28
[18] 王彦辉,王敬敏,张岩峰,等.供电企业CRM客户价值综合评价模型[J].华北电力大学学报,2006(05):97-101
[19] 演克武,张磊,孙强.决策树分类法中ID3算法在航空市场客户价值细分中的应用[J].商业研究,2008(03):24-29
[20] 邹鹏,莫佳卉,江亦华,等.基于代价敏感决策树的客户价值细分(英文)[J].管理科学,2011(02):20-29
[21] 李俊飞.集成粗糙集和支持向量机的电力客户价值研究[D].河北:华北电力大学,2007: 42-46
[22] 刘东升,琚春华,陈威.基于粗糙集和支持向量机的客户价值分类[J].广西师范大学学报(自然科学版),2009(01):97-100
[23] 梁娜,张吉刚.基于粗糙集-CPN网络的客户价值预测[J].统计与决策,2008(05):155-156
[24] 陈亮.基于粗糙集-神经网络技术的客户价值分类研究[D].江苏:江苏科技大学,2011:37-48
[25] 赵晓煜,黄小原.基于数据挖掘的客户价值预测方法[J].东北大学学报,2006(12):1393-1396
[26] 蒋国瑞,刘沛,黄梯云.一种基于AHP方法的客户价值细分研究[J].计算机工程与应用,2007(08):238-241
[27] 薛磊,白康生, 孙玉强.CRM系统中客户价值评估的实现[J]. 商场现代化, 2007(09):100
[28] 曾鸣,杨素萍,杨鹏举,等.社会节能环境下电力客户价值评估研究[J].华东电力,2008(06):15-19
[29] 曹国.基于K-means和PCA的商业银行客户价值细分模型研究[J].财会通讯,2010(27):27-29
[30] 彭艳艳.基于客户价值的商业银行客户聚类细分研究[J].生产力研究,2009(23):36-37
[31] 齐佳音,舒华英.电信运营业客户价值研究的紧迫性及方向探讨[J].电信科学,2003(06):1-6
[32] 白爱民.电信企业客户价值评价及营销策略[J].统计与决策,2006(10):167-168
[33] 谭海宁.电信企业客户价值评价体系建构与实施[J].商业时代,2008(30):86-88
[34] 胡新,殷宝,陈军学.基于客户价值评价模型的客户关系管理应用研究[J].企业经济, 2010(09): 35-38
Visual Analysis of Customer Value Research Literature in China
Feng Guohe1Yang Yang1Feng Xia2
(1.College of Economic &Management, South China Normal University,Guangzhou 510006;2.Information Technology Research Base of Civil Aviation Administration of China, Civil Aviation University of China, Tianjin 300300)
Customer Value is a hot and difficult topic of customer relationship management (CRM) in recent years. By the use of SATI3.2 software, this paper gave a co-word analysis of the articles on Customer Value collected in CNKI database. The relationships among keywords were demonstrated with the factor analysis method and the hierarchical clustering method. Then network knowledge map on Customer Value was drawn. Finally, it explored the status and hot spot of the researches on Customer Value in China.
Customer value Co-word analysis Cluster analysis Factor analysis Visual analysis
本文受中国民航信息技术科研基地开放课题基金项目“基于云计算与数据挖掘技术的航空业数据分析与应用”(CAAC-ITRB-201206)资助。
奉国和,博士,教授,硕士生导师,研究方向为档案管理信息化、数据挖掘、数字图书馆,Email:ghfeng@163.com;杨洋,硕士生,研究方向为信息资源开发与利用、知识管理;冯霞,教授,硕士生导师,研究方向为数据挖掘、民航智能信息处理。
G203;F274
A
2095-2171(2015)02-0037-07
10.13365/j.jirm.2015.02.037
客户价值”作为检索词,在CNKI(中国知网)的“中国学术期刊
总库”中分别进行篇名、主题、关键词检索,发表起止时间不限定,共得到文献1120篇。经查重,去掉无关键词和相关度不大的文献后得到有效文献870篇,并将其题录信息(主要有作者、题名、期刊名、关键词等)导出并保存为纯文本文件,然后再将导出的文件导入SATI 3.2中进行处理和统计。
2014-04-25)