基于关键词共现聚类的电子商务信用研究热点分析

2016-11-16 12:15刘玉林虞昌亮
商业经济研究 2016年18期
关键词:共词分析热点信用

刘玉林+虞昌亮

内容摘要:本文以“电子商务、信用”作为篇名对中国知网期刊文献数据库进行检索,将502篇检索文章作为研究对象,分析其总体特征和关键词共现热点。通过分析发现,总体上2007年是电子商务信用研究高潮,近五年有所下降但依然保持较好水平;在聚类上电子商务信用热点研究分为电子商务信用评价与管理、信用信息与风险博弈分析、信用环境和信用类别、交易过程信用研究以及网络交易和网站经营五类,并总结出研究热点集中化、突出化和实用化三大特征。

关键词:电子商务 信用 共词分析 热点

中图分类号:F713 文献标识码:A

近年来,我国电子商务持续向好发展,电子商务时代来临促使国内众多学者对其开展研究。其中,关于“电子商务信用”理论与实践的研究也成为热点。在中国知网中,以篇名“电子商务 信用”作为检索词,在“中国学术期刊网络出版总库”中共有502篇来源文章。如此多的查询结果,往往使文献检索人员感到分析困难,对国内期刊文献关于电子商务信用问题研究现状难以把握。因此,势必需要一种更好的研究综述方法对其总结,展示文献检索的结果(朱晋伟等,2015)。

电子商务信用研究文献概况

在对中国知网以“电子商务信用”为篇名检索后,在“中国学术期刊网络出版总库”中共计502篇文章,时期跨度为2000年至2015年共16年时间。

首先,以年维度进行分组后汇总如图1所示。在对电子商务信用研究方面,我国自2000年开始,总体上呈现出逐年增长的态势,在2006-2010年我国“十一五”期间最高,相关资料也显示当时正是我国电子商务蓬勃发展的时期。2010-2015年“十二五”期间数量也基本保持在每年40篇左右。

其次,在检索文章基金方面,图2和图3显示,有25%的文章是有基金项目支持的,从年分布角度看2006-2010年年度项目基金数量最高,近5年来也处于较高水平。可见国家及省市政策上对电子商务信用问题研究给予了很大的重视和支持。

再次,在文章成果推广方面,主要以文章下载和被引用数量进行分析,502篇文章共被下载155884次,达到19.4次/(年·篇),被引用2551次,达到0.32次(年·篇)。由图4可以看出,实线代表年下载情况,主坐标轴数据显示自2000以来一直走高,在2007年达到最高,近5年来处于急速下降态势;虚线代表年被引用情况,副坐标轴显示在总体走势上与被下载情况相同,在2000-2007年期间保持高企,2007年达到最高后持续下降。

最后,在持续研究性方面,主要以同一作者发表文章的篇数指标研究。表1显示,在502篇文章中共有694位作者,平均1.4人次/篇;发表文章两篇以上作者63位,占作者总数的9.1%,长期研究作者(3篇及其以上)较少,反映出我国在电子商务信用问题研究持续性方面还有待于进一步提升。

电子商务信用高频关键词共现分析

为了说明电子商务信用问题研究热点的细节情况,主要对502篇文章进行聚类研究,具体方法是:通过关键词形成共现矩阵,通过因子和聚类分析电子商务信用研究现状。

(一)关键词提取

通过Excel“分列”、“条件格式中的重复值”、“并列和数据透视表”等方法,502篇电子商务信用研究文章共有955个关键词,共使用2256次。根据Donohue提出的高低词频界分公式得出T=31.1899,阀值为32,此时关键词仅有“电子商务、信用、信用体系、信用评价、电子商务信用、信用风险”保留,由于在前期研究中以“电子商务 信用”作为主题词搜索,因此去除这两个关键词后仅有“信用体系、信用评价、信用风险”三个关键词。仅有的三个关键词并不能反映研究的热点情况,故在参考国内一些基于关键词共现研究文章后,选择词频大于5的关键词作为构造共词矩阵的因素,选取的关键词结果为60个,但在60个关键词中有很多同一或者相近词语,为研究的集中性进行合并,例如“淘宝”和“淘宝网”统一合并为“淘宝网”等。合并后关键词数目共计18个,具体如表2所示。

(二)构建共词矩阵

将中国知网中提出的关键词列在Excel中处理,经过“分列”、“VLOOKUP 关键词筛选”、“删除空白单一关键词”后变成8列,组成两两配对组C82=28次,经过两两配对后形成两列,再利用表2“新关键词变换”形成构成共词矩阵的原始数据。

在“新关键词变换”后的两列关键词配对基础上,通过“数据透视表”构建共词矩阵,形成18×18矩阵(部分内容见表3)。在表3 中,数字反映高频关键词间共现的次数。

(三)标准相关矩阵转化

在共词矩阵中,为消除频数差异带来的影响,利用Ochiai系数对其进行相关矩阵转化,Ochiai系数公式如下:

Ochiai= Nij /(Ni *Nj)1/2 (1)

式(1)中Nij表示两个关键词共现的频数,Ni或Nj表示关键词各自出现的频数。需要注意的是共词矩阵的关键词频数与表2中共词矩阵处理前关键词频数有所不同,因为在共词矩阵处理过程中会删除单一关键词,造成频数有所减少(见表4)。

由于共词相关矩阵中“0”值较多,与“1”相减后得到高频关键词共词相异矩阵,如表5所示。

(四)多元统计分析

通过SPSS20.0对共词相异矩阵进行因子分析和聚类分析,找出关键词类群分析,从而发现电子商务信息研究热点和发展趋势。

1.SPSS因子分析。在SPSS 20.0选择“Analyze”-“Data Reduction”-“Factor”和“Principal components”选项对共词相异矩阵进行分析,表6结果显示7个因子被提取,因子累计方差解释贡献率为59.132%,但在图5碎石图中可以看出前5个因子比较陡峭,具有很好的代表性,考虑到划分为5类能够使分析更集中。因此,选择提取5个因子作为聚类分析依据。

2.SPSS聚类分析。在SPSS 20.0选择“Analyze”-“classify”-“Hierarchical Cluster”,在“Cluster Method”中选择“Between-groups linkage”,和“Measure”中选择“Squared Euclidean distance”,对共词相异矩阵进行处理,得到树状图(见图6)。

在图6中,对高频关键词进行分类,依照因子分析的结果共分为五类:第一类电子商务模式、信用评价、信用管理和对策;第二类博弈论、信用风险、信用服务和信用信息;第三类为网络交易和网站经营;第四类信用环境和信用类别;第五类信用认证、信用制度、交易过程信用、信用案例、信用问题和网上购买。

电子商务信用研究热点分析

(一)热点研究领域分析

电子商务信用研究文献通过形成共词矩阵、相关相异矩阵转化、因子聚类等多元分析后,得到五类研究领域,下面对其进行分析。

1.电子商务信用评价与管理。第一类包含新关键词“电子商务模式、信用评价、信用管理和对策”,其中电子商务模式原有关键词为“B2B、B2C、C2C、C2C电子商务、C2C模式”,信用评价原有关键词“信用体系、信用评价、信用评价体系、信用评估、信用评价模型、指标体系、评价模型、信用度”,信用管理和对策为原关键词本身。故该类主要讨论不同电子商务模式的信用评价方法,对包含B2B、B2C、C2C等电子商务模式建立信用评价模式(或者信用高度)、设计指标或指标体系等,以及在电子商务信用评价基础上开展信用管理和对策研究(王强等,2010)。

2.信用信息与风险博弈分析。第二类包含新关键词“博弈论、信用风险、信用服务和信用信息”,其中博弈论原有关键词为“博弈、博弈论、博弈分析、纳什均衡”,信用风险原有关键词为“信用风险、信用危机”,信用信息原有关键词为“信用信息、信用数据、信息不对称”,信用服务为原关键词本身。该类主要是对电子商务信用过程中信息问题进行研究,包括对信用风险和危机利用博弈论理论和方法进行探讨(夏晗,2015),例如讨论信用风险的博弈分析,讨论信息不对称的博弈分析,同时该领域也提出应该建立信用数据服务(高劲松等,2014)。

3.网络交易和网站经营。第三类包含新关键词“网络交易和网站经营”,其中网络交易原有关键词为“电子交易、网络交易”,网站经营原有关键词为“网购、网上购买”。该类主要列举电子交易、网络交易、网络和网上购买等社会热点电子商务词语,是研究领域对电子商务高速发展做出的反应,在一定程度上说明其研究的社会意义。

4.信用环境和信用类别。第四类包含新关键词“信用环境和信用类别”,其中信用环境原有关键词为“信用环境、诚信环境”,信用类别原有关键词为“个人信用、社会信用、企业信用、商务诚信、商业信用”。该类主要研究不同信用类型的环境问题,具体包括对个人、企业、商业、商务甚至社会等信用环境的特征描述和问题研究,从而把握整体信用环境的生态现状。

5.交易过程信用研究。第五类新关键词为“信用认证、信用制度、交易过程信用、信用案例、信用问题和网上购买”,其中信用认证原有关键词为“认证机构、征信、第三方认证、社会信用体系”,信用制度原有关键词为“信用制度、信用机制、诚信机制、诚实信用原则”,交易过程信用原有关键词为“第三方支付、电子支付、电子合同、第三方、货到付款、交易手段、交易信用”,信用案例原有关键词为“支付宝、中小企业、网上拍卖、淘宝网、易趣网、淘宝”,信用问题原有关键词为“信用问题和信用缺失”,网上购买为原有关键词。该类主要选择包括淘宝网、易趣网、网上拍卖等一些信用案例,进行交易过程的信用研究,涉及到通过第三方支付、信用认证或者征信等方法解决一些信用问题和信用缺失。该领域包含关键词较多,研究范围较广,但在社会上都是电子商务信用问题研究的关键热点之一。

(二)研究总体特征分析

通过上述分析,电子商务信用研究热点呈现出集中化、突出化和实用化三大特点。

1.研究热点集中化。通过聚类,发现五类研究热点为包括个人、企业、商业、商务甚至社会等不同信用类型的环境特征和问题描述(第四类),对包括淘宝网、易趣网等信用案例进行交易过程的信用研究(第五类),对不同电子商务模式的信用评价研究(第一类),探讨信用信息的博弈分析(第二类)。五类热点全面反映了电子商务信用研究的涵盖领域,研究脉络清晰,结构明确,可以概括性表达为电子商务信用链的集中化研究。

2.研究热点突出化。在五类研究热点中,对不同电子商务模式的信用评价研究(第一类)和对包括淘宝网、易趣网等信用案例进行交易过程的信用研究(第五类)两类涵盖高频关键词较多,研究热点突出,同时也是社会的突出热点。此点实质上反映出电子商务信用热点研究已明确找到自身的核心问题,并开展了实际的重点研究,使研究热点进一步突出化。

3.研究热点实用性。在研究热点中,信用案例、信用环境、交易过程信用等都是实际发展中电子商务信用遇到的社会问题,其本身作为研究热点也是反映社会的期待热点和实质热点,研究热点的结论对完善不同电子商务信用评价(第一类研究)、提升交易过程信用保障(第五类研究)、建立信用信息的分析和服务(第二类研究)、不同信用类型的环境特征认知等都有着实际的社会意义,反映出研究热点社会实用性。

综上,通过对2000-2015年502篇电子商务信用期刊文献总体特征统计,发现2007年电子商务信用处于最高时期,近年来所有所下降但依然保持较好势头。在关键词共现聚类研究方面,分析发现电子商务信用评价与管理、信用信息与风险博弈分析、信用环境和信用类别、交易过程信用研究以及网络交易和网站经营五类研究热点,并总结出研究热点集中化、突出化和实用化三大特征。

参考文献:

1.朱晋伟,邹玲.基于关键词共现聚类的战略管理研究热点分析[J].现代情报,2015(10)

2.储节旺,郭春侠. EXCEL实现共词分析的方法——以国内图书情报领域知识管理研究为例[J].情报杂志,2011(3)

3.储节旺,郭春侠.共词分析法的基本原理及EXCEL实现[J].情报科学,2011(6)

4.王强,杨茂江,刘琛.基于统一信任的电子商务信用评价模型[J].信息安全与通信保密,2010(8)

5.夏晗.基于主成分分析和支持向量回归随机组合模型的电子商务信用风险度预测研究[J].现代情报,2015(1)

6.高劲松,梁艳琪,李珂,肖涟,周习曼.面向关联数据的电子商务信用信息服务模型研究[J].现代图书情报技术,2014(6)

猜你喜欢
共词分析热点信用
热点
为食品安全加把“信用锁”
信用收缩是否结束
热点
结合热点做演讲
信用中国网
信用消费有多爽?