物流服务供应链热点主题可视化分析

2021-05-05 18:47:43张水旺陈潜萍
物流科技 2021年9期
关键词:共词分析可视化

张水旺 陈潜萍

摘  要:为了探究以往物流服务供应链研究的热点主题以及学者们重点关注的主题,以及这些被关注的对象之间的联系和强度,本文检索了2010~2020年Web of Science中的相关论文数据,提取关键词作为识别主题,运用书目共现分析系统对关键词进行词频分析统计及矩阵生成、用SPSS软件进行聚类分析,最后运用Ucinet中的Netdraw可视化软件来进行物流服务供应链热点主题的可视化分析。分析结果确定了物流服务供应链研究的相关热点主题为物流、可持续性、物流服务提供商、再制造、逆向物流、设施位置等,以及他们之间存在的关联强度。

关键词:物流服务供应链;热点主题;共词分析;可视化

中图分类号:F250    文献标识码:A

Abstract: In order to explore the past research hot topics of logistics service supply chain and scholars focus on the theme, the paper retrieval in 2010~2020 in Web of Science data, the relevant paper to extract the keywords as to identify the theme, using the bibliography co-occurrence analysis system to keywords analysis of word frequency statistics and matrix generation, cluster analysis, using SPSS software by using the software of the Ucinet Netdraw visualization for logistics service supply chain visualization analysis of hot topics. Based on the analysis results, the relevant hot topics of logistics service supply chain research are identified as logistics, sustainability, logistics service providers, remanufacturing, reverse logistics, facility location, etc., as well as the strength of correlation among them.

Key words: logistics service supply chain; hot topic; co-word analysis; visualization

0  引  言

随着互联网经济的迅速发展,我国物流行业在快速发展的同时也面临着新的挑战,传统物流模式已远远无法满足物资快速运输的需求。在这种瞬息万变的市场需求下,为了促进物流企业更好地适应市场,对物流服务供应链进行优化整合已是大势所趋。近几年,很多学者研究物流服务供应链相关主题,取得了相应的研究结果。然而,这些研究成果在主题上大多分散,缺乏有机联系,影响了物流服务供应链研究的进一步深入,根据对阅读的文献进行梳理分析,最后对研究的问题进行深入分析,归纳出不同研究方向并作出评述,这种传统定性研究方式存在着局限性。

主要依据Web of Science数据库,对物流服务供应链热点主题在Web of Science核心合集里的论文进行检索。设置检索式为:TS=logistics service supply chain & Language=English & Time=2010~2020。在此约束条件下,检索到有效文献有955篇,所有文献的文本数据均以两种格式输出:纯文本和UTF-8。经过格式转换、数据合并、数据清理、属性规约与选择等记录、属性处理,得到出版年和关键词,作为规约保留后的属性。

每条记录提取“出版年”,即PY属性,对每年进行统计,结果如表1所示,反映该领域论文年产出量随着时间演进呈增长趋势,表明该领域一直受到学者关注且关注度有所提升。

1  研究设计

本文旨在探究物流服务供应链研究的热点主题以及不同主题之间的关系,来确定学者们重点关注的对象,以及这些对象之间是否存在联系,联系强度如何。基于此,设计研究角度:

主题识别[1-2]。关键词是作者提供的用于表达单个论文主题内容的检索词汇,本文提取“关键词”字段对主题进行识别,确立研究热点与基本结构。

分析方法。运用书目共现分析系统对关键词进行词频分析统计及矩阵生成、用SPSS软件进行聚类分析,最后运用Ucinet中的Netdraw可视化软件来进行物流服务供应链热点主题的可视化分析。词频分析是文献计量过程中的定性手段,探测特定研究领域检索到的文献数据集内不同关键词出现的次数,比较频次多少可以确定研究热点,这种方法在一定程度上弱化了传统文献综述方法对于定性总结的依赖,比较客观准确;共词分析是一种通过统计文献数据中词汇或者短语共同出现频次来揭示特定研究领域研究主题相互关系的方式,可分为篇内共现和篇间共现,前者是词汇短语在同一篇论文中的共现,后者则是在整个数据集中不同论文中的共现[3];聚类分析是在没有先验知识支持的前提下进行的定量操作,根据对象某一特征属性的差异进行分析与归类[4];社会网络分析是采用量化方式对社会网络中各个对象之间关系的具象表示,可以直接呈現社会成员间关系[5]。

研究假设。采用“关键词”确立主题是一种理想化的方式,必须基于一定前提假设。本文对于主题分析的假设来源于1989年Whittaker提出的共词分析假设[6],具体有以下几点:(1)关键词是由作者仔细斟酌的、认真选择的专业术语,且能够反映文章内容、作者思想、研究现状。(2)同一篇文章中出现相应的关键词,可以假设认为关键词之间存有一定的关联性。(3)关键词被很多研究者选定并且在不同的研究主题中频繁出现,则认为在特定研究领域内成对出现的关键词之间的关系是富有意义的。(4)关键词是否有受训经历的标引者所使用,通过一个或者多个指标反映与此相关的科学概念。

如若上述假设是成立的,则通过关键词探索文章以及学科领域的相关科学概念就可以接受。在研究假设基础之上,确定热点主题,探测热点主题之间的关联,并对可视化结果予以解读[7]。

研究工具。为了研究的顺利进行,选用了BICOMB2.0书目共现分析系统、SPSS统计分析软件、Ucinet社会网络分析软件中的Netdraw可视化软件。其中,BICOMB2.0书目共现分析系统是由中国医科大学医学信息学系崔雷和沈阳市弘盛计算机技术有限公司协作开发,具有项目建立、数据提取、频数统计以及矩阵生成,可以对数据进行快速的读取、准确提取字段并归类存储、统计生成书目数据的共现矩阵,来满足本研究共现的需要。SPSS软件用来做聚类分析,可以用聚类树图显性表示出关键词间的相关关系。Ucinet社会网络分析软件具备综合的使用功能,在拥有数据的基础上,具有强大的矩阵代数和多元统计分析功能,同时软件内部聚集了Netdraw等数据可视化软件,可以让结果得到更好的呈现。

2  结果分析

2.1  热点主题确定。运用BICOMB2.0书目共现分析系统,将检索提取后的数据导入进去,根据关键词字段(DE)进行词频统计,累计频次共有4 619次,平均每篇4.84个关键词,符合每篇3~5个关键词的经验认知,为了弱化检索策略效应,删除频次排在前两位的supply chain management(85次,1.8402%),supply chain(80次,1.732%),这里仅给出TOP36的关键词纳入分析。依据普赖斯定律设定高频阈值,得到计算公式为:

m=0.749                                           (1)

其中:m为统计时段内阈值;n是关键词最高频频次。

统计结果显示:2010~2020年期间,关键词最高频次为85次,根据公式(1)计算出选定的阈值为m=6.91,按照取整原则即选定频次在7次及以上的36个关键词。累计频次489次,约占10.5855%,如表2所示。

可以看出,删除排在最前面的两位后,“物流”是频次最高的一个,显示物流服务供应链这个热点主题中物流受到广泛关注,也能够体现出物流服务供应链中物流的重要性;频次比较高的还有可持续性、逆向物流、物流服务供应链、定价、再制造、博弈论、库存管理。

2.2  基于SPSS的系统聚类分析。聚类分析是对研究的数据进行聚类处理,除统计功能外还能与其他方法配合对数据进行预处理,这里选用层次聚类,是嵌套簇的集族,组织成一棵树进行分析。

根据上文计算结果,将频次大于等于7次的数据导入书目共现分析系统,生成词篇矩阵,然后对数据采用文本的方式导出,导入进SPSS软件对矩阵进行聚类,选用组之间链接的聚类方法尝试选择平均距离算法、最大距离、最小距离等,比较之后选择其中最合适的方法。生成聚类树图,如图1所示。

首先找出聚类树中各个类别的核心,然后逐层累加语义信息,根据聚类分析的相关原理,同一类内找相同点,不同类间找相异处,由此总结归纳各个类别的含义[3]。最终得到物流服务供应链研究领域的9个热点研究簇:逆向物流与再制造、物流库存、供应链融资、环境可持续性、物流服务供应链与优化不确定性、物流服务定价与电子商务、可持续性与供应链整合运输、第三方物流与库存管理、工业4.0区块链与供应链设计。

2.3  主题间关系确定。在整个数据集内,关键词和论文是一对多的关系,一个关键词可以出现在很多篇论文中,但其基础是词与篇之间一对一的关系,正是基于一对一的关系,可以形成m*n词篇矩阵,不同主题之间关系识别路径,如图2所示。

2.3.1  构建共词矩阵。本文抽取36个关键词与其所在955篇论文的对应关系,形成36*955词篇矩阵(0~1分布),列示出热点关键词与论文的所属关系。文献篇名不需显名化,将其编码取值为1~955,得到矩阵局部数据,如表3所示。

基于词篇矩阵,若不同关键词在同一论文中出现,则说明存在共现关系,记为1;否则认定无共现关系,记为0,据此,生成一个邻接矩阵,得到局部,如表4所示。

2.3.2  共词网络个体属性分析。对每个关键词在共词网络中的影响力、重要性等方面通过一系列相应的指标进行测量的过程叫做共词網络的个体属性分析[8]。对于节点之间的相互连接这种社会网络分析里,节点的中间中心度、点度中心度以及接近中心度等是分析的相关指标[9]。

本文中的共词网络的个体属性分析的分析指标选用节点的点度中心度对个体属性进行相关分析。一个节点与其他节点联系越紧密直接,这个节点反映的数值就越大,连接的频次较低的,数值相对较小。

物流服务供应链热点主题共词网络的节点为关键词,节点之间的关联即为两关键词的共现,节点的点度中心度为某关键词与其他关键词共现的次数[10]。从分析结果看,物流服务供应链热点主题关键词的平均点度中心度为5.389,表明每个关键词与其他关键词共现的平均次数为5.389次。表5为位于前11名的物流服务供应链热点主题关键词点度中心度值分析结果。数值Degree列表示的是绝对点度中心度,数值Nrmdegree列表示的是相对点度中心度。中心度在社会网络分析中有一定的权威性,被认为是地位与权力的代表,是牵引网络发展的关键指标因素,中心度高的位于网络中心的点是对整体影响最为显著的[11]。

上述分析可知,物流服务供应链热点主题研究的核心研究内容有物流、可持续性、物流服务提供商、再制造、逆向物流、设施位置等,局部数据如表5所示。

2.3.3  整体网络可视化。为了更加生动形象的表现出最终效果,本文采用网络可视图的方式展现,对物流服务供应链热点主题采用Ucinet软件进行可视化,数据导入后运用软件内集成的Netdraw可视化软件进行相关操作,来得到物流服务供应链热点主题网络图,如图3所示,每个节点代表一个研究热点,根据节点的中间中心度值设置节点的大小,节点越大,表明节点的中间中心度值越大;节点间的连线表示两研究热点之间具有共现关系。

通过网络密度的计算,反映节点之间的关联度:

C=1-≈0.154                                         (2)

公式(2)中,V=439,表示邻接矩阵对角线上方0的个数;N=36,表示的是节点数,最后通过上式计算后,得到相应的网络密度[12]。

2.4  研究热点。通过上述分析,可知近10年主要有以下几个研究热点:“物流”、“可持续性”、“物流服务提供商”、“再制造”、“逆向物流”、“设施位置”等,对于物流服务供应链的研究并不是单一的,有很多因素影响其发展,不断形成更好的物流服务。

“物流服务供应链”与“可持续性”:随着可持续发展的理念逐渐深入人心,企业也开始研究自己的供应链,以期使之可持续发展。在物流服务供应链的过程中融入可持续发展的理念,以求达到经济效益、社会效益和环境效益的协调优化,从而最终实现供应链的可持续性发展。

“物流服务供应链”与“物流服务提供商”:现有的物流服务提供商存在一定的缺陷问题,比如说企业规模层次不齐,没有相对好的服务质量,不能让消费者满意等,因此在供应链发展中,要通过系统科学的供应商评估方法,选择与企业长期发展目标相一致的物流服务供应商[13]。

“再制造”与“逆向物流”:再制造有助于缓解经济发展中面临的资源短缺、污染严重的问题,是一种新型的制造方式也是实现循环经济的一种有效方式,在再制造过程中的逆向物流以再制造生产为目的,是再制造的生命线。

“物流服务供应链”与“设施位置”:设施选址在物流服务中是一个重要的环节,在物流服务供应链中,选址的好坏直接影响到服务方式、服务质量、服务效率、服务成本等,从而影响到利润和市场竞争力,甚至决定了企业的命运。

3  结  论

本文依据关键词知识单元对物流服务供应链研究的主题进行识别,并结合相应数据对可视化结果进行分析研究[14]。

首先,检索得到36个高频关键词,如可持续性、逆向物流、再制造、博弈论、设施位置、库存管理等,经过SPSS聚类分析后形成9个研究热点簇:逆向物流与再制造、物流库存、供应链融资、环境可持续性、物流服务供应链与优化不确定性、物流服务定价与电子商务、可持续性与供应链整合运输、第三方物流与库存管理、工业4.0区块链与供应链设计。聚类分析出过往研究热点主题以及研究应关注的重点。

然后,列出词篇矩阵和邻接矩阵,得到点度中心度,可以得出物流、可持续性、物流服务提供商、再制造、逆向物流、设施位置等词是物流服务供应链热点主题研究的核心研究内容。利用可视化技术得出热点主题网络可视图进行分析,可以看出物流服务供应链研究还存在很大的进步空间。

从对现有的数据分析可以看出,当前学者对物流服务供应链研究不具备完整性,还有很大的研究空间,数据相对较少,因此,应丰富相关研究工具,综合运用多种分析方法,多视角多维度剖析物流服务供应链领域相关问题,得到更好的研究结果。

参考文献:

[1] 宋凯,朱彦君. 专利前沿技术主题识别及趋势预测方法——以人工智能领域为例[J]. 情报杂志,2021,40(1):33-38.

[2] 唐恒,邱悦文. 多源信息视角下的多指标新兴技术主题识别研究——以智能网联汽车领域为例[J]. 情报杂志,2021,40(3):81

-88.

[3] 郭春侠,叶继元. 基于共词分析的国外图书情报学研究热点[J]. 图书情报工作,2011,55(20):19-22.

[4] 王小华,徐宁,谌志群. 基于共词分析的文本主题词聚类与主题发现[J]. 情报科学,2011,29(11):1621-1624.

[5] 刘竟,王慧,徐桂芬. 基于共词网络的我国搜索引擎研究热点可视化[J]. 情报科学,2012,30(4):604-608.

[6]  Whieeaker J. Creativity and Conformity in science: Titles, Keywords and Co-word Analysis[J]. Social Studies of Science, 1989,19:473-496.

[7] 丁晟春,俞沣洋,李真. 网络舆情潜在热点主题识别研究[J]. 数据分析与知识发现,2020,4(Z1):29-38.

[8] 赵一鸣,吕鹏辉. 学科知识网络研究(Ⅲ)共词网络的结构、特征与演化[J]. 情报学报,2014,33(4):358-366.

[9] 周萌,陈果. 科技文本中术语细粒度共现关系抽取与可视化分析[J]. 情报科学,2019,37(3):81-87.

[10] 王曰芬,王一山,杨洁. 基于社区发现和关键节点识别的网络舆情主题发现与实证分析[J]. 图书与情报,2020(5):48-58.

[11] 张俊飞,毕志升,吴小玲. “教学评价”研究熱点与主题可视化分析[J]. 中国教育信息化,2018(1):17-21.

[12]  Ray Reagans, Ezra W Zuckerman. Networks, Diversity, and Productivity: The Social Capital of Corporate R&D Teams[J]. Organization Science, 2001,12(4):502-517.

[13]  Shoja A, Molla-Ahzadeh-Zavardehi S, Niroomand S. Adaptive meta-heuristic algorithms for flexible supply chain network design problem with different delivery modes[J]. Computer & Industrial Engineering, 2019(7):221-225.

[14] 白志鹏,李全喜,张浩维. 供应链管理研究热点主题可视化分析——以SCI为数据源[J]. 情报科学,2020,38(10):18-22,73.

猜你喜欢
共词分析可视化
自然资源可视化决策系统
北京测绘(2022年6期)2022-08-01 09:19:06
思维可视化
师道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水运行动态分析与可视化展示
云南化工(2021年8期)2021-12-21 06:37:54
自然资源可视化决策系统
北京测绘(2021年7期)2021-07-28 07:01:18
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
传媒评论(2019年4期)2019-07-13 05:49:14
基于德温特数据库的关键共性技术分析
中国市场(2016年31期)2016-12-19 09:15:43
国内图书馆嵌入式服务研究主题分析
现代情报(2016年10期)2016-12-15 12:32:46
基于文献计量分析我国生物科学素养研究状况(2001~2016年)
基于知识图谱的智慧教育研究热点与趋势分析