基于LDA和SNA的应急物流研究主题可视化研究*

2024-01-18 06:42俊,李超,王
灾害学 2024年1期
关键词:物资应急物流

米 俊,李 超,王 迪

(1.山西财经大学 管理科学与工程学院,山西 太原 030006;2.山西财经大学 工商管理学院,山西 太原 030006)

应急物流是指为应对突发事件提供生产、生活物资供应保障,满足突发性物流需求的特殊物流活动[1-2],贯穿突发事件的应急减缓、应急准备、应急响应以及应急恢复全过程。2020年新冠病毒感染发生以来,我国应急物流体系发挥了疫情防控“生命线”与“先行官”作用,顺丰速运等物流企业先后在多个城市及时调度防疫物资,“菜鸟”应急物流体系担任起国际应急物流重任,为150多个国家和地区运送物资共计2.5亿余件[3]。然而,在应对突发事件过程中,应急物流体系仍然暴露出应急仓储能力不足、救援物资调配不合理、末端配送效率低下等短板现象,我国应急物流能力尚存在较大优化空间。随着应急物流实践痛点问题的凸显,应急物流相关的体系建设、模型与算法优化、应急管理及应急物资保障问题成为政府、企业和学者共同关注的重点议题。

国外学者和实践者对应急物流的关注时间较早,经过多年探索已形成较为完善的管理机制和救援体系,如美国成立联邦应急管理署、日本构建海陆空运输应急物流体系等[4-5]。已有学者采用模型构建和仿真等技术方法在应急物流管理[6]、应急物资配送等方面展开深入研究,如Ken[7]提出用物流方法帮助调配救援物资,从而提升运送效率,这为应急物流运输、配送等方面研究奠定了坚实的基础;应急物资运输配送是应急物流的重要一环,其中对物资保障、路径优化的研究是实现应急物流高质量发展的关键,部分学者以最小成本、最短路径、有限时间内实现资源合理调配和最少损失为目标,研究在不同约束条件下应急物资运输分配问题[8-11]。我国应急物流的研究起步较晚,2003年非典肺炎的暴发引发社会各界对应急物流的广泛关注,应急物流领域成为研究热点[12]。当前,国内学者主要聚焦于重大突发事件下应急物资储备调度、选址路径和体系构建等问题[13-14],从模型求解、算法优化[15]等研究视角出发,探索优化应急物流管理、提升应急救援效能的路径方案,并致力于寻求降低突发事件影响、减轻人民生命财产损失的发展对策。部分学者针对国内外应急物流研究特征展开综述分析,如商丽媛等[16]运用元分析法从应急物流研究主题、方法、层次和参照学科四个方面进行综述分析;李创等[12]从应急物流理论基础、体系建设和物资配送优化等方面着手,总结归纳国内外应急物流研究现状和发展历程。已有部分学者基于知识图谱[17]、Citespace[18]、VOS viewer[4]等可视化软件对物流学科现状及发展趋势展开分析,如吕程[17]以科学文献数量为标尺,从静态和动态两个角度分析了国内外物流研究现状并预测未来发展趋势;戢晓峰等[4]采用词频分析方法,通过VOS viewer软件可视化对比分析1997-2020年国内外应急物流文献,总结学科发展动态和研究热点。但是,现有文献中针对应急物流的综述研究仅通过统计关键词词频展开共词分析,没有具体分析关键词在网络中所处位置,难以科学勾勒应急物流研究热点和演化路径。

通过梳理相关文献发现,应急物流领域的主题挖掘和演化路径研究主要存在以下不足:关于应急物流主题挖掘的文献较少,多数文献聚焦物流学科或某一细分主题展开综述,导致难以获取完整全面的应急物流研究热点,此外,文献多采用词频统计等传统的主题识别方法,HANNIGAN、马鸿佳等[19-20]指出用此类方法对大量文献内容进行综述会存在去语境化、耗费时间和资源等缺陷。为了弥补上述不足,研究重点围绕以下两个问题展开:①如何有效识别及全面归纳应急物流研究主题?②如何刻画应急物流研究发展趋势和演变路径?传统文献综述方法依靠研究人员主观分析、缺少共同遵守准则等原因,常常出现分析偏差或不同研究者意见相左的情况[21]。近年来,隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型作为语义挖掘的有效方法得到了学者关注,学者们在统计学[22]、图书情报学[23-24]、新闻学[25]等领域采用LDA展开文献计量分析并取得丰硕成果。同时,国内外学者对社会网络分析法在主题演化方面的贡献也开展了深入研究,该方法为主题演化分析提供标准和量化指标,能清晰揭示主题发展趋势和演化路径[26-30]。鉴于此,本文基于LDA主题模型挖掘国内应急物流研究主题,并借助社会网络分析工具厘清应急物流演化趋势。

1 研究设计

1.1 LDA主题模型

主题模型是运用算法对语料进行语义分析和聚类以发现文本主题并对其进行无监督分类的统计模型[31],常见的主题模型方法包括潜在语义分析(Latent Semantic Analysis,LSA)[32]、概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)[33]和LDA[34]。其中,LDA是一种典型的三层贝叶斯词袋模型,包括文档层、主题层和主题词层:每个主题对应一个关键词概率分布,每个文档则对应一个主题概率分布。LDA建模过程主要包括:文献分词清洗、确定最优主题数和提取主题词,主题降维和可视化分析。在Python3.7.4环境下,对清洗后数据进行LDA算法分析,确定最优主题数。同时测度文档-主题分布和主题-词分布,可视化聚类结果,结合主题分布和词语语义实现主题分类。

1.2 社会网络分析

社会网络分析(Social Network Analysis,SNA)是通过网络和图论对行动者及社会结构加以分析的一种结构范式[35-36]。随着Ucinet、Gephi等可视化分析软件的诞生,社会网络分析在量化网络结构、揭示网络特征方面超越了许多理论方法,在网络舆情、科学合作等多领域得到广泛应用[37]。社会网络分析的常见研究内容包括整体网、中心性和结构洞分析。其中,中心性分析是重要量化指标之一,包括度数中心度、中间中心度和接近中心度,三种中心度概念见表1。结构洞即网络的空隙,处于结构洞位置的节点在网络中连接缺少直接联系的两个体,拥有更多的“信息优势”与“控制利益”[35]。

表1 中心度指标及概念

通过社会网络分析方法对共词网络展开分析,可以有效揭示学科研究热点和演化趋势[38]。具体包括筛选具有语义功能的高频词并统计词语共现关系获得共词矩阵,然后借助Ucinet6.0工具可视化分析网络特点,具体而言,以节点距离、凝聚指数和网络密度等指标描述的整体网络特征,通过网络中心度和结构洞分析结果,揭示应急物流研究演化路径。

1.3 数据采集与处理

为了去除跨语言影响[20],本研究聚焦于总结分析国内应急物流发展现状,采用中文文献为研究数据。具体的样本选择方法如下:首先,以“应急物流”“应急管理”“物流”为主题词,在中国知网上筛选2003-2022年的中文核心期刊要目总览收录的期刊文献和CSSCI期刊文献,共搜集中文文献522篇,通过浏览标题、摘要与部分正文,剔除105篇与主题相关性较差的文献,最终选定研究文献为417篇。

LDA主题建模和社会网络分析需要从文本信息中筛选关键词,并在Python3.7.4和Ucinet6.0环境下实现建模和网络分析。因此,在获取文献数据的基础上,进行去停用词、排除无功能词汇、分词等预处理工作。核心步骤如下:

(1)分词处理。考虑到采集文献全部为中文,研究采用结巴中文分词工具包对数据进行分词处理,将文献的标题、关键词、摘要拆解分成单个的词语,形成新的数据文档。

(2)构建去停用词表。为了消除部分无关词汇对实验的影响,本研究结合哈尔滨工业大学停用词表和本文研究内容,新建去停用词表,剔除如“为了”“本文”等与研究主题无关的词语;同时建立自定义词表,添加“重特大”“军地一体化”等代码无法准确识别的词语。通过上述调节方式,提高分词的精确度和研究结果的准确性。

1.4 研究框架

基于上述分析,以国内应急物流相关研究为背景,提出基于LDA与SNA的应急物流主题聚类和演化趋势及路径分析框架模型(图1)。

图1 应急物流研究主题聚类及热点分析框架图

2 研究过程

2.1 基于LDA的应急物流主题聚类分析

基于词袋方法,对筛选的417篇文献信息建模,同时借助Python的Gensim包进行模型训练,从而得到主题聚类结果。

2.1.1 最优主题数确定

由于LDA主题数量需要人为确定,当前研究多使用困惑度与一致性指标判断最优主题数目[19]。困惑度是文本所包含语料相似度的倒数,通过计算困惑度,可以识别文档归属某个主题的不确定性,困惑度越小模型聚类效果越好;而一致性利用归一化互信息和余弦相似度来分析语义相似性,一致性分数越高,主题质量越好。本研究分别计算主题数目为3~25共23个模型的困惑度与一致性表现来确定最优主题数目。实验结果见图2、图3,当主题数目为20时,一致性分数最高,同时困惑度数值也在主题数目为20时的下降幅度趋于平缓,因此本研究选取主题数为20。

图2 困惑度分数

图3 一致性分数

2.1.2 主题聚类可视化分析

输入LDA聚类结果,借助python可视化软件包pyLDAvis勾勒交互式的应急物流研究主题聚类图谱,检验主题分类结果的质量(图4)。

图4 主题结果可视化注:圆圈表示主题,圆的大小代表主题出现的频率,圆心间的距离表示主题之间的相似性程度。此外,图中圆的重叠是将主题由高维空间映射到二维空间产生的,不代表主题的实际重叠。

表2呈现了20个潜在主题对应的2~3个代表性词语,结合表2主题词词义和pyLDAvis可视化图谱的距离远近,对20个潜在主题进行二次聚类,降维确定4个突出的研究专题,4个专题下的隶属主题及10个关键词结果见表3。

表2 潜在主题结果

表3 LDA主题聚类结果

研究专题1为应急物流体系建设,具体包括主题1和5,相关文献关键词包括:管理体系、设施、体系结构、效率、救援等。应急物流体系是在一定的时空下,由物流环节包括物流要素和物流实体相互作用而成的有机整体[12]。相比于传统物流,应急物流系统在目标设置上更关注速度和效率[39]。当前,国内学者围绕应急物流体系暴露出的短板与不足[13],从应急物流体系建设、体系规划、数智化发展和新冠病毒感染背景下政府如何建设集约高效的应急体系等方面展开研究;具体涵盖调度体系、法律保障体系、能力评估体系[40]、协同体系[41]和军地一体化建设[42]等。其中,以物联网、区块链[43-44]等核心技术构建高效应急物流系统和基于疫情背景的应急物流体系完善[10]是重点研究内容。

研究专题2为应急物流模型和算法,具体包括主题3、8、12、13,相关文献关键词包括:算法、改进、模型、目标等。模型构建和算法求解是解决应急物流问题、提供应急物流方案的重要环节,广泛地应用于路径优化[45]、定位选址[46]和物资分配[43]等问题。在应急情景下,从整体应急供应链着手进行多目标模型构建是国内研究的重要主题之一,优化目标包括最小化响应时间[47]、最低成本[48]、最高满意度[49]等。而在应急物流算法方面,主要以遗传算法[50]、蚁群及蜂群算法[51]和常见算法改进为主,求解不同类型和规模的问题。

研究专题3为应急物流管理,具体包括主题2、4、9、14、20,相关文献关键词包括:管理、规划、选址、定位,方案等。应急物流管理的研究涵盖应急中心选址[52]、应急物流信息管理[53],应急预案[54]、平台建设[55-56]和应急物流能力评价[57]等内容。从研究数量分析,选址规划和信息资源平台构建是2个重要研究点。应急物流中心选址是保证物流时效性、降低物流成本等实现应急物流目标的关键环节。相关文献[58]均突出了选址规划在应急物流中的重要作用,强调以建设成本、时间成本和运输成本最小化等为目标,采用博弈、双层规划、模糊方法等构建模型,解决选址问题,此外,强化应急物流信息管理、推动信息台平建设也是优化应急物流管理的坚实基础和必然要求。

研究专题4为应急物资,具体包括主题6、7、10、11、15~19,相关文献的关键词包括:物资、配送、调度、路径、运输等。应急物资是指应对自然灾害、突发公共事件等所需要的物资保障,包括食品、药物、生活用品等基本保障物资和专业性物资。关于应急物资的研究主要集中在物资存储运输[59]、车辆调度[60]、需求管理[61]、线路选择等环节。交通运输问题贯穿应急物资存储、调度、配送等过程,包括水路、公路、铁路多种运输途径,确保物资能及时运往目的地,是应急物流的重要保障环节。从主题聚类结果分析,国内应急物流研究紧紧围绕应急物资问题展开,并且与其他三个研究方向有较高的关联性。

2.2 基于SNA的应急物流主题演化路径分析

为了构建应急物流主题在2003-2022年间的具体演变路径,从“网络中心度”和“结构洞”两个维度出发,编码构建主题词共现矩阵,并利用社会网络分析软件Ucinet 6.0分析网络结构特征,揭示不同主题词在应急物流主题群落演化过程中所起的作用,从而分析其演化路径。本研究以2020年数据为例,说明具体的分析方法。

2.2.1 共词分析

共词分析是通过统计文献关键词语的共现情况,解释词语间的关联程度,进而帮助明确词语所代表研究领域的研究热点、预测学科的发展趋势[62-63]。通过对数据的处理清洗,形成2020年样本数据词云图(图5)。研究选择频次大于20次的代表词作为研究对象,基本涵盖了该年应急物流的研究内容及方向。此外,考虑到极值频次对共词分析产生影响[64],剔除文献检索词“应急”(404次)和“物流”(216次),最终选取“物资”“模型”“救援”等30个代表性词语。其中“物资”“模型”两个词语出现的文频远超过其他词语,接下来依次是“优化”“路径”“目标”“疫情”。通过邻接矩阵统计矩阵中所有词语共现关系的平均数为6.01,取近似值6,将矩阵中大于以及等于6的数值取1、小于6的数值取0,得到二值阵,并对该矩阵展开网络密度、中心度、结构洞分析,得到研究结果。

图5 应急物流主题2020年样本数据词云图

2.2.2 网络密度及可视化分析

网络密度是衡量网节点间亲疏程度的重要指标,网络密度越大,关键词间的联系越紧密。经计算,本研究中网络密度为0.414,较为稀疏,表明2020年有关应急物流研究方向较多、比较分散。此外,任意两节点间的平均距离为1.570,基于距离的凝聚指数为0.681,这表明网络结构比较均匀,具有多个核心点。将2020年的关键词共现数据输入Netdraw中,获得图6的可视化分析结果。从图6来看,“物资”“救援”“模型”等节点位于网络核心,与其他词语展开紧密联系,相关细分方向是国内应急物流的重要研究内容。

图6 我国应急物流领域研究重点网络分析

2.2.3 网络中心性分析

利用Ucinet6.0对共词网络的三项中心性指标测量统计并排名(表4)。

表4 共词网络中心度指标综合排序

从度数中心度来看,关键词“物资”“救援”“模型”在研究中的重要性高居前两位,在网络中占据核心地位,结合新冠病毒感染背景,表明疫情环境下物资调度分配、应急医疗救援、物流模型构建等研究受到高度重视。排名4~7位的关键词包括“优化”“配送”“目标”“时间”,表明2020年更多学者以成本、时间、效率等为约束条件,探寻优化应急物流模型、提升应急物流能力的新途径。整体分析,30个高频词的平均度数中心度为16.15,中心度差异较小,表明应急物流研究范围较广且均有深入,与网络密度分析的结果保持一致。从中间中心度来看,关键词“物资”的度值位于首位且远超于其他关键词,其次是“配送”“模型”“救援”“疫情”等词语,度值为平均值3倍。结果表明,应急物资问题是2020年应急物流研究的重中之重。以应急物资为核心,以疫情大背景、物资配送、医疗救援、模型构建和体系优化为桥梁,搭建起2020年应急物流研究网络框架,并连接物流中心选址、应急物流群决策、网络优化等研究内容,共同丰富完善了应急物流研究、探索解决了疫情等突发公共卫生事件下的物流难题。从接近中心度来看,“卫生事件”“医疗”“肺炎”等词接近中心度较高,尽管这些词语在网络中不占据中心位置,但他们作为2020年应急物流研究背景,与不同研究方向紧密关联。

2.2.4 结构洞分析

对2020年样本数据共词网络展开结构洞分析,结果如表5所示。“模型”“救援”“配送”三个关键词具有较高的有效规模(Effsize),同时具有较低的限制度(Constraint)等级度(Hierarchy)。结合图6可视化结果、表4中心度分析和表5可得,在2020年的主题演化中,“模型”“救援”“配送”“疫情”“优化”这些节点更可能处于整个网络结构洞的位置,具有较强的演化能力。

表5 共词网络结构洞分析

综合上述分析,可以得到2020年国内应急物流主要研究内容及方向。用上述方法分别对2003-2022年数据编码处理,得到应急物流研究在2003-2022年的演化路径(图7),选取每个时间段所包含的前5个主题词,揭示应急物流主题演化情况。

图7 2003-2022年应急物流研究演化路径

根据图7分析结果,我国应急物流研究演化路径大致可以分为以下三个阶段:第一阶段从2003-2007年,应急物流研究主要包括“概念”“特点”“机制”等关键词,具体围绕应急物流的定义、特征、应急管理及物流运输环节展开基础性研究;第二阶段从2008年开始,2008年,我国经历了南方低温冰雪灾害和汶川地震,应急管理在经历严峻挑战的同时,围绕地震等自然灾害的应急物流体系构建、应急物资问题等逐渐受到国内学者更多的关注。2010-2017年,“算法”一词多次处于网络结构洞位置,在演化中较为活跃,这表明研究主要包括应用不同算法求解、优化物流难题,同时借助物流模型,探寻控制成本、提升能力、优化决策、加强保障等应急物流目标的新途径;到2018年,应急物流演化步入第三阶段,出现了“互联网”“物联网”“大数据”等关键词,在这个阶段,信息技术在类似河南暴雨自然灾害、新冠病毒感染等重大突发事件中得到广泛应用,数智物流逐渐成为应急物流研究热点。此外,此阶段也涌现出大量有关物流决策优化和考虑时效性与公平性的应急物资配送等应急物流相关领域的研究。2021年后期,应急物流网格化管理与优化研究成为保障救援工作开展、物流运输通畅、解决最后一公里运输难题的有效途径,同时,科技创新与互联网技术持续带动应急物流提质增效发展,运用数字化平台可以有效实现数据搜集分析、信息溯源共享、物资跟踪调配,提升应急物流保障能力,在网络路径规划、模型救援算法的相关研究中,数字化的影响得到了学者们的广泛关注。

3 结论和讨论

通过数据爬虫获取中国知网核心数据库中的国内应急物流文献,采用LDA和SNA理论方法,提出我国应急物流主题挖掘和热点剖析模型,揭示应急学科发展现状与趋势,主要的研究结论如下。

首先,采用LDA主题聚类模型编码确定了应急物流体系建设、应急物流模型和算法、应急物流管理和应急物资四个研究专题,丰富和拓展了应急物流的研究内涵解读。研究表明,在应急物流体系建设方面,已经形成了事前预警评估、事中跟踪保障、事后恢复重建的全面运作体系,但从主题聚类分布和强度分析,近3年来学者们对应急物流体系构建的关注度较低,而从疫情防控等重大应急事件来看,加强应急物流体系建设对推进国家治理体系和治理能力现代化及统一大市场具有重要战略意义。在应急物流模型和算法方面,该主题贯穿应急物流的研究始终,学者们以最小化成本、最大满意度、最短路径、最短时间等作为目标,通过搭建模型、创新算法,实现优化应急物流环节、解决应急物流难题。在应急物流管理方面,党的二十大报告指出“要坚持安全第一、预防为主,建立大安全大应急框架”,首次将应急管理体系纳入国家安全体系。应急物流管理作为应急管理中必不可少的环节,在应急预案制定、设施选址定位、信息平台沟通等方面为应急物资配送、多目标优化研究建立夯实基础。在应急物资方面,该主题研究内容文献数量最多、细分研究方向范围最广,主要围绕物资配送和车辆-路径等问题展开。

其次,使用社会网络分析方法,以2020-2021年数据为例,展开应急物流演化路径分析。结果显示,围绕新冠病毒感染等突发事件现实背景,应急物流目标优化、医疗救援、模型构建与仿真等主题在2020年研究网络中中心性指标高且处于网络结构洞位置,在演化中活跃性较强。整体来看,我国应急物流研究演化大致可以分为三个阶段,2003-2007年为第一阶段,国内应急物流研究内容单一,研究成果较少,主要围绕应急物流内涵展开;2008-2017年为第二阶段,应急物流体系、应急物资配送等研究受关注度逐渐增加,并且自2013年开始,以物流问题优化为目标的模型构建与算法求解成为研究主流,不断发展创新。2018年起,应急物流演化步入新的发展阶段,更多学者开始关注数字技术对应急物流的影响;近三年来,国内应急物流研究多以新冠病毒感染等重大突发事件为背景,展开应急决策优化、网格化管理、多目标优化等相关研究。

本文尚存在一定的局限性,首先,研究仅选取了国内应急物流文献数据展开分析,关于国内外应急物流的对比分析较少,在后续研究中,可以通过采集国外相关文献数据进行更全面地分析。其次,聚焦于应急物流研究主题的类型与演化分析,在后续研究中可以将国内外文献发文单位作为研究对象,开展网络分析,从合作强度和科研贡献等层面对各国应急物流合作模式展开深入分析,进一步丰富关于应急物流理论研究演进规律的阐释。

猜你喜欢
物资应急物流
多维深入复盘 促进应急抢险
完善应急指挥机制融嵌应急准备、响应、处置全周期
被偷的救援物资
本刊重点关注的物流展会
“智”造更长物流生态链
电力企业物资管理模式探讨
应急管理部6个“怎么看”
企业该怎么选择物流
国际新应急标准《核或辐射应急的准备与响应》的释疑
救援物资