快递物流领域技术热点研究
——基于专利文本和网络文本的分析

2021-10-26 02:25邱蓉蓉
内蒙古科技与经济 2021年17期
关键词:顺丰专利申请专利

邱蓉蓉

(湄洲湾职业技术学院 图书馆,福建 莆田 351100)

快递物流业在如今的信息化生活中已成为不可或缺的一部分,特别是近年来,物流配送的需求伴随着近年来电子商务的猛然发展也在急剧的增加,使得快递物流业也迎来了发展的黄金期[1]。然而,纵观快递物流业现在的发展和时代的发展落差还很大,无论是国内自身在快递物流业的发展瓶颈,还是与国际物流相比在技术水平上的缺陷,都在呼吁着国内快递物流企业在技术创新方面需要未雨绸缪,提升在快递物流业中的竞争力,进而驱动整个行业的创新发展。从企业的角度来看,我国的快递物流企业仍然缺乏技术创新,亟须提高自身的技术水平,加强自身的技术研发能力,才能使自己在如今激烈的竞争中脱颖而出。

1 专利文本的主题提取

1.1 专利数据来源

目前,中国快递物流企业以民营快递企业的发展最为迅速。民营快递企业在整个快递物流行业中占据非常重要的位置,从民营快递企业中确定快递物流的龙头企业,相对合理。由于笔者是基于专利分析的研究。因此,将从常见的、公认的各民营快递物流企业中,对它们申请的专利数量进行对比分析,从而选取出最能够代表快递物流行业中的领军企业。

笔者基于广东省专利大数据应用服务系统,对各个快递物流企业的专利申请量进行检索,检索时间截至2018年11月。专利申请量排名如表1所示,表中列出部分企业。

虽然京东物流集团是顺丰控股股份有限公司专利申请量的3倍多,但京东本身是电子商务平台,其申请的专利并非都是物流领域方面的专利,与文中研究的物流领域不符,因此排除。由表可知,顺丰的专利申请量以高达1 122的专利居首位,而其余9家快递物流企业的专利申请量很少,甚至有7家快递物流企业没有任何的专利申请。

表1 快递物流企业专利申请量排名

经初步分析,在2009年-2010年之间,顺丰才开始申请专利,起初专利申请数量都较少,从2011年才开始增多,此后更是出现爆发式增长,在技术创新和专利发明方面进行广泛布局。然而,国内其他快递物流企业的专利情况令人担忧,顺丰速运申请的专利数量在快递物流行业内遥遥领先,以大比分专利数甩开其他同行。因此,文章以顺丰速运有限公司作为快递物流企业的龙头企业,对其申请的专利文献进行分析具有一定的研究意义。

1.2 专利检索及处理

以广东省专利大数据应用服务系统作为专利信息数据来源。在此平台上对顺丰速运申请的相关专利进行检索和分析。检索策略如表2所示。

表2 专利检索方案

检索结果共有1 122条专利数据,经过删除重复的专利数据共得到顺丰速运的694条专利数据。将顺丰相关专利数量制作出历年变化趋势图,如图1所示。由于在审查专利的过程中需要一些时间,在提交申请之后到与专利公开会延迟一年半左右,造成2018年的专利没有全部检索出,因此,这一年专利的申请量相比于2017年会有一定的偏差,而呈现出下降的趋势。

图1 顺丰速运专利数量历年变化趋势

1.3 专利文本主题提取

对于专利文本的技术关键词提取范围设定为:标题,摘要和权利要求。通过构建的自定义文本词典(见表3)和停用词表(见表4),删除与物流技术没有实际意义和代表性的词,或者是不能反映专利信息内涵的词,将关键名词、动词等重点保留下来。

表3 自定义文本词典(部分)

表4 停用词(部分)

文本经过分词处理之后,为确定提取的最佳主题数目,利用Python计算困惑度。计算的结果以可视化图的方式呈现,其中横轴代表主题数目,纵轴代表困惑度的值。由图2可知,困惑度的值随着主题数目的增多逐步递减,而图中的转折点,在整个文本集合上的困惑度值较小,并且当主题数目继续增加时,困惑度的值也不会下降很多,不会有较大幅度的变化,此时的困惑度值可视为最低,其对应的主题数目即为最佳的提取主题数目。因此,根据图中的转折点,将所要提取的主题数目设置为15个[2]。

图2 最佳主题数的确定

最后,通过LDA模型对所有已有的所有专利分词进行主题的提取,提取的15个主题结果如表5所示。

表5 提取的主题

1.4 专利技术主题归类分析

对提取出来的15个主题,经分析可以将这15个主题归为4个不同的快递物流技术领域,并整理出与之相关的专利数量,如表6所示。

表6 技术领域归类

下面对以上划分的4个技术领域进行详细介绍,并绘制出各个技术领域的专利申请量历年变化趋势图(见图3-图6),从而分析每个技术领域逐年的专利申请情况。

1.4.1 分拣运输技术领域

这一类的专利申请量在4个聚类中居首位,主要是关于分拣车、分拣柜等分拣设备、自动分拣系统、物流货物输送设备、运输过程中的装卸搬运设备等方面的专利申请。其中尤以分拣技术领域的专利申请量最为显著,以“分拣”作为关键词共检索出118条专利量。

图3 分拣运输技术领域专利申请量历年变化趋势

由图3可知,顺丰在分拣运输技术领域的申请量逐年上升,虽然在2003年达到高峰值后有所下降,但在后几年又重新回升,且专利数量急剧增长,表明顺丰从2015年开始对分拣运输技术领域的关注度高涨。

1.4.2 智能物流技术领域

这类主要是有关于无人机、机器人、无人机智能吊舱、智能快递柜、智能电池等方面的专利申请。其中尤其以无人机技术领域的专利申请量最为显著,以无人机为关键词共检索出82条专利量。顺丰是国内首推用无人机送快递的物流企业,其致力于在航空装备的无人化、小型化和智能化,着手开始研发和设计用于物流运送的无人机,实现了国内货运无人机发展史上的多项突破。

图4 智能物流技术领域专利申请量历年变化趋势

由图4可知,顺丰在智能物流技术领域的专利申请量的增长较不稳定,其中在2009年、2011年、2012年和2013年的专利申请量均只有一项,发展极为缓慢,直到2014年才开始迅速增长,而在2016年又有所下降。

1.4.3 物流信息化技术领域

这类主要是有关于快递收寄件管理、运单管理、库存管理、车辆调度管理以及员工考勤管理等系统设计方面的专利申请。近几年,顺丰积极的研发和引进先进的信息技术和设备设施,建立了行业先进水平的信息系统,实现了资源的调度以及全程监控、跟踪快件流转的信息。

图5 物流管理系统技术领域专利申请量历年变化趋势

由图5可知,顺丰在物流管理系统技术领域的专利申请量增长在整体上呈逐步增长的趋势,但是在2009年-2012年有关于该技术领域的专利申请量均为0,表明这两年顺丰可能没有在物流管理系统领域方面的技术研究或者正处于研究中。

1.4.4 仓储包装技术领域

这类主要是有关于物流货物的包装设计、保温箱及其他货物存储方式等方面的专利申请。在智慧物流的大趋势下,绿色包装的研发和应用已成为电商、物流的聚焦关注点。顺丰旗下的包装实验室SPS中心定期为医药、鲜花、副食、冰鲜、3C、果蔬、生鲜等领域提供通用型的和定制化的包装解决方案服务,最大限度地推动用户体验和服务品质的改善。

图6 仓储包装技术领域专利申请量历年变化趋势

由图6可知,顺丰在包装存储技术领域的专利申请量的发展趋势波动较大,在2012年和2013年各达到一次高峰期,在2009年-2015年间的发展趋势较为缓慢,到2016年开始明显增长。

2 网络文本的数据处理

2.1 网络数据的来源

笔者选取深圳市万联亿通科技有限公司建设运营的万联网中所有物流方面的专家观点作为网络数据的来源,以便支持文章对快递物流领域的趋势发展研究。

2.2 爬取工具及数据处理

以“物流”作为检索的关键词,利用八爪鱼进行万联网所有相关数据的采集,可采集到的数量共4 394条。

表7 网络数据采集方案

将所有爬取到的数据进行筛选,排除与快递物流领域不相关和重复的文本,最终可得到有效数据共4 114条。经过对有效文本的初步整理分析,可以发现网络文本发布的时间段在2002年-2018年之间。

2.3 网络文本的分词处理

首先对网络数据逐行进行分词处理。在处理的过程中,同样运用构建的自定义文本词典(见表8)和停用词表(见表9)进行保留和过滤关键词。因为网络上的文本与专利文本的内容不同,所以,停用词表和自定义词表也必然会有所区别。将网络采集的文本经过分词处理后,接下来就可以开始相似度计算。

表8 自定义文本词典(部分)

表9 停用词(部分)

2.4 专利主题与网络文本的相似度计算

2.4.1 词向量的训练

笔者对词向量的训练方法是采用Genism中的Word2vec训练工具包,这类基于分布式表示的训练模型,能够从大规模的、没有明显标记的语料之中自动学习到句法和语义方面的信息,并将其进行编码表示[16]。在Word2vec训练词向量的过程中,需要手动设置包括窗口大小Window、Min-count数目和词向量维度Size在内的3个重要参数。Window指的是上下文窗口;Min-count指的是最小词频训练阈值;Size会影响到计算,增加词向量的维度能够增加词向量效果,维数越大,训练效果越好。文章将Window设值为5,Min-count的阈值设值为5,词向量的维度则设值为300。

由于在同一领域语料下,增加不相关领域语料将会降低词向量效果,因此,笔者将从万联网爬取的,约5万多篇有关物流领域的网络文本作为语料库进行词向量的训练,训练结束就可以直接通过计算两个向量之间的相似度来考察这两个词的相似结果。一般来说,训练的语料越多越好,为证实文章训练模型结果的有效性,选择以“智能”和“包装”一词为例,获得该词训练得到的词向量,并计算与“智能”“包装”最相近的词,进行排序[17]。由图7-图8可知,与“智能”相似的词语主要包括有:分单、硬件、快递柜、大脑、算法和机器人等,这些词在日常生活中常与智能一起出现。由图9-10可知,与“包装”相似的词语主要包括有:包装材料、回收、生物降解、循环和环保等与包装联系密切的词。可见,训练效果相对较好。

图7 “智能”词向量

图9 “包装”词向量

2.4.2 相似度计算及结果分析

在得到词向量模型后,利用WMD算法计算与专利文本的4个主题相似的网络文本。在计算相似度的过程中,为输出结果的易理解和有序性,笔者设置了以下参数,分别是①ID:代表的是所有网络文本的序号,将所有的网络文本添加索引,依次进行编号,以便在后续分析的过程中找出相对应的文本;②Instance:代表的是相似度,即各个主题遍历网络文本的语料库,逐行计算它们之间的相似距离。相似度越高,则两个文本之间越相似,因此笔者将Instance>0.8的文本认为是最相似的,但也不排除低于0.8的文本相似性;③Text:代表的是与专利主题相似的网络文本,但是由于计算相似度的语料库里是已经分词的文本,所以,结果输出的Text并不是全文,而是分词,需要人工寻找对应的原文。笔者将专利文本每一个主题对应的相似文本按照相似度的高低进行排序,选取排名靠前的网络文本进行进一步的分析,验证文本相似性[18]。以专利文本的各个主题为输入文本,输出与该主题相似的所有网络文本,将相似度大于0.8文本进行统计分析,其中为了方便,Text仅列出了由人工按照ID编号找出的对应原文标题。

2.4.2.1 智能物流主题。与智能物流主题相似度大于0.8的网络文本共有17篇,选取相似度top1的文本进行分析,结果分析:{“ID”: 182,“Instance”: 0.9280305,“Text”: 从“汗水物流”到进行“智慧物流”,物流企业如何远走高飞?}本篇主要讲的是物流硬件设备在配送、运输、仓储等领域已经处于智能化进程中,笔者介绍了现如今已经使用和将会使用的智能硬件设备,并详解了这些智能设备的应用现状和发展前景,包括智能仓储机器人、无人叉车、外骨骼机器人、无人卡车和智能快递柜等。

2.4.2.2 分拣运输主题。与分拣运输主题相似度大于0.8的网络文本只有1篇,结果分析:{“ID”:998,“Instance”: 0.9066993,“Text”: 提高仓储拣选效率的10种策略}本篇主要讲的是提出10种拣选技术和策略以解决目前物流配送难以解决的问题。在分拣运输方面的策略包括结合智能化存储系统,再采用纸箱流利式货架或使用激光导引车、起升机、叉车、托盘车和拣选车等设备提高效率;利用智能输送分拣系统自动进行分拣;采用电子标签拣选、多种扫描、语音技术等进一步提升拣选工位效率等。

2.4.2.3 物流信息化主题。与物流信息化主题相似度大于0.8的网络文本也是共17篇,选取相似度top1的文本进行分析,结果分析:{“ID”:998,“Instance”:0.8793183,“Text”:提高仓储拣选效率的10种策略}本篇主要讲的是提出10种拣选技术和策略以解决目前物流配送难以解决的问题。在物流信息化方面的策略包括利用物流信息的强化管理来完善订单与仓库的管理和控制,如仓库管理系统和仓库控制系统;同时,采用拣选区位控制输送系统与智能化物料流控制提高拣选效率。

2.4.2.4 仓储包装主题。与仓储包装主题相似度大于0.8的网络文本只有3篇,选取相似度top1的文本进行分析,结果分析:{“ID”:998,“Instance”:0.8633111,“Text”:提高仓储拣选效率的10种策略}本篇主要讲的是提出10种拣选技术和策略以解决目前物流配送难以解决的问题。在仓储包装主题方面的策略包括使用特定的管理软件用以完善订单与仓库管理,包括物料流控制、库存管理与设备控制等;传统货架存储库内的手工作业效率低下、错误率高,文中提出可以通过增设能激活数据交互的设备来解决,实现动态、及时地将指令发送至货品生产车间,从而提高准确率、吞吐量和生产率。

3 总结与讨论

笔者主要研究了如何在专利文本和网络文本的基础上运用LDA主题模型和WMD相似度计算法,实现对快递物流业的研发热点和发展趋势的分析。得出的结论有:①在智能物流技术领域方面,根据专利申请数量和专家的关注度,可以发现无人机、机器人、智能快递柜等智能化物流设备的研发是最受欢迎、最热门的领域,其研发阶段已经步入高峰期,各个快递物流企业高度重视快递物流业新的变革模式;②在物流信息化技术领域方面,目前在分拣、运输、配送等物流各个环节已经逐步开始实现信息化,如库存管理系统、客户订单管理系统、自动分拣系统等都成功地启动应用;③在分拣运输技术领域方面,其主要关注热点是如何实现货物分拣、运输等过程的智能化、自动化和信息化,虽然目前已经实现了全自动分拣系统的推进,但是在分拣车、分拣机器人等分拣设备方面的研发仍然不足,需要继续在这方面寻找突破;④在仓储包装技术领域方面,其关注热点是向绿色化发展,提高快递包装的循环利用率,减少浪费;根据不同货物的大小、需要冷藏、保温等特性设计出与之相适应的包装盒、包装袋等;同时,要合理利用仓库空间,设计更适合的库存模型和仓库管理系统实现库存的集中管理。

同时,也存在一定的局限性,包括以下几个方面:①技术领域划分的问题。由于物流的分拣、配送、无人机、智能等各个领域相互渗透,在分拣运输领域也会融入智能物流领域的技术,因此,基于各个技术领域关键词的专利检索会存在与其他技术领域重合的专利文献,造成4个技术领域的专利数量总和会超过顺丰速运有效的专利数量,但整体上并不影响对各个技术领域的分析。②输出文本的效果偏差。由于专利文本是与技术直接相关的文本,因此,主题提取的关键词大部分是与物流领域的技术专业用语,而网络文本偏向日常用语,对计算相关度的结果有一定的影响,造成输出效果与预期的有一定的偏差。因此,还需要进一步优化模型和算法,但文中计算输出的网络文本仍然有较高的相似性。

猜你喜欢
顺丰专利申请专利
从一件无效宣告请求案谈专利申请过程中的几点启示和建议
山西顺丰鼓励有技能的快递小哥返乡创业
2018年河南省各省辖市及直管县(市)专利申请量统计表(1月)
韩国AI内容专利申请数5年激增10倍
“顺丰”快递的成功之道
品牌意识成就今日顺丰
专利申请三步曲
顺丰联手“三通一达”反水对抗阿里菜鸟阵营
2007年上半年专利授权状况统计