陆 杉,陈宇斌
(湖南商学院 经济与贸易学院,湖南 长沙 410205)
大数据(Big Data Analysis, BDA)被定义为庞大复杂的数据集,其范围包括大量数据库云服务器。他超出了传统系统的存储、处理、管理、解释和可视化的技术能力空间。随着大数据应用研究不断发展,大数据的主要属性现已扩展成“体积(volume)”“速度(velocity)”“变化(variety)”“验证(verification)”和“价值(value)”的全新“5V”概念(Addo-Tenkorang和Helo,2016)[1]。通过大数据分析,能发现隐藏的且有价值的信息和结论,提高商业效益和运营效率,开拓新的市场和机会[2]。图1简单说明了科学背景下的大数据分析模型。
图1 科学背景下的大数据分析模型资料来源:作者整理所得。
从企业层面看,大数据的分析应用对提高企业绩效有很大影响(Akter等,2016)[3]。通过提高大数据分析能力,供应链成员企业可以创造新的产品和服务,提供更好的客户服务。从政策层面看,国务院对大数据的分析应用给予了莫大的支持,国务院《促进大数据发展行动纲要》中明确提出“建立标准规范体系,推进大数据产业标准体系建设”[4]。目前,伴随着供应链的不断发展,商业模式的不断创新,供应链管理中的各种问题不断涌现,如各成员企业之间存在着信息不对称,这种信息不对称导致了企业之间协调困难和效率低下,从而影响供应链整体绩效。而大数据分析技术的出现很好地解决了这些难题,通过利用大数据技术对供应链中各成员企业间的需求、生产以及采购等信息有了更精准的把控,减少了供应链中不必要的损失。然而,研究表明,供应链大数据分析从2012年开始被学术界关注,目前存在着的共识有限。国外供应链与大数据的结合分析研究相对成熟,但仍处在探索阶段,而国内这一领域的研究还刚刚起步。鉴于此,本文试图以综述的方式探讨国外供应链中的大数据分析应用,一方面,对已有研究进行提炼和总结;另一方面,希望能尽快填补领域内研究不足,为国内供应链中的大数据分析应用研究提供方向性指导。
通过WOS(Web of Science)数据库的相关文献研究,发现国外对供应链整体的大数据分析主要集中于战略决策、网络设计以及敏捷性与可持续性等方面,而供应链过程中的大数据分析主要集中在需求计划、采购、生产、存货、物流与配送等方面。
1.供应链战略决策。Matthew和Noble(2017)表示,大数据分析通过提供有关组织支出模式的准确信息,支持企业进行战略决策。例如,大数据可以提供有关任何投资回报(ROI)的准确信息以及对潜在供应商的深入分析[5]。而战略采购决策不仅考虑了成本、质量和供给,还考虑了供应商的战略能力[6]。大数据处理能力作为评价因素之一,通过运用层次分析法和模糊综合评价法选择供应链合作伙伴,筛选能够适应未来大数据挑战的供应链合作伙伴[7]。近年来,大数据分析在产品设计和开发中受到了广泛关注。大数据分析可以提高产品适应性,并增强产品设计者的信心。客户购买记录和在线行为是客户大数据的信息,可帮助设计人员了解客户需求,使用客户意见数据来识别产品特性和预测趋势[8]。在重要行业内,大数据的价值体现在使用客户意见数据极性来识别产品特性和预测趋势(Boratto等,2017)[9]。
2.供应链网络设计。供应链网络设计中的大数据分析带来了竞争优势和供应链弹性[10]。Wang等(2016)开发了一个混合整数非线性模型,该模型利用随机生成的大数据集为客户需求、仓库操作和运输选择配送中心的位置,并假设使用营销智能工具对行为数据集进行了分析,结论证明大数据分析可以获取客户的额外信息(例如服务级别和罚款成本数据),从而为设计复杂的分销网络创造了机会[11]。Prasad等(2016)研究了大数据分析在特定人道主义供应链网络中设计灾难救济、医疗保健和教育等干预措施的应用。由于人道主义数据具有各种大数据属性(数量、种类、准确性、速度和价值),因此大数据分析可以通过具有抗灾能力的人道主义供应链产生卓越的人道主义成果[12]。
3.供应链敏捷性和可持续性。目前,许多学者在致力于研究高级供应链敏捷性(Giannakis和Louis,2016)[13]和供应链可持续性(Hazen等,2014;Wu等,2017;Zhao等,2017)[14-16]。比如,Zhao等(2017)在绿色供应链管理的多目标数学模型中集成大数据科学的数据采集和数据质量控制;Wu等(2017)将社交媒体数据与公司的财务和运营数据相结合。此外,运用专家判断也有助于工业发展的可持续性,加强其抗击风险和不确定性的能力。
除了以供应链整体作为分析对象进行大数据分析外,很多学者针对供应链不同过程进行了相关的大数据分析。
1.需求计划。许多供应链管理人员热衷于利用大数据改进需求预测和生产计划[17]。Balaraj等(2013)认为,可以通过客户行为大数据分析预测实现业务服务创新[18]。大数据分析使我们能够感知需求信号、确定最优价格并跟踪消费者忠诚度数据,有助于发现新的市场趋势,目前最大的挑战是硬件和软件的升级以及大数据算法的架构(Hassani和Silva,2015)[19]。Arias和Bae(2016)将历史真实交通数据和天气数据纳入其预测模型,以估计电动汽车的充电需求。该模型能够识别充电需求高的地点和时间,便于公用事业运营商规划发电计划[20]。Kim和Shin(2016)利用大数据开发了一个预测模型,以估计短期航空乘客的需求,结果证明该模型对短期乘客数量估计相当准确,极大地提高了机场的运作效率[21]。
2.采购。采购作为一种战术性和可操作性的决策,由一系列的拍卖机制和承包合同组成[22]。供应链大数据分析可应用于采购,以管理供应链风险和供应商绩效。Fan等(2014)提出了一个利用内部和外部大数据构建供应链风险的框架,该框架支持实时供应链采购风险管理监控、应急计划和决策支持[23]。Schlegel(2014)还提出了大数据预测分析,用于管理供应链风险,大数据预测分析可帮助供应链经理识别、评估、减轻和管理供应链采购风险[24]。还有学者通过案例研究探讨大数据在支持采购流程和实施采购做法方面的作用,并且强调了该类采购做法对企业的好处[25]。
3.生产。大数据分析在生产领域的应用已较为广泛。随着信息和通信技术及其在制造业中应用的不断创新,制造业中的大数据时代也随之兴起,发展中的数据挖掘技术为实现实时、动态、自适应、精确控制的智能生产目标铺平了道路[26]。大数据分析已被用于高效的制造智能,越来越多企业在多模式传感器、智能设备和机器人的半导体生产和制造时采用物联网和大数据分析[27]。Katchasuwanmanee等(2016)采用大数据方法,从工厂内部和外部获取大量数据,分析工作流、数据流和能量流之间的相关性,为降低能耗提供实时方案[28]。Kwan(2016)的研究说明了地理知识生产过程中由传统的“小数据”向“大数据”转变所带来的重要变化,并强调对知识生产过程以及过程中使用的数据和算法进行批判性反思的重要性[29]。
4.存货。目前,关于存货环节的大数据应用分析研究的文献虽然较少,但存货环节中的大数据分析却非常重要,合理安排好存货量可以更好地实施整条供应链运营。在库存管理中,通过将内部生产系统与外部合作伙伴(供应商和消费者)联系起来,可以提高大数据的效益。自动化库存控制系统与大数据生成之间的关系十分重要,大数据分析可以收集数据之间的相互关系,并优化库存订购决策(Wang等,2016)[30]。除此之外,利用在线点击流和离线购买大数据,通过识别统计上显著的点击流变量,并实证研究点击流跟踪在非交易网站上的价值,用于改进库存管理[31]。
5.物流与配送。大数据分析在物流、配送和运输中的应用研究较为普遍。大多数第三方物流提供商(第三方物流公司)都在大数据能力方面投入巨资,以确保无缝供应链集成。为了保持竞争力,在物流和运输公司中应用大数据分析至关重要。Mehmood和Graham(2015)在研究中使用案例说明了如何通过使用大数据共享交通信息以有效改善城市医疗服务[32]。预测性和规划性大数据分析解决了许多海运公司的规划问题(Emrouznejad,2016)[33]。Zhong等(2015)提出了一种从支持射频识别(RFID)的海量商场物流数据中挖掘拥有多次轨迹的大数据方法,创造性地引入RFID-长方体来建立数据仓库,使支持RFID的物流数据在操作方面高度集成,并对物流作业者和物流机械进行定量评价,能够更好地指导用户实施相关物流决策[34]。随着智能物流的发展,海量的物流数据成为大数据的来源之一。构建具有大数据挖掘和分析能力的物流信息平台,充分利用海量的物流数据是智能物流的必然趋势[35]。还有学者提出通过大数据分析探索电子商务物流业务模式[36]。事实上,大数据还可以支持供应链中的端到端可见性,并创建更敏捷的物流和供应链战略。
以WOS数据库为来源,通过探索发现许多关于供应链中大数据应用分析的出版物,这些出版物都有“大数据(Big Date)”与供应链及其相关关键词。供应链整体分析关键词包括“战略决策(Strategic Sourcing)”“网络设计(Network Design)”和“敏捷性与可持续性(Agility and Sustainability)”,供应链全过程分析关键词包括“需求计划(Demand Planning)”“采购(Procurement)”“生产(Production)”“存货(Inventory)”和“物流与配送(Logistics and Distribution)”。共检索得到108篇,按照内容进行分类统计,结果如表1所示。
表1 以“大数据”和供应链及其相关关键词结合检索的出版物分类统计
图2 2012-2017各年间供应链大数据分析文献发表量
图2是检索得到的2012-2017各年间发表的关于供应链中大数据分析的文献数量统计,以便更加清楚地了解总体研究走势。
由图2可知,供应链中的大数据分析研究从2012年开始被学术界关注,之后其研究一直呈上升趋势,说明学术界近几年对供应链中大数据研究内容越来越感兴趣。但为了进一步了解供应链中大数据应用的研究走势,对2012-2017年且以“大数据+供应链”为关键词的检索方式所得的文献数量进行统计,共51篇,并对其相同研究领域文献引用频次进行分类统计,发现学术界首要关注的是物流与供应链管理(Logistics and Supply Chain Management/136次),其次是需求计划与预测(Demand Planning and Forecasting/128次)、生产(Production/76次)。同时,笔者也对前面第一种检索方式所得到的108篇文献,根据相应的具体研究内容分类统计了不同年份的文献引用频次,结果如表2所示。
表2 2012-2017各年不同研究内容引用频次分析
资料来源:作者整理所得。
通过表2中2012-2017年间的引用频次可以明显看出,供应链中不同环节的大数据运用越来越广泛,特别是物流和运输方面,学术界对其研究兴趣在不断提升。当然,学术界对供应链中其他环节的大数据分析应用研究兴趣同样在不断提高。总之,两种检索方式所呈现的供应链中大数据研究方向是大体一致的,都反映了学术界在供应链中大数据分析应用研究领域内向上攀升的研究走势。
综上所述,通过国外供应链大数据分析发现,大数据对于供应链的生存与发展存在巨大的应用价值,学者们对供应链中大数据分析应用研究给予了极大的关注,相信未来各行业供应链都离不开大数据分析应用。
伴随着大数据的概念进入全球商业圈,社会各行业都在致力于大数据技术的深入研究,大数据被科技企业看作是云计算后的又一巨大商机,包括IBM、微软、谷歌、亚马逊等一大批知名企业纷纷掘金这一市场;另外,很多初创企业也开始加入大数据的淘金队伍中,如Cloudera、Clustrix等。谷歌公司利用全球每天30多亿条的搜索记录建立了一个系统,在2009年甲型流感爆发之前就开始在美国进行流感预报,并以此成立了“谷歌流感趋势”服务平台。美国雷神公司(Raytheon Company)开发了智能工厂,基于处理来自不同来源(传感器、互联网交易、数字记录和数据模拟)的大数据的强大能力,能够实时控制生产过程的多个要素[37]。
但纵观国内大数据服务提供商市场,大数据这一概念,对国内企业来说或许还稍显陌生,在最具影响力的前30家企业中,几乎还是一片空白。相对来说,国内大数据起步较晚,但依旧有些企业不遗余力地投入大数据这片蓝海,并且发展态势良好,如阿里巴巴、华为以及百度等公司。同时,国内学术界对各行业供应链大数据应用研究的关注度在不断提升。有学者认为,金融服务行业结合大数据技术可以有效地预防和惩治网络犯罪等行为[38]。徐曼等(2017)对大数据驱动下的医疗与健康决策行为进行了研究,提出大数据是提高医疗效率和品质的重要手段[39]。智能云制造新型产业链结合大数据服务体系可以形成有效的产业制造创新机制,未来的大数据智能云制造具有非常大的发展潜力(孙立,2016)[40]。
目前,在不同行业供应链中的大数据应用实践过程中,一个共同的目标是通过在适当的时间为适当的用户提供适当的信息,充分利用数据来提高生产力。大数据分析(BDA)在包括金融、科技、医疗保健、消费、能源和制造在内的不同行业供应链中都有应用,并都有其相应的数据处理方式和商业价值,如图3所示。
图3 大数据分析在不同行业供应链中的应用资料来源:同行研究-大数据分析调查。
根据图3中的大数据分析调查统计,发现银行/金融行业供应链所占比接近一半,达到43%,说明其对大数据应用的高度重视;高新科技行业占比14%,排在第二;之后依次是医疗、消费、能源和制造行业供应链。
表3 不同行业供应链中大数据分析应用的商业价值
表3是作者针对图3统计的银行、科技、医疗、消费、能源和制造等行业供应链中大数据的应用情况,进一步查阅相关文献资料获取不同行业中大数据的商业价值。结果发现,大数据在不同行业中拥有不同的数据处理方式,并相应地带来了多种商业价值,比如制造/高科技行业,其拥有的产品故障分析、专利记录检索以及智能定位等数据处理方式带来的是产品优化、成本降低以及问题快速解决等市场商业价值。正因如此,才能体现大数据在行业中的应用价值。
单就国内而言,据2017-2023年中国大数据金融行业深度分析及投资风险评估报告相关数据显示,中国大数据IT应用投资规模以五大行业最高,其中以互联网行业占比最高,占大数据IT应用投资规模的28.9%,其次是电信领域(19.9%),第三是金融行业(17.5%),政府和医疗分别为第四和第五。而在国内的金融行业中,呈现出银行占41.10%,证券占35.10%以及保险占23.80%的大数据开发应用投资结构。*数据资料来源于中国产业信息网(www.chyxx.com)中“2017-2023年中国大数据金融行业深度分析及投资风险评估报告”摘要,出版单位:智妍咨询集团,报告编号:R554628,出版日期:2017年8月。
通过以上分析可知,世界各行各业正在将实现大数据分析应用作为一个极为重要的发展目标,尤其是对于数据导向的行业,实现大数据分析应用显得十分必要。
本文详细地回顾了国外供应链中大数据分析应用研究,阐述了国内外不同行业供应链中的大数据应用及其商业价值,总结分析了领域内的相关文献,为学术界和实务界更好地理解已有研究提供了借鉴,同时也补充和完善了国内供应链中的大数据分析应用理论。但是,供应链中大数据分析应用研究并非一蹴而就之事,其未来的研究仍然很严峻。事实上,国内外对于供应链中大数据分析与应用研究都还很少,特别是国内,还处于萌芽阶段,这要归根于供应链与大数据之间的作用机制过于复杂,要素联系多,并且大数据技术还处于发展阶段。但不可否认,大数据运用的加入为供应链内各成员企业的发展注入新的活力。
基于前文分析可知,大数据分析应用已成为全球许多行业的热门话题,但在分析技术和信息挖掘方面有很大的进步空间。大数据分析在端到端供应链中具有重要应用,从销售终端(POS)的需求数据、零售商数据、交货数据、制造数据,直到供应商数据。大数据分析支持所有供应链活动,包括战略采购、网络设计、需求规划、采购、生产、库存,直至物流和分销。大数据源的有效使用改进了供应链中大量流程。深度的大数据分析可支持开发响应迅速、可靠和可持续的供应链运行,大数据分析能够在复杂的全球供应链中处理大量数据集。国内外都特别强调将大数据分析应用于行业供应链,支持行业供应链大数据应用能有效提高行业供应链整体绩效,但存在一个容易忽视又非常重要的问题即大数据应用的安全性。在数据时代,信息安全备受关注,供应链成员企业的什么类型信息应该共享,什么类型信息应该保密,似乎无清晰的界定。供应链中大数据共享带来更多效率的同时,也带了更多的不确定因素。对于供应链中大数据的信息安全问题,一些学者给予了关注,如,何培育(2017)提出不仅要对互联网金融的大数据应用模式及其价值进行研究,还要重点关注互联网金融中的数据安全问题[41];又如,大数据给医疗行业既带来机遇,同时也带来了新的挑战,带来了新的思维方式和数据共享方式,同时带来了信息泄露等一系列挑战[42]。
当前,供应链中大数据分析应用研究是一个充满创新性和挑战性的新兴研究方向,尽管在学术界有一些理论借鉴成果,但还存在不少待完善之处。第一,研究方法单一。就已有的成果而言,基本属于定性研究,缺乏定量研究,无数据支撑,缺乏案例研究。第二,研究的理论基础单薄。供应链中大数据应用研究还属于全新的研究领域,缺乏理论构建体系,使得研究的深入受到制约。第三,研究视角不够开阔。首先,“供应链+大数据”的视角已定型,没有“供应链+大数据+”的研究意识。其次,研究的创新性还未得到体现。作为一个全新的研究领域,鲜有学者对其与过去没有应用大数据的传统供应链不同点进行探究,对其创新点还没有探究清楚。另外,学术界对于供应链中大数据应用的安全性问题认识还有待加强。
鉴于以上总结分析,下文将对供应链中大数据分析应用研究进行合理展望,主要分为三点:
1.未来供应链中大数据分析应用研究方法应以实证研究为主。目前,就国内领域内的文献资料而言,基本是纯理论研究,缺乏数据论证,理论与实践没有实现数据上的对接,急需融入新的实证方法,构建供应链中大数据分析应用体系。也可采用单案例、多案例以及案例与实证结合的方法进行研究,为国内不同供应链企业提供实证分析案例,指导供应链进一步发展。
2.随着供应链中大数据应用研究的深入,夯实理论基础研究可为供应链中大数据应用研究的长久进行提供条件。目前,少有研究意识到采用供应链理论和大数据理论结合进行研究,大多数研究是单从供应链理论角度进行研究,如从供应链绩效理论入手,探究大数据运用如何提高供应链绩效。将来可以将大数据理论引入研究,包括大数据的成因、运行规律以及核心思想等。也可以考虑供应链的构架问题,比如,分析供应链中大数据应用的驱动因素。除此之外,可以加入相关学科理论。另外,可在供应链理论、大数据理论以及相关学科理论的基础之上,构建供应链大数据应用理论基础,为供应链中大数据应用提供理论支撑。
3.供应链中大数据分析应用研究的视角应多样化。首先,仅对应用大数据的供应链进行研究的创新性还远远不够,当前急需对传统供应链与应用大数据的供应链的差异问题进行研究。分析应用大数据后的供应链在发展过程中,对供应链企业在市场需求预测、产品研发、产品与服务等方面所产生的重要作用及所带来的优势。将前后进行对比研究,探究应用大数据后供应链与传统供应链的差别。其次,认识到“供应链+大数据+”的研究趋势。比如,应用目前的区块链(Blockchain)技术,实现“供应链+大数据+区块链”。虽然“供应链+大数据”实现了大量信息的共享,增强了企业的运营效率,但同时存在许多隐藏的威胁——数据安全问题。供应链中大数据分析应用包括大数据基础设施安全威胁、大数据储存安全威胁、隐私泄露问题、数据访问安全威胁、针对大数据的高级持续性攻击等一系列威胁。而“供应链+大数据+区块链”会较好地避免这些潜在的威胁。基于区块链本身提供的提高安全性、可追踪、提供证据、开发数据、文本电子化、降低成本、数据管理以及提高效率等优势,使供应链中的大数据分析应用特别是供应链金融层面的应用得到保障。因此,“供应链+大数据+”极有可能成为未来领域内的研究方向。