数据分析在运营管理中运用的研究述评

2021-12-09 01:54周楷竣张宇

上海管理科学 2021年5期

周楷竣张宇

摘要：在这个全球化时代，大数据正日益成为各行各业都需要考虑的重要企业组织力量。数据分析的存在为获取、存储和分析各种来源产生的海量数据以获得增值提供了更多的功能。随着数据可用性的增加，以及机器学习和优化方法的最新进展，数据分析在运营管理问题上的应用越来越多。在本文中，我们回顾了数据分析在运营管理中的最新应用，试图深入研究“大数据”在运营管理中的应用和分析，以及该研究领域的趋势和前景。

关键词：数据分析;运营管理;机器学习

中图分类号： F 062.5

文献标志码： A

A Review of Researches on the Application of Data Analysisin Operation Management

ZHOU Kaijun ZHANG Yu

（School of International Business Administration， Shanghai International Studies University， Shanghai 201600）

Abstract： In this era of globalization， big data is increasingly becoming an important corporate organization force that all walks of life need to consider. The existence of data analysis provides more functions for obtaining， storing and analyzing the massive data generated from various sources to obtain value-added. With the increase in data availability， as well as the latest developments in machine learning and optimization methods， data analysis is increasingly used in operational management issues. In this article， we reviewed the latest applications of data analysis in operation management， and tried to deeply study the application and analysis of “big data” in operation management， as well as the trends and prospects of this research field.

Key words： data analysis; operation management; machine learning

1 全渠道零售和地理位置的优化

1.1 全渠道零售

全渠道零售是企业为了满足消费者任何时候、任何地点、任何方式购买的需求，采取实体渠道、电子商务渠道和移动电子商务渠道整合的方式销售商品或服务，提供给顾客无差别的购买体验（李飞，2013）。但是全渠道零售也对企业的地理位置以及库存管理提出了更高的要求。Glaeser等人（2018）考虑了一个真正的“在线购买，实体店取货”零售商所面临的位置问题，这些零售商通过停放在容易到达的地点（如学校或停车场）的送货卡车来完成在线订单。零售商需要决定在什么地点和时间摆放卡车，以实现利润最大化。为了解决这个问题，文章首先构建了一个随机森林模型需求预测在给定的位置在一个给定的时间，使用一组不同的独立变量，如人口属性的位置（总人口、人口与高等学历，中等收入，等等），零售商的业务属性（如零售商提供送货到家服务，是否在这个位置），和其他位置属性（例如，附近竞争企业的数量）。然后采用固定效应回归来解释同类相食效应。利用该零售商的数据，文章展示了基于贪心构造和交换思想的启发式方法，以及结合随机森林和固定效应模型，最终使收益提高36%。

计国君等人（2016）构建了大数据驱动下的全渠道运营服务创新决策框架。全渠道运营会加剧产品供给与需求间的不匹配性，所以数据信息就变得非常重要。作者从大数据中获得全渠道运营的服务创新相关因素，基于战略顾客行为的普遍性与全渠道竞争的现实性，构建基于大数据驱动下全渠道运营服务创新的决策框架。由于贝叶斯网络可以有效利用所有可用的数据，诊断出导致高消费者偏好的原因，并将专家知识表示成一组变量间的关系。鉴于此，文章借助贝叶斯網络连接各种数据流的数据，在全渠道链中预测市场服务需求，建立基于大数据的全渠道运营服务创新决策框架。Acimovic和Graves（2014）研究了如何管理大型在线零售商的全渠道运营。文章主要内容是解决如何以最小化的出港运输成本来满足每个顾客订单需求的这个问题。作者提出了一种启发式的实现决策方法，通过最小化当前的出境运输成本，加上对未来出境运输预期成本的估计来实现。这些估计是从一个运输线性规划的对偶值得到的。通过对行业数据的实验，该模型在透视的前提下捕获了36%的机会缺口，从而使出港运输成本降低了约1%。

1.2 地理位置路径优化

除了全渠道零售外，地理位置的路径优化也是运营管理的研究重点。He等人（2017）研究了如何为电动汽车共享服务设计服务区域的问题。文章主要内容是研究Car2Go、DriveNow和Autolib这类汽车共享公司如何规划顾客的服务区域问题，即在哪些地区允许顾客取车和还车;同时服务区域反过来又决定了公司的投资决策，比如车队需要多大，充电站应该设在哪里等。这种地理设置的主要难点在于顾客用车方面存在不确定性，这取决于服务覆盖了哪些地区。为了解决这一问题，作者提出了一个整数规划问题，其中客户的用车通过效用模型表示;由于对这种效用模型进行校准的数据有限，文章使用分布鲁棒优化方法（Delage and Ye，2010）来计算客户用车过程中的不确定性。利用来自Car2Go的数据，作者将这种方法应用于圣地亚哥的服务区设计，并将这种方法与其他方法相对比，证明了该方法确实可以为公司带来更多的回报。

2 库存管理

Ban和Rudin（2019）考虑了一种数据驱动的库存管理方法。这篇论文研究的背景是当一个人观察到需求，同时有可能预测需求的特征，如天气预报或经济指标，消费者价格指数等。为了在这种情况下做出最优库存决策，通常情况下人们可能会考虑建立一个依赖于特性的需求分布，然后为该分布找到与给定特性实现相对应的最优订单数量。然而Ban和Rudin（2019）的论文提出了两种替代方法。第一种，基于经验风险最小化，涉及通过解决单个问题来找到订单数量，其中决策变量是将特征映射到订单数量的决策规则，目标是最小化基于样本的成本估计。第二种方法是利用核回归建模条件需求分布，并应用排序算法确定最优订货数量。文章利用英国一家大型教学医院的数据，并将这两种方法应用于医院急诊室的护士人员配备问题。研究发现在样本外成本方面，所提出的方法比最佳实践基准测试高出24%。

類似的，Bertsimas和Kallus（2019）研究了如何根据以往的销售数据更好的预测新产品销量的一种方法，进而更好的进行商品的库存管理。作者首先建立一个机器学习模型来预测不确定量作为上下文信息的函数，即在文章研究的库存示例中将需求预测为产品属性的函数。然后使用机器学习模型来获得一个特定环境的条件分布，就这个条件分布来解决库存样本均值近似问题。在库存设置中，文章考虑使用回归树预测给定产品属性向量的需求。如果沿着回归树运行产品的属性向量，将得到一个点预测，但是通过考虑历史需求，还可以得到条件分布的估计。针对特定类型的机器学习模型，作者给出了这个过程的理论保证，证明了该过程随着观察量的增长而渐近最优性。文章最终将该方法应用于一个真正的分销问题，即需要在不同零售地点管理不同产品的库存的媒体公司。作者构建了需求的机器学习模型，将其作为商店位置、电影属性（如类型、烂番茄评分、票房收入等）和其他大规模信息（如对电影的本地化搜索查询）的函数。最终结论展示了该方法如何能够将朴素方法（不考虑上下文数据）和完美预见方法（在实现需求之前就知道需求）之间的成本差距缩小88%。

周思雨（2019）等人在研究库存管理策略时还考虑了不确定性的影响。客户需求不确定性会导致需求信息偏差逐级放大进而产生“牛鞭效应”，这种不确定性会严重影响库存管理策略。为实现需求不确定情况下两级运营系统成本最优，作者提出使用鲁棒优化方法的联合补货策略，将鲁棒优化理论运用到求解运营系统补货的过程中，构建一个非线性混合整数规划模型以计算两级运营的总成本。通过总成本的变化来反映运营系统的性能，采用鲁棒优化法求解运营系统的最小总成本，并使用外部和内部两层迭代算法获得供应商和零售商的补货周期及补货数目。实验结果表明，该方法可以有效降低需求不确定性对运营系统的影响，减少运营系统的总成本。与传统的运营策略ERI和AR相比，该策略也可有效降低运营系统的总成本。

3 结论与展望

3.1 结论

本文主要对于数据分析近几年在运筹学中的运用做了一定总结，主要内容是关于运营管理优化。利用机器学习和优化方法，我们可以使用大规模数据用于复杂的决策制定。从文中的回顾我们可以看出在机器学习以及数据分析的介入下，运营管理的成本与之前相比均有了明显提升。在如今万物互联的时代，海量的数据会为我们提供巨大的隐藏信息，数据分析为我们获取这些信息提供了可能。与数据分析相结合是运营管理未来发展的一个重要方向，希望本文可以为学者今后研究这方面的内容提供一些帮助。

3.2 未来研究展望

由于机器学习模型大多数都是“黑盒”，因此可解释性就是未来研究运营管理模型的一个重要研究方向。可解释性是指一个可解释的模型是一个人可以很容易地看到和理解模型如何将观察映射到预测的模型（Freitas，2014）。可解释性是机器学习的一个主要研究领域，可解释模型可以提供黑盒模型（如随机森林和神经网络）无法提供的对预测问题的洞察。由于机器学习模型通常不会直接影响决策，而是向决策者做出预测或建议，因此在许多情况下，决策者不太可能接受机器学习模型提出的建议，因为他们没有能力理解建议是如何提出的，例如在医学领域。此外，也有越来越多的立法要求影响用户的算法必须能够对他们的决定提供解释。随着基于机器学习的不断发展，可解释的决策将成为运营管理的一个重要研究领域。

另一个可能的研究方向是“预测优化”的新思路。前人的研究大多数依赖于“预测然后优化”的范式，即首先使用数据构建预测模型，然后将该模型嵌入优化问题的目标函数中。然而，这样的模型不一定会导致好的样本外决策。Elmachtoub和Grigas （2017）的论文提出，与其估算模型，不如将测量预测性能的损失函数最小化，该论文建议将与模型产生的决策的目标值相关的损失函数最小化。文章展示了这种新的估计方法如何导致在基本问题上优于传统方法的决策，如最短路径、分配和投资组合选择问题。考虑到运营管理的说明性焦点，这项工作强调了重新审视机器学习模型是如何为运营管理中的说明性应用程序构建的潜在机会。

参考文献：

[1]计国君，余木红， Tan K H. 大数据驱动下的全渠道运营服务创新决策框架. 商业研究， 2016（8）：152-162.

[2]李飞. 全渠道零售的含义、成因及对策——再论迎接中国多渠道零售革命风暴. 北京工商大学学报（社会科学版）， 2013，28（2）： 1-11.

[3]周思雨，李学俊，徐佳，等. 基于鲁棒优化的运营联合补货策略. 计算机工程， 2019，45（11）： 309-314，320.

[4]ACIMOVIC J， GRAVES S C. Making better fulfillment decisions on the fly in an online retail environment. Manufacturing & Service Operations Management， 2014，17（1）： 34-51.

[5]BAN G Y， RUDIN C. The big data newsvendor： Practical insights from machine learning. Operations Research， 2018，67（1）： 90-108.

[6]BERTSIMAS D， BROWN D B， CARAMANIS C. Theory and applications of robust optimization. SIAM Review， 2011，53（3）： 464-501.

[7]BERTSIMAS D， KALLUS N. From predictive to prescriptive analytics. Management Science， 2019，66（3）： 1025-1044.

[8]DELAGE E， YE Y. Distributionally robust optimization under moment uncertainty with application to data-driven problems. Operations Research， 2010，58（3）： 595-612.

[9]DAVENPORT T， HARRIS J， MORISON R. Analytics at work： Smarter decisions better results. Boston： Harvard Business School Press，2010.

[10]ELMACHTOUB A N， GRIGAS P. Smart “predict， then optimize.” Working Paper， Columbia University， New York， 2017.

收稿日期：2021-07-28

基金项目：上海外国语大学第四届导师学术引领计划项目“董事会异质性对逆向跨国并购结果影响研究——基于大数据分析技术

作者简介：周楷竣（1994—），男，辽宁辽阳人，上海外国语大学硕士研究生，研究方向商业分析，E-mail： zhoukaijun12@126.com。