陈楠
摘要: 在奥密克戎的冲击下,居民对相关药品的需求激增,使得医药资源在一定时期内较为紧张,但各省市对资源的需求并非在同一时段,使得医药企业供应链管理的难度加大。基于大数据管理技术,分析了大数据在医药行业供应链管理中的应用流程,运用实证分析方法,得到以下研究结论:一是根据学术界的研究成果与医药企业供应链管理实践,在医疗行业供应链管理系统中主要包含分布式流向数据管理、医药行业数据管理和医药终端智能管理3个主系统,在主系统下包含12个子系统。二是在海量数据管理中,需要对数据进行清洗,保证数据质量,数据质量的高低会对研究结论产生重要的影响。三是对比主系统和子系统的权重值可以判断,在医疗行业供应链管理过程中,终端智能管理和数据清洗十分关键。
关键词:大数据技术;医药行业;供应链管理;数据清洗;智能终端
中图分类号:F274 文献标志码:A 文章編号:1008-4657(2024)02-0069-07
0 引言
近年来,随着计算机技术的快速发展,信息数据的数量和更新速度都超乎想象,这被统称为大数据,大数据被广泛应用于科学研究、商业活动等领域[ 1 ]。对于企业而言,大数据能够为企业优化工作流程,带来巨大的商业价值。在多年的经济高速增长之后,经济发展速度减缓,尤其是在新冠疫情的冲击下,我国经济发展有了新的变化和要求。大数据的出现使得信息共享更加透明,创新、智慧化凸显。企业要想取得持续发展,就需要大胆创新,适应时代的要求。在新的竞争环境下,市场竞争包含多方面的内涵,这其中就有企业间供应链的竞争,企业想要有更好的发展保障,就需要有较好的供应链管理水平。对于医药企业而言,在近期奥密克戎的影响下,加上防控政策的及时调整,市民用药需求激增,对于医药企业的供药能力提出了挑战。在现代化的信息技术中,大数据、物联网有了较大的发展,管理方法也得到不断创新,应用前景广泛,使得供应链进入到了全新的发展阶段——智慧化管理阶段。
在市场需求激增的情况下,医药企业面临诸多挑战:医药行业数据共享难、药物流向汇聚难、医药行业数据应用难。药品的流向难以控制主要是药物的来源比较广、变化快、缺乏统一管理,在数据汇总时操作不规范,导致数据分布较为杂乱。数据分享困难主要是由于在医药行业内部缺乏统一的数据管理体系,医药公司的管理终端五花八门,数据端口不统一,统计的口径也不一致。
1 文献综述
在当今世界的医药行业中,美国、瑞士、德国实力较强。根据全球医药企业排行榜,美国的医药企业遥遥领先,国内医药企业和国际顶尖企业还存在不小差距。张树山等[ 2 ]认为美国的医药行业发展较早,在供应链管理上已经形成了几种较为成熟的模式:产品导向管理模式、研发导向管理模式和市场导向管理模式。这些模式的共同特点是有利于企业的降本增效,根据市场的变化及时调整发展方向,积极覆盖医药行业供应链的各个环节。在行业规范性管理上,美国食品药品监督管理局推出了详细的药品管理规范,解决了数据不统一导致的管理效率低下的问题,为我国医药行业供应链管理提供了参考。
目前,大数据技术发展日益成熟,在金融、政府管理等方面得到广泛应用。祝由等[ 3 ]认为,大数据技术在医药企业决策上也有用武之地,借助大数据管理平台整合医药企业的供应链信息,将业务订单、库存、药品经销商等信息综合运用,可帮助企业进行科学决策。大数据技术在医药企业供应链体系中的运用需要企业具备必要的数据处理能力,否则数据接入会对公司运作产生不利影响。在供应链管理方式上,从线下到线上的管理顺应了医疗服务需求升级的新趋势,对零售终端的管理成为医药企业发展的新方向。王昕天等[ 4 ]指出在新的供应链中,由于销售和采购都实现了线上管理,大部分信息一时间难以同步至线上,引发出了信息孤岛问题,这是在大数据技术运用中需要注意的问题。夏杰长等[ 5 ]认为医药企业可以建立线上线下的双向管理平台,实现销采在系统中的统一管理。在现有的供应链管理中,药品的销售方向、类型、数量等等,都是医药企业竞争的关键所在,对其管理要基于丰富的医药行业数据,对药品流向进行快速分析,挖掘数据的潜在价值,避免产生信息滞后的问题。根据中国医药健康信息化联盟所发布的公开信息,在2021年的年度调研报告中,大多数医药企业没有合适的供应链管理系统。
目前,大数据技术被广泛运用于各行各业,但是大部分学者的研究焦点都集中在政府管理、生产制造等热门领域,对医药行业的运用研究较少。从研究方法来看,在以往的研究中大多是定性研究,定量研究较少。本文采用了实证研究方法,既有理论上的推导,也有实证上的理论验证,将定性和定量研究的方法结合起来,构建了大数据技术在医药行业供应链管理中的深度应用模型[ 6-7 ],整合流向管理、主数据管理等资源,优化我国医药行业的供应链管理水平,希望能为医药企业的精细化决策提供技术支持。
2 医疗行业供应链管理系统分析
本文主要采用物流系统分析法得到供应链管理中的关键信息,结合大数据技术,为供应链管理系统建设提供借鉴。物流系统分析法通过分析生产流程过程发现企业所面临的问题,其具体做法是将企业生产工艺的全过程,包括进货、选料、制造、包装、存储、发售、运输等各阶段,按顺序得到具体流程,然后再对各阶段逐项进行分析,以发现可能遭遇到的各种困难及其潜在的阻碍因素。在供应链管理系统中主要包含分布式流向数据管理、医药行业数据管理和医药终端智能管理。
2.1 分布式流向数据管理
分布式流向数据管理由多个模块所组成,有文件管理模块、药品流向采集模块、任务管理模块、元数据管理模块、药品流向预处理模块。从理论角度来看,在上述模块中,药品流向采集模块和药品流向预处理模块属于核心模块,对分布式流向数据管理有重要影响。在元数据管理模块中,不断的和业务数据库的实时数据进行交互处理,能够快速对数据进行查询和修正,对经销商的数据和药厂的数据进行协调管理,动态掌握市场信息,实现药品流向的动态管理,在医药行业供应链管理中有着重要的意义和价值[ 8 ]。另外,在系统中还设置有任务管理模块,主要用于统计资源的耗时情况,统计数据流向的到达效率,能够对数据进行有效的收集与预处理。
2.2 医药行业数据管理
医药行业数据是大数据技术在供应链管理中的应用基础,通过对行业数据的收集,建立庞大的数据库,为数据决策奠定基础。在医药行业数据管理中,主要有聚合计算模块、数据同步模块、终端管理模块、用户权限管理模块,各个模块之间并不是独立运作,而是相互之间互相关联,环环相扣。数据清洗模块主要是对大量的原始数据进行识别、整理、归类,清洗完成的数据会进入数据库,在需要时进行自动调取。数据同步则是对原始数据进行动态更新调整,保证数据的有效性,避免“过时”数据造成决策失误。终端管理模块主要是对组织机构进行管理,数据的存储和取用都采用统一的标准,避免了因统计口径的差异造成的数据偏差[ 9 ]。用户权限管理模块则是对数据使用人进行规范管理,在海量数据中会存在部分敏感信息,涉及到企业的商业秘密,分权管理显得十分有必要。
2.3 医药终端智能管理
在医药终端智能分析系统中,设置有数据同步模块、用户权限管理模块、聚合计算模块、终端管理模块。虽然在不同的管理系统中设置有相同的模块,但是功能却不尽相同,在终端智能分析管理中,各个模块的功能偏向于结果运用。在数据同步模块中,将不断增量的药品名称写入Hive模块,并且在数据仓库中进行批量化更新,同时将数据更新设置到ES模块中,使得产品主数据得到应用。在终端管理模块和聚合计算模块中,主要用于构建医药终端画像,指导企业的研发和生产活动[ 10 ]。具体来看,聚合计算模型主要是统计医药企业的购买数量、购买金额、产品销量、产品市场占有率等数据。终端管理模块则是对数据进行自动计算,将结果呈现给用户,使得药企能够根据市场变化情况调整经营策略,同时也能控制药品的流向,有效控制药品的流向,使得需要的人获得需要的药品,对于企业和社会而言都有着重要意义。通过上述分析,可以得到大数据在医药行业供应链管理中的应用模块,如图1所示。
3 大数据在医药行业供应链的深度应用分析
大数据技术在医药行业供应链系统的应用主要可以分为优化数据清洗和优化输出结果两个层次。优化数据清洗是结果输出的基础,在缺少大数据技术支持的前提下,医药企业的生产与市场需求之间往往存在一定的时间差,导致生产计划不能及时满足市场需求。大数据技术的深度应用则会帮助企业通过大数据技术,及时能够获得市场信息,并据此做出科学的判断,调配企业内部的生产资源,满足市场需求。具体来看,大数据技术在医药行业的深度应用如下:
3.1 优化机器数据清洗
在大数据的运用过程中,如何对各类数据进行有效处理是面临的第一个问题,原始数据会对分析结果产生影响,会影响到企业决策的科学性,造成经营风险。数据清洗的主要对象是市场反馈的脏数据,本文主要采用BM25算法识别相似文本。在对中文分词进行识别时,进行深度分詞,主要步骤可以分为:
第一,对输入流进行拆分,利用分词器读取缓冲区的数据。
第二,将字符规范化,采用子分词器处理字符。
第三,将中文外的字符进行过滤,然后对词段进行重新排列。根据新的队列匹配新的词段,形成全新的检索词典,即从词段匹配出分支节点,以此类推向下匹配。数据的匹配规则可以设置为“完全匹配”、“不匹配”和“前缀匹配”三种类型。如果完全匹配则加入数据库,如果不匹配则从数据库剔除,如果前缀匹配则作为新词源的前缀。
第四,循环执行以上三步,对数据集进行重置,记录分词的缓冲区,将新的数据录入分词区。
在计算数据相关性方面,本文主要采用BM25算法评价法,BM25抑制了词频,能够保证返回值趋于一个固定值。根据词频在文档中所出现的平方根,检索结果在其中出现的频率越高,相关性会越来越高。在逆向文档出现的频率中,频率越高,相关度就越低。BM25相关度的计算公式为:
在上述公式中,Q表示为分词结果集合,qi表示词元,d表示为数据集的文本。Wi为qi的IDF值,N指的是数据集的总数。为了避免出现分母为0的情况,特设置系数为0.5。显然,数据集越多,qi的值就越小,Wi的值就越大。dl表示数据集的长度,avgdl表示所有数据集的平均长度,k1表示为b的调节因子。因此,相似度分数score表示为相关系数的累加。
针对大量数据的收集,首先需要进行数据清洗,提升数据质量。根据数据清洗流程,清洗匹配的结果可以分为三类:一是由终端管理器检索ES所形成的高质量清洗数据集;二是经过相似任务查找所得到的中等质量数据集;三是未找到符合匹配条件的低质量数据集。高质量的数据集可以直接完成清洗,进入数据池,中、低质量数据集则由人工进行再次处理,处理流程如图2所示。
大数据技术在数据清洗的深度应用,主要解决了企业数据收集难、数据处理难的问题,基于大数据技术的供应链管理系统既能储存企业大量的信息数据,也能在市场上获取实时的市场信息,建立企业自己的数据库。同时,通过科学的算法,能够对海量的数据进行清洗,保证数据质量,为市场需求预测奠定基础。
3.2 应用结果输出
根据上述优化流程,以大数据技术为基础,对医药行业的供应链全流程进行优化,通过海量的数据信息,能够指导医疗企业供应链管理的方向,使得企业决策更加贴近市场。在三个子系统的输出结果中,难以对结果进行量化,为了使得输出结果更加直观,特对每个子系统进行量化处理,便于对结果进行横向比较。
为了准确计算各系统指标值的权重值,本文采用熵值法进行计算,其原理如下所示:
第一,对原始数据进行统一处理,达到统一统计口径,如方程(4)所示:
其中,m = 12,指本文中供应链管理的12个指标。X″为各指标的均值,通过加权平移消除负数的影响。
第二,计算出各个指标的变异系数,如方程(5)所示:
Bij表示各个指标的变异系数。
第三,计算各个指标权重值,如方程(6)所示:
计算出各系统对应权重值如表1所示。
由表1可知,根据权重值的大小既能区分各个模块的重要程度,不仅做到供应链管理工作有主有次,而且能够根据权重值计算输出结果的重要性,能够将输出结果进行量化比较,使得医药企业的决策更加量化。通过大数据技术在医药行业供应链管理中的运用,从医药企业的研发、采购、生产、销售环节融入大数据技术,使得企业的管理始终面向市场和客户,合理管控医药资源。具体来看,在主系统中,医药终端智能管理的权重值最大,值为0.419,分布式流向数据管理和医药行业数据管理的权重值分别为0.338和0.243。在子系统中,数据清洗处理的权重值为0.136,数据同步管理的权重值为0.132,药品流向采集模块的权重值为0.113,其余子系统的权重值均超过0.1。通过比较主系统和子系统的权重值,能够发现在供应链管理流程中需要重点关注的指标,比如数据清洗本文采用较为丰富的方法进行论证,在权重值部分也得到了证实其必要性。
4 结论与建议
4.1 结论
本文基于大数据管理技术,对医药行业供应链管理进行了分析,首先分析了医疗企业供应链管理的流程,对其中的主系统和子系统进行了设置。其次,根据供应链管理的流程,分析了其中的关键技术难点,运用数据清洗技术解决了这一问题。最后,运用熵值法结果输出结果进行量化,便于进行量化决策。通过本文的实证分析,得到以下研究结论:一是根据学术界的研究成果与医药企业供应链管理实践,在医疗行业供应链管理系统中主要包含分布式流向数据管理、医药行业数据管理和医药终端智能管理3个主系统,在主系统下包含12个子系统。二是在海量数据管理中,需要对数据进行清洗,保证数据质量,数据质量的高低会对研究结论产生重要的影响。三是对比主系统和子系统的权重值可以判断,在医疗行业供应链管理过程中,终端智能管理和数据清洗十分关键。
4.2 建议
4.2.1 立足供应链管理主系统与子系统,利用大数据技术,分步骤构建供应链管理系统
根据本文的研究结论,医疗企业供应链系统的构建并非一朝一夕,需要分步骤逐步深入。首先,在供应链管理优化上可以大力引进大数据管理技术,建立跨部门的研发团队,适度引进外部技术,建立可视化的大数据管理平台,对于供应链管理的优化具有重要作用。其次,在公司内部技术力量有限的情况下,可以大胆和第三方专业的技术公司合作,通过合作引进较为全面和丰富的技术,能够对原始系统进行不断的调整和优化。专业的技术公司往往在专业能力上更为突出,避免了企业花费大量的时间和精力进行研发,提升了工作效率,在短时间内完成多个数据端口的对接,但是在合作的过程中要注意数据保密。最后,在构建供應链系统时应该具有全局思维和发展思维,充分考虑系统的更新和换代,对数据接口的设计应该考虑未来发展的兼容性,从设计上保证系统的及时性。
4.2.2 提升数据质量,注重数据更新,对数据进行动态调整
对医疗企业而言,建立完善的供应链管理系统只是第一步,高质量的数据才是系统管理的关键。在数据来源方面,不同的企业有着不同的管理口径,在数据录入时要建立统一的数据管理标准,统一统计口径,避免产生统计误差。因此,在这一过程中要对数据进行及时更新,使得企业能够掌握前沿的市场信息,保证决策的时效性,避免产生经营风险。此外,对于其中错误的信息要及时进行调整,帮助企业合理分配资源,使企业最大限度满足市场需求。在海量数据的冲击下,在系统设计上要充分考虑到系统的处理能力,要建立足够大的数据池,提高数据计算的效率。当数据池容纳不了原有数据时,要有备选方案对数据进行备份,避免数据丢失造成损失。
4.2.3 提升数据终端的智能管理能力
根本本文的研究结论可知,在医疗行业供应链管理过程中,终端智能管理和数据清洗十分关键。在处理海量的数据时,要严格按照流程进行数据清洗,对原始数据进行高、中、低分类,对中、低质量的数据要使用人工进行再次分类,采用多种方法提升数据质量。数据清洗是一个反复的过程,不可能在几天内完成,只有不断的发现问题,解决问题。对于是否过滤,是否修正一般要求系统进行确认,对于过滤掉的数据,写入Excel文件或者将过滤数据写入数据表,在ETL开发的初期可以每天向业务单位发送过滤数据的备份,可以作为将来验证数据的依据。数据清洗需要注意的是不要将有用的数据过滤掉,对于每个过滤规则认真进行验证,并要用户确认。
参考文献:
[1]卓志毅,何跃,阎洪.构建中间需求模式的制造商最优产品供应策略模型[J].技术经济,2020,39(12):110-116.
[2]张树山,胡化广,孙磊,等.供应链数字化与供应链安全稳定——一项准自然实验[J].中国软科学,2021(12):21-30.
[4]王昕天,荆林波.疫情防控中农产品流通堵塞原因、短期应对与长期设想[J].中国流通经济,2022,36(12):55-67.
[5]夏杰长,刘慧.以产业融合壮大实体经济:作用机理与推进策略[J].财经问题研究,2023,(1):3-12.
[6]蒋殿春,鲁大宇.供应链关系变动、融资约束与企业创新[J].经济管理,2022,44(10):56-74.
[7]潘琳,徐夏静,周荣庭.博弈视角下社区生鲜食品供应链双渠道动态定价研究[J/OL].中国管理科学:1-12.(2022-12-07)[2023-01-01].https://doi.org/10.16381/j.cnki.issn1003-207x.2021.1506.
[8]宋晓晨,毛基业.基于区块链的组织间信任构建过程研究——以数字供应链金融模式为例[J].中国工业经济,2022(11):174-192.
[9]冯颖,冯仰超,张景雄,等.考虑产运环节碳排放的生鲜低碳供应链运营决策[J].系统管理学报,2024,33(1):1-15.
[10]段彩泉,姚锋敏,滕春贤.随机需求下考虑广告遗忘效应的多周期闭环供应链网络均衡[J].运筹与管理,2023,32(2):29-37.
Plication Evaluation of Big Data in Pharmaceutical
Supply Chain
CHEN Nan
(School of Economics, Bengbu College, Bengbu 233000, China)
Abstract:Under the impact of Omicron, due to the surge of residents' demand for related drugs, the medical resources are relatively tight in a certain period of time, but the demand for resources in various provinces and cities is not at the same time, which makes the supply chain management of pharmaceutical enterprises more difficult. Based on big data management technology, this paper analyzes the application process of big data in pharmaceutical supply chain management, and uses empirical analysis method to reach the following research conclusions: First, according to the research results of the academic circle and the supply chain management practice of pharmaceutical enterprises, the supply chain management system of the medical industry mainly includes three main systems: distributed flow data management, pharmaceutical industry data management and pharmaceutical terminal intelligent management, and contains 12 subsystems under the main system. Second, in the mass data management, the data need to be cleaned to ensure data quality, which will have an important impact on the research conclusion. Third, by comparing the weight values of the main system and subsystems, it can be judged that terminal intelligent management and data cleaning are very critical in the process of supply chain management in the medical industry.
Key words:big data technology;pharmaceutical industry;supply chain management;data cleaning;intelligent terminal
[責任编辑:许立群]