张智勇 吴宣达
华南理工大学电子商务学院
高值医用耗材是直接作用于人体、风险高、对安全管理方面有严格要求且价值相对较高的医用耗材[1]。医疗机构进行医疗耗材管理时,较为常见的方式是根据医疗耗材单位价值的高低,将医疗耗材分为高值耗材和低值耗材,采用不同的管理流程[2]。以往对高值耗材的需求预测通常采用时间序列预测法、季节指数平滑指数模型和ARIMA预测模型,近期有学者使用神经网络[3]进行预测分析。这些预测方法本身存在一定的局限性。
时间序列预测法、季节指数平滑法以及ARIMA预测模型是[4]根据变量自身过去的变化规律预测未来的变化。这些方法要求时间序列具有稳定的变化趋势,对于不确定需求的预测的可信度较差。神经网络法[5]需要考虑预测对象自身的多个数字属性进行分析,而在实际情况中,高值耗材供应商关于高值耗材数据中数字型属性通常较少,不满足高值耗材领域预测需求。
本文对高值耗材领域进行分析,基于实际需求手术包商品组合的特点,使用关联分析挖掘商品组合,并根据商品组合特点对特定高值耗材销量进行预测分析。
Apriori算法是常用的关联规则算法,是一种通过逐层搜索实现的迭代方法。其核心思想通过迭代产生候选项集,再通过对候选项进行剪枝产生频繁项集。
给定一数据集I={i1,i2,…,id}为购物篮数据中所有项的集合,而T={t1,t2,…,tN}是所有事务的集合。每个事务ti包含的项集都是I的子集。令Ck为候选k-项集的集合,而Fk为频繁k-项集的集合,Ck中的每个元素需在交易数据库中根据其是否满足给定的最小支持度来决定其是否可以加入LK,然后遵循下图算法操作。
图1 Apriori算法思想
商品组合挖掘的迭代过程中需要设置的算法:
(1)规则置信度XYC→。表示在出现X的条件下出现Y的概率。规则置信度高,则表示Y关于X的条件概率高,规则的可信度高。其数学表达式为:
(2)规则支持度XYS→。表示X、Y同时出现的概率。以丨T丨表示总事务数,其数学表达式为:
(3)频繁项集B(A)。指包含项目A的项集B,其支持度大于设定的最小支持度,即
本文使用控制变 量法进行合理设置。若设置最小置信度过高,会导致商品关联组合为常规组合,组合中商品数目过小,不利于进行关联分析。若最小置信度过小,会导致商品关联组合将相关度不高的商品也输出到商品组合中,导致组合中商品数目过大,不利于进行关联分析,同时也会大大增加了信息搜寻成本,给之后的预测算法的设置增加难度。
2.组合组数的设置
设定最小置信度后,实验取其中商品组合中数目最多的组合来进行预测,因为在一定的关联度规则中,关联信息越多,预测精度就越准确。
通过实地考察和对相关专业人员的咨询发现,高值医用耗材销售物流与传统商品物流有所不同,通常有正向物流和逆向物流两个过程。当医院需要进行手术,医院方会将需求发送给医院代表或相关联系人。医院代表或相关联系人根据需求制作订单并将订单发送给供应商。供应商根据订单需求进行紧急备货并打包成手术包进行配送。医院方消耗手术包中部分医疗器械,在手术完成后将经过部分消耗的手术包返还给供应商。
手术包本身即为商品组合(见图2)。正向物流的手术包是基于历史销售订单来进行备货的,而通过分析逆向物流的手术包可以挖掘高值医用耗材实际消耗情况。本文针对高值耗材的商品特性,通过正向物流和逆向物流两个方面进行需求预测分析。
图2 医用高值耗材销售过程
商品组合中商品间存在关联性,以其中一个商品作为预测的对象,以其他的商品销售数据作为预测对象的销量影响因子,得出预测对象预测结果。
设关联分析后商品组合为F={x1,x2,x3,…,xn},第i个商品销售数据为Dxi={d1,d2,…,dm},指定xj作为预测对象,以{d1,d2,d3,…,dj-1,dj+1,…dm}作为输入变量,以dj作为输出变量,使用相关算法进行预测分析(见图3)。
图3 商品组合预测
本文分别使用简单线性回归、多元线性回归和BP神经网络对商品组合销量进行预测分析。取损失函数作为衡量预测结果好坏的依据。本文设置销量预测的损失函数为Lquad(f(x)-y)=(f(x)-y)2,对应于在最小平方误差标准ESS。
本研究选取实际深圳市某医药供应商2021年1月—10月医用高值耗材历史销售订单数据进行数据分析,其中包含历史销售订单5043份(其中同一个订单有借出和归还两种操作),借出或归还销售记录共91700条,包含医用物料378种,商品编码类型2108种(见表1)。
表1 医用高值耗材历史销售记录原始数据类型
基于商品组合的高值耗材需求预测的步骤为:
(1)对销售历史数据进行分析处理。基于正逆向物流将操作分别为借出和归还的订单分类整理,并以物料名称属性作为键进行区分,最后再以“月”为单位,对每种医用物料的销售日期进行处理;
(2)对处理后历史销售订单信息中的高值耗材组合进行分析,使用Apriori算法挖掘高值耗材组合中的关联性,并根据关联性挖掘提取新的商品组合。
(3)基于挖掘出的商品组合,指定组合中一种高值耗材作为分析对象,运用相关算法(多元线性回归、BP神经网络)进行需求预测分析;
(4)对预测结果进行分析,并利用预测样本对高值耗材商品未来销量进行预测。本文分别用普通线性回归方法、多元回归方法和BP神经网络方法对某医药企业某一类高值耗材的销售量进行预测,并将三者预测结果进行比较(见图3)。
在正向商品组合中,使用线性回归的回归平方误差ESS为27547.89096,使用多元线性回归的ESS为5917.228894,而使用神经网络的ESS为3470。
在逆向商品组合中,使用线性回归的回归平方误差ESS为4205503.194,使用多元线性回归的ESS为22716.42768,而使用神经网络的ESS为19477。
图4 正向物流商品组合预测
图5 逆向物流商品组合预测
无论是正向物流商品组合和逆向物流商品组合,神经网络方法的预测精度最佳、而多元线性回归方法的预测精度次之,而普通线性回归方法的预测精度最差。
医用高值耗材本身具有附加价值高、商品时效性强、需求不确定性明显等特点,因此对医用高值耗材的管理及需求预测成为急需研究的问题。Apriori算法是常用的关联规则算法,其使用基于支持度的剪枝技术从数据集中有价值的数据组合,通过设置适当的支持度,可以对高值耗材手术包的组合进行优化。而实例证明,基于数据组合对单一高值耗材进行销量需求预测时,神经网络方法表现优于多元线性回归方法,多元线性回归方法优于普通线性回归方法。后续可尝试将本文的研究成果推广到其他类型医用耗材的库存管理与采购策略制定中,以此优化医用耗材供应商、分销商以及医院的库存管理,在一定程度上减少不必要囤积或缺货现象的发生,从而降低各个节点的运营成本,为医院精细化管理提供科学的数据支撑。