赵钦康 李越
住院患者量是评价一个医院或专业科室医疗工作的重要指标,直接或间接地反映出一个医院或专业科室的规模、医疗质量及医疗水平[1]。因此,了解一个医院或专业科室住院患者量的变化情况并进行有效预测,对于合理安排资源、提高医疗工作效率意义重大。季节性自回归移动平均(seasonal autoregressive integrated moving average, SARIMA)模型广泛应用于疾病发病率及医院患者量的预测[2],且可针对患者量数据的特殊性进行分析[3]。国内目前已有关于将SARIMA模型用于医院住院患者量的研究,且具有良好的预测效果,能够帮助捕捉住院患者数量月份变化的低谷和高峰[1]。本研究将SARIMA模型运用于骨折住院患者量的短期预测,探索山西省汾阳医院骨折住院患者量的季节变动规律及未来趋势,并将其与实际患者量比较,以评估SARIMA模型能否预测“未来”骨折住院患者量,为合理安排医疗资源和提高工作效率提供参考,同时也可为骨折防治措施的制定提供依据。
选择2017年6月至2022年3月山西省汾阳医院收治的骨折住院患者。纳入标准:以骨折为主要诊断或多发性损伤包括骨折的患者。排除标准:①临床资料不完整的患者;②复诊患者。
收集研究对象的人口学资料和临床资料,对研究对象的人口学资料和临床资料进行统计描述。分类变量用例数(百分比,%)表示,组间比较用卡方检验;年龄作为连续型变量,用均数±标准差表示,采用t检验比较多组间差异。
根据时间绘制住院患者量的时间序列图,通过tseries包的stl()函数将原时间序列分解为长期趋势(trend)、季节变动(seasonal fluctuation)、不规则波动(irregular variations)并绘图展示。使用单位根检验进行时间序列的平稳性分析,非平稳序列时进行转换后分析。根据平稳时间序列,识别绘制新序列自相关函数(auto-correlation function, ACF)图和偏自相关函数(partial auto-correlation function, PACF)图,判断模型类型。
将2018年1月至2021年7月的数据作为训练集,建立SARIMA (p,d,q)(P,D,Q)s模型,对2021年8月至2022年3月收治的患者量进行短期定量预测,生成预测集,并将其与实际收治量比较以验证SARIMA模型预测效果。首先,通过forecast包的auto.arima()函数自动拟合SARIMA模型,生成相应的赤池信息准则(Akaike information criterion,AIC)值和贝叶斯信息准则(Bayesian information criterion,BIC)值,以确定参数p、q、P、Q值的最佳组合。其次,对模型拟合结果进行白噪声检验,并计算均方根误差(root mean square error,RMSE)和平均绝对百分比误差(mean absolute percentage error,MAPE),检查模型的性能,并用预测集的预测值和实际值来验证预测准确度。
采用Excel 2010对数据进行收集整理,R 3.5.2软件的tseries、forecast软件包对数据进行统计分析。
如表1所示,共纳入2 563例患者,其中男性1 556例,女性1 007例,男女比值为1.55;平均年龄53.43岁,男性患者平均年龄(47.61岁)比女性患者(62.42岁)更低,相差14.81岁,差异有统计学意义(t= -17.798,P< 0.001)。根据骨骼生长发育的年龄情况分组:≤20岁组226例(8.82%),21 ~ 40岁组444例(17.32%),> 40岁组1 893例(73.86%)。根据男女退休年龄分组:未退休组(男≤60岁,女≤55岁)1 440例(56.18%),退休组(男 > 60岁,女 > 55岁)1 123例(43.82%)。两种年龄分组患者性别比的差异有统计学意义(P< 0.001),且男性年轻患者和女性年老患者更多。
表1 不同性别研究对象特征比较
2 563例患者中因下肢、足部骨折而住院的数量最多,占53.06%,骨折部位的比例依次为股骨(59.85%)、足踝部(22.50%)和胫腓骨(15.00%),其他占比均较小。其次为因上肢、手部骨折住院的患者(18.37%),其中尺桡骨和肱骨骨折最为多见,各占42.25%和50.53%。因颈、胸、腰椎骨折住院的患者(12.41%)排第3。不同原因住院患者性别比的差异有统计学意义(P<0.001),女性因下肢、足部住院的患者占比(57.49%)高于男性患者的比例(50.19%),尤其是股骨骨折的患者居多(78.58%),而男性患者股骨骨折仅占因下肢、足部住院的45.97%。足踝部骨折的男女比值最大,为5.24,可见男性更容易因足踝部受伤而住院;相反,股骨骨折的男女比值最小,为0.79,可见女性更容易因股骨受伤而住院。
选取2018年1月至2021年12月山西省汾阳医院骨折住院患者共2 216例,绘制住院患者量情况的时间序列图,见图1。可以看到患者量总体呈上升趋势,且存在较为明显的季节周期,月住院患者数季节波动幅度较大,且单位根检验提示该序列为非平稳时间序列(P=0.337)。
图1 骨折住院患者量情况的时间序列
为更直观地观察原序列特征,通过stl()函数将原时间序列分解为长期趋势、季节变动、不规则波动,结果见图2。住院患者量的时间序列的季节变动明显,每年有2个高峰期,即5月和8月;时间序列显示有明显上升趋势;不规则波动提示存在除趋势、季节性外的偶然性波动。
图2 原时间序列的分解(长期趋势、季节变动、不规则波动)
根据以上分析,原序列为非平稳序列,故首先进行log10对数转换;由图1和图2可知,该序列住院患者量的季节性明显,故再进行一阶差分。差分后单位根检验提示该序列为平稳时间序列(P=0.049),可认为该时间序列通过一阶差分后达到平稳序列,且该序列的ACF图、PACF图是拖尾的,见图3,则序列适合自回归移动平均(auto-regressive moving average, ARMA)模型。通过auto.arima()函数对训练集自动拟合SARIMA (p,d,q)(P,D,Q)s模型,得到SARIMA (0, 0, 1)(1, 0, 0)12,模型参数AIC=11.94,BIC=18.89。通过Box.test()函数对拟合模型进行白噪声检验,结果为P=0.806,残差为白噪声,可认为模型中的随机误差项序列无异方差,不用考虑其异方差性对于预测精度的影响。
图3 转换后时间序列的ACF图和PACF图
将原序列分为训练集(2018年1月至2021年7月)和预测集(2021年8月至2022年3月),采用SARIMA(0, 0, 1)(1, 0, 0)12模型对未来骨折住院患者量情况进行短期定量预测,结果RMSE=0.24,MAPE=149.61。如表2所示,平稳序列中各月的实际值与预测值不完全一样,但各月实际值都落入了预测值的80%可信区间内,相对误差范围在1.81% ~8.60%之间。根据平稳序列的预测值换算后,原始序列中各月的实际住院患者量与预测值接近,且相对误差范围在1.52% ~ 3.39%之间,可以看出模型预测值的动态趋势与实际情况基本一致,模型对未来的情况进行了很好的跟踪和预测。
表2 SARIMA (0, 0, 1)(1, 0, 0)12模型预测2021年8月至2022年3月骨折住院患者量
在医院或专业科室的科学管理中,要有效提高管理水平,就要制定具有科学性和实践性的计划,而用统计预测数据制定工作计划,可避免主观盲目性,且具有较强的可操作性[4-5]。住院患者量是医院或专业科室医疗工作的重要评价指标,医院或专业科室管理者可根据科学准确的住院患者量预测值,提前安排有关工作,合理配置人力、物力资源,实现医院或科室效益最优化[6]。时间序列方法考虑对象本身的历史数据随时间发展变化的规律,并用该变量以往的资料建立统计模型做预测,在医疗卫生领域有广阔的应用前景。由于该法用于门诊、住院等医院管理相关指标预测的突出优点,已有很多卫生工作者将该法应用于医院管理、疾病控制等领域[3,7-8],其在前瞻性预测方面有可靠的应用价值。SARIMA (p,d,q)(P,D,Q)s模型作为一种应用广泛的时间序列模型,其预测精确度较高,用于中短期预测效果较好,可以同时处理有周期性、季节性波动的资料[9],与传统的时间序列模型相比更具优势[10]。通过构建SARIMA(0, 0, 1)(1, 0, 0)12模型,对山西省汾阳医院2021年8月至2022年3月骨折住院患者量进行预测分析和建模拟合。结果显示,骨折住院患者量存在季节变动和长期增长趋势,且模型预测值的动态趋势与实际情况基本一致,平均相对误差小于10%,表明利用SARIMA模型预测山西省某三级医院骨折住院患者量变动水平的可行性,具有良好的应用价值,有助于研究医院住院患者量的时间特点,有助于合理安排医院的医疗资源和提高工作效率,同时可根据季节变动特点和长期增长趋势为骨折防治措施的制定提供参考和依据。
此外,观察原始时间序列可以发现2020年2月出现骨折住院患者量的急剧下降,也是整个住院患者量的最低值所在时间点,考虑是新冠疫情的影响。该突发公共卫生事件的发生导致医院的管理重心转移至传染病的诊断治疗,同时也由于疫情影响,居民外出活动大幅减少,因此骨折住院患者量明显下降,导致模型分析出现一定的混杂偏倚。但是,除了2020年2月,其他年份的12月至次年2月(冬春季)仍然存在一个住院患者量下降的情况,因此,预测分析也符合季节性的基本特征,说明使用SARIMA模型预测具有一定的可行性。
通过对山西省某三级医院骨折住院患者量的预测,在一定程度上可以帮助医院或科室对成本进行有效的控制,充分利用现有的配置,不断优化医疗资源的使用结构。本研究通过SARIMA模型的时间序列分析,发现山西省某三级医院骨折住院患者量有不断上升的趋势,呈现出季节波动的特征,每年有2个高峰期,即5月和8月。建议医院及骨科科室应根据变化波动的规律特点,合理调整现有床位分布结构,科学分配医护资源,制定合适的值班制度,并按照季节不同,进行相应的调整,改变科室永久不变的现状。
既往研究显示,每月的骨折住院病例数会随日照时间增加而升高[11],且目前大多数研究通过减少户外运动场所的暴露机会进行骨折预防[12-14],然而针对骨折季节性因素的研究较为有限,对骨折高发期的预防措施可能存在不足。本研究显示,山西省某三级医院骨折住院患者量每年有5月和8月2个高峰期,这可能与当地的气候条件有关,因5月和8月气温适宜、阳光充足,户外活动时间较长,因此,发生骨折的风险也更高。为预防骨折,减少骨折隐患,应该加强看护并学习相关急救知识,在户外活动前确认安全性和可能带来的伤害,实现一级预防;及时采取二级预防措施,在意外发生时有效处理,及时送医院救治,通过三级预防减少骨折带来的伤害。
骨折目前已成为全球公共卫生问题,2019年全球疾病、伤害和风险因素负担研究(the Global Burden of Diseases, Injuries, and Risk Factors Study,GBD)结果显示,2019年全球骨折新发病例数为1.78亿,累积病例数为4.45亿[15]。有研究发现,骨折的发病率有逐年增加的趋势[16],在各年龄阶段,男性骨折发生率均比女性更高[17-18],这与本研究结果相符,考虑主要与男性的工作性质和社会特性有关。骨折患者中大于40岁的患者占73.86%,与国内研究结果基本符合[19-21]。随着年龄增长,骨钙不断丢失,骨量逐渐减少,骨骼出现骨质疏松而容易发生骨折[22],因此,可通过减少年长者独自户外活动,在骨折发生的高峰期加强年长者的监护,减少暴露于骨折危险因素的机会。
一是虽然SARIMA模型对于中、短期预测精度和准确度较高,且运用广泛,但在进行更长期预测时会有较大误差。本研究仅对2017年6月至2022年3月山西省某三级医院骨折住院患者量进行了分析,样本量和时间长度有限,在一定程度上会影响模型的预测效果。为保证预测准确度,发挥远期预测作用,未来模型需要不断纳入更新的数据。二是在建模方法上,本研究采用自动拟合的方式,但在实际运用中可能出现自动拟合结果与传统建模最优结果存在差异的情况,若自动拟合的模型预测效果不佳,可以改用传统建模步骤,检验模型的相对优势,分析出现差异的原因,再进行模型优化。三是本研究分析预测住院患者数量时只考虑了时间序列本身的特性,未考虑诸如个体因素、心理行为因素、既往骨折史等因素的影响,为更好地发挥模型的实际应用价值,在今后的研究中需要纳入影响患者骨折的各项因素进行综合分析。四是本研究预测分析只涉及地处我国北方的山西省汾阳医院,骨折住院患者量的季节性变动受到地域的影响会产生偏倚,后期需要收集各地域医院骨科住院患者量再进行地域分析,使模型的预测结果可适用于不同地域的医院管理中。
志谢 感谢山西省汾阳医院骨科提供的住院患者病案首页数据支持。