SARIMA模型在医院住院人次预测中的应用

2013-12-04 03:00马春柳刘海霞李小升雷海科
中国卫生统计 2013年3期
关键词:卫生统计差分预测值

马春柳 刘海霞 李小升 雷海科 王 红 李 琳 马 喆 周 宏△

住院量是评价一个医院医疗工作的重要指标,直接或间接地反映出一个医院的规模、医疗质量及医疗水平〔1〕。因此,了解住院量的变化情况,对于合理安排资源,提高医疗工作效率意义重大。要了解住院量的情况,就要对其进行预测。目前预测的模型及方法主要有线性回归模型、神经网络模型、灰色预测模型、马尔科夫链模型以及时间序列模型等〔2〕。针对住院量数据的特殊性,本文选用季节自回归滑动平均模型(seasonal auto regressive integrated moving average model,SARIMA模型),分析2000-2011年住院量的历史数据,探讨其发生发展的规律并预测未来半年医院住院量的情况,为医院规划自身发展提供科学的依据。

资料与方法

1.资料来源

所有资料来源于2000-2011年某三甲肿瘤专科医院统计月报表。

2.统计分析

利用统计学软件SPSS18.0进行统计分析。根据医院住院量的数据呈周期变化的特点,利用SARIMA(p,d,q)(P,D,Q)模型对我院 2000 ~2011 年住院量数据进行拟合。其中p,d,q分别表示自回归阶数、差分阶数和移动平均阶数。乘积季节时间序列模型的p、q判断较为困难,根据以往研究文献参数中报道超过2阶的情况很少,可以分别取0,1,2逐个试验,然后根据标准化贝叶斯信息准则(normalized bayesian information criterion,BIC)、平均绝对误差百分比(mean absolute percentage error,MAPE)判定模型的拟合情况、以及通过Ljung-Box检验残差情况来综合判断〔3〕。先通过对数据进行非季节性差分和季节性差分后,得到一个新的平稳化的时间序列,然后采用Box-Jenkins模型识别方法进行模型识别,即根据样本自相关、偏相关函数的截尾、拖尾性初步判断序列所适合的模型类别。通过标准化贝叶斯信息标准以及平均绝对误差百分比判定模型拟合情况,BIC与MAPE值越小,模型拟合的越好。通过Ljung-Box检验来判断模型残差是否为白噪声〔4〕。最后用所筛选的模型预测医院2012年7~12月的住院量。

结 果

1.数据平稳化

图1可见医院各年住院量在不断增加,而且呈现一定的季节分布趋势。根据其特点,对其进行一次一般差分和一次季节差分后(见图2),所有样本点基本上都是围绕0这一水平线上下波动,符合了时间序列的平稳化要求。

图1 2001年1月到2012年6月医院住院量的时间序列图

图2 对数据差分后的医院住院量的时间序列图

2.模型识别与参数检验

原始数据的序列图发现,数据具有季节性。经筛选得最优模型为 SARIMA(1,1,1)(2,1,0)12,其中BIC值为13.59,MAPE的值为7.44(见表1),模型决定系数R2为0.94,一阶非季节移动平均参数MA1=0.43,一阶季节自回归参数季节 AR1=-0.34,二阶季节自回归参数季节 AR2=-0.60,参数的估计值均有统计学意义,Box-Ljung检验无统计学意义(Q18=22.64,P=0.1238),可以认为残差序列是白噪声,说明所选模型恰当。

表1 不同时间序列模型的BIC值与MAPE值

3.模型预测

利用所筛选的 SARIMA(1,1,1)(2,1,0)12模型预测我院2012年1~6月的住院量(见表2),将预测值与实际值比较,相对误差最小值能达到4.94%,误差较大的为4月份,为10.94%。总体上看,模型预测值的相对误差很小,进一步说明了此模型具有较好的预测性。同时利用 SARIMA(1,1,1)(2,1,0)12模型预测2000-2012年的住院量,并将实际值与预测值一起绘图(见图3),发现2000-2011年的实际值与预测值的曲线基本吻合。

表2 2012年1到6月住院量的SARIMA模型的预测值与实际值

图3 预测值与实际值的拟合图

利用 SARIMA(1,1,1)(2,1,0)12模型预测医院2012年7~12月的住院量(见表3),发现医院的住院量有不断上升的趋势。

表3 2012年7月到12月医院住院量的预测值

讨 论

1.关于ARIMA模型

时间序列分析是一种重要的现代统计分析方法,广泛应用于自然领域、社会领域、科学研究和人类思维。ARIMA模型自20世纪70年代提出,已经不断得到完善,日益发展成熟,已在经济、卫生、工业自动化、水文、地质、气象、环境保护等多种领域得到广泛应用〔5〕。与传统的时间序列模型相比,ARIMA模型更具有广泛的适用性。传统模型都是假设各变量之间是一种线性关系,而实际情况,常受季节效应、随机波动效应等影响,所以拟合出来的效果往往不佳〔6〕。而ARIMA模型能考虑这些效应,从而得到的预测结果与实际较为吻合。刘会恩比较了12种不同的预测方法,研究结果认为ARIMA模型在短期预测中拥有较高的精确度〔7〕。

ARIMA模型也具有一定的局限性,主要表现在:计算方法比较复杂;如果原始序列数据较少,拟合效果会较差;只能适用于短期内的预测,如果用于中长期预测,预测效果就不会理想〔8〕。因此,在应用前也应该考虑其适用条件,比如考虑序列的平稳性及白噪声。如果序列不是一个平稳序列或是一个白噪声序列及时间序列太短,则不适合应用ARAMA模型进行分析。

2.适时调整床位,优化病房结构

医院的住院量有不断上升的趋势,呈现出季节波动的特征。医院应根据变化波动的规律特点,合理调整现有床位分布结构,除肿瘤内科、乳腺科、妇瘤科等科室保持现有床位外,其他科室以“大病房”形式建立综合病房,统一安排床位,并按照季节不同,进行相应的调整,改变病房床位归属永久不变的现状。通过对住院量的预测,在一定程度上可以帮助医院对成本进行有效的控制,充分利用现有的配置,不断优化医疗资源的使用结构。

1.明星辰,方孝梅,王玉责,等.某三级医院2007年住院人次预测分析.中国卫生统计,2008,25(1):68-69.

2.Martinez E Z,Silva E A,Fabbro A L.A SARIMA forecasting model to predict the number of cases of dengue in Campinas,State of S~ao Paulo,Brazil.Rev Soc Bras Med Trop,2011,44(4):436-440.

3.刘晓宏,金丕焕,陈启明.ARIMA模型中时间序列平稳性的统计检验方法及应用.中国卫生统计,1998,15(3):12-14.

4.Rosychuk RJ,Klassen TP,Voaklander DC,et al.Seasonality patterns in croup presentations to emergency departments in Alberta,Canada:a time series analysis.Pediatr Emerg Care,2011,27(4):256-260.

5.朱惠敏,齐丽萍,孙莉.对我院2004年住院人次及周转次数的预测.中国卫生统计,2005,22(2):126-127.

6.姚炯.影响住院人次的因素分析.中国卫生统计,2004,21(4):228-229.

7.刘会恩.用统计方法对我院住院人次和门诊诊疗人次进行预测.中国医院统计,2007,14(2):107-108.

8.薛冬梅.ARIMA模型及其在时间序列分析中的应用.吉林化工学院学报,2010,27(3):80-83.

猜你喜欢
卫生统计差分预测值
RLW-KdV方程的紧致有限差分格式
符合差分隐私的流数据统计直方图发布
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
新医疗背景下卫生统计工作的实践与发展思考
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
数列与差分
AI讲座:ML的分类方法
浅谈加强卫生统计工作的作用及措施
我国卫生统计的深化与改革探讨
相对差分单项测距△DOR