武汉市中心医院医学资讯科(430014) 耿 娟
在医院管理中,要有效提高医院管理水平,就要使计划具有科学性和实践性。用统计预测数据制定工作计划,可避免主观盲目性,具有较强的可操作性。门诊量是医院医疗工作的重要评价指标,科学准确地预测门诊量可为医院临床科室设置和人员配置提供可靠依据。本文利用时间序列分析中广泛应用的ARIMA模型对武汉市某综合性医院2004-2012年门诊量进行拟合预测,为医院管理者提供决策依据。
1.资料
选择武汉市某综合性医院2004-2012年门诊量数据作为原始数据,其中2004-2011年数据用于建立ARIMA模型,2012年数据用于模型检验,测试模型与2012年门诊量符合程度。
2.建立模型基本原理与方法
运用SPSS17.0建立门诊量资料数据库,并用相关统计学模块进行数据处理与分析。ARIMA模型建模过程按4个阶段进行[1-2]:(1)序列平稳化:ARIMA模型的应用需要时间序列符合平稳性的要求;(2)模型的识别:主要是根据残差序列的自相关函数(ACF)图、偏自相关函数(PACF)图的特征,提出几种可能的模型作进一步分析;(3)模型参数估计和模型诊断:参数估计是对识别阶段提供的粗模型参数估计并假设检验,用以判断模型是否恰当,并通过模型的残差等诊断统计量判断模型的适合性;(4)预测应用:非季节模型为ARIMA(p,d,q),季节模型为ARIMA(p,d,q)s。如果时间序列既有季节性成分,又有非季节性成分,则需混合效应的乘积模型ARIMA(p,d,q)(p,d,q)s。
1.时间序列特征分析
绘制2004-2011年门诊量的时间序列图(见图1),时间单位定义为年月型,起始时间为2004年1月。由图1可以看出:(1)门诊量基本上呈上升趋势,且序列存在着明显的季节规律,在1,2月份呈现低谷,以年为周期的变化明显;(2)序列的方差前后波动较大,即门诊量高峰与低谷的间距变化较大,提示原始序列不是一个平稳的随机过程。据以上特点,首先对序列进行自然对数变换,然后进行一次一般差分一次季节差分,分别消除趋势和季节因子的影响。
图1 武汉市某综合医院2004-2011年门急诊量各月就诊人次数时序图
2.建立ARIMA模型
根据差分变换的次数,对序列作自相关图ACF和PACF图(见图2,图3)。图中显示序列PACF和ACF图均拖尾则适用ARIMA模型,初步确定模型可定为ARIMA(p,0,q)(P,D,Q)s。PACF图在季节性时点2,14和26处的PACF值呈现一个指数衰减的形式,提示一个MA过程。由于模型中还混杂了非季节性的成分,因此ACF图在季节性时点处的变化趋势不够明显,可以运用季节性MA(1)过程,即ARIMA(0,1,1)12。根据文献参数超过2阶的情况很少可以分别取0,1,2,由低阶到高阶逐个实验,然后根据模型的拟合度、残差情况以及系数之间的相关性进行综合判断[3]。经筛选得出最优模型ARIMA(1,0,1)(0,1,1)12,其中AIC=-243.847,SBC=-236.154,非季节性自回归系数AR1=0.997;非季节移动平均系数MA1=0.643;季节性移动平均系数SMA1=0.819,模型参数有统计学意义(见表1)。对残差序列作自相关图(见图4),结果显示Box-Ljung统计量均无统计学意义(P>0.05)(见表2),可以认为残差序列是白噪声,说明所选模型ARIMA(1,0,1)(0,1,1)12恰当,可以用来描述门诊量数据的动态特征。
图2 原序列经过一次季节差分后的自相关图
图3 原序列经过一次季节差分后的偏相关图
表1 模型的参数估计
图4 残差序列的自相关图
3.预测应用
利用上述所建模型ARIMA(1,0,1)(0,1,1)12对2004-2011年门诊量时间序列数据进行拟合,并对2012年1月至12月的门诊量进行预测,结果见图5。从预测值可以看出门诊量预测数据与实际数据基本吻合,趋势基本相同,其预测效果较好,预测值与实际值的平均相对误差为5.28%(见表3)。本模型2012年1、2月份、12月份预测相对误差超过10%,其可能原因:(1)由于“节假日效应”所致:2012年1月23日为春节,如没有重大疾病,人们一般不会去就诊;2月正是春节刚过,节后发病率上升,门诊量大幅增加。(2)12月是提前期的远期预测,效果欠佳;且12月正处于医院年度完成任务的冲刺月,医院门诊采用各种激励政策导致实际门诊量突增。
表2 完整模型的残差ACF检验
图5 门诊量及ARIMA(1,0,1)(0,1,1)12模型预测值序列图
表3 2012年门诊量的ARIMA模型预测值与实际值
ARIMA模型是一种预测精确度较高的模型。它是时间序列建模中最重要和常用的手段,它针对有时间性变动的序列提出建模方法,对每一个季节周期中同时间点的序列值进行分析,提取季节趋势;并对每个季节周期内部序列值的变化提取具有平稳性的变动成分来进行建模。ARIMA模型一般要求数据有50个以上的时间点和7~8个周期[4],本资料符合以上要求。
收集分析医院各项业务指标,研究其变化规律并预测其变化趋势是医院科学管理的重要内容[5-7]。本文通过构建ARIMA(1,0,1)(0,1,1)12模型预测医院2012年门诊量,结果显示,门诊量预测值的动态趋势与实际情况基本一致,2012年3-11月验证数据显示,平均相对误差小于10%,表明利用ARIMA模型预测门诊量变动水平的可行性。医院管理者可根据每月的门诊量预测值提前安排有关工作,合理配置人力、物力资源,实现医院效益最优化。
时间序列方法在医疗卫生领域有广阔的应用前景。它是一种考虑对象本身的历史数据随时间发展变化的规律,并用该变量以往的资料建立统计模型做外推的预测方法。即利用时间序列模型不需要知道影响预测变量的相关因素,可将包括未知因素的综合效应统一蕴含在时间变量中,这是该法用于门诊,住院等医院管理相关指标预测的突出优点。已有很多卫生工作者将该法应用于医院管理、疾病控制等领域[8-10],在前瞻性预测方面有可靠的应用价值。
参 考 文 献
1.张文彤.SPSS统计分析教程(高级篇).北京:北京希望电子出版社,2002:250-289.
2.孟蕾,王玉明.ARIMA模型在肺结核发病预测中的应用.中国卫生统计,2010,27(5):507-509.
3.孙振球,徐勇勇.医学统计学.北京:人民卫生出版社,2002:351-371.
4.李娜,殷菲,李晓松.时间序列分析在结核病发病预测应用中的初步探讨.现代预防医学,2010,37(8):1426-1428.
5.向前,陈平雁.预测医院门诊量的ARIMA模型构建及应用.南方医科大学学报,2009,29(5):1076-1078.
6.贾翠平,李静.采用自回归滑动平均模型预测2011年门诊量.中国病案,2011,12(9):52-53.
7.武红涛.ARMA模型在医院出院患者预测中的应用.解放军医院管理杂志.2009,16(1):21-23.
8.陈莉.探讨ARIMA模型在细菌性痢疾发病预测中的应用.中国卫生统计,2011,28(4):417-419.
9.陈明惠,胡云,支洋英,等.应用ARIMA模型预测成都市新都区麻疹的发病趋势.现代预防医学,2012,39(2):267-269.
10.叶孟良,李智涛,欧荣.ARIMA模型在预测重庆市医院日住院量中的应用.重庆医学,2012,41(3):1260-1261.