张曙+曹禺+宣琦+倪菁+胡振敏
[摘 要]本文在数据中心的基础上,对标准化存储的时间序列数据,采用自回归求和滑动平均ARIMA模型进行预测,从而对医院的门诊人次、住院床位进行准确预测和分析,为医院决策提供数据支撑,从而提高医院运营和资源利用效率,使医院总体管理效能得到优化。
[关键词]大数据;数据中心;预测模型;时间序列;管理效能
doi:10.3969/j.issn.1673 - 0194.2017.22.040
[中图分类号]R197.3 [文献标识码]A [文章编号]1673-0194(2017)22-00-02
1 研究背景
2016年,国务院办公厅下发《关于促进和规范健康医疗大数据应用发展的指导意见》指出:“综合运用健康医疗大数据资源和信息技术手段,健全医院评价体系,推动深化公立医院改革,完善现代医院管理制度,优化医疗卫生资源布局。”可见,医院通过充分运用健康医疗大数据,结合数据挖掘分析等技术手段,能够为医院管理层提供预测方案、决策支持和相应的评价体系,不仅是现代医院信息化建设的重点,而且也被列入了国家发展重点任务。
在此之前,国外在医疗大数据分析应用、提升医疗管理方面有较深入的研究,如对患者流向和患者行为基于马尔科夫链进行建模,分析病人进入医疗机构的移动状况,Taylor 等建立了包括4个连续状态的马尔科夫模型等。国内在此领域也有一定的研究,例如,解放军301医院将提取患者的诊疗数据进行时间节点建模,还原患者的就诊路径,发现门诊效率和患者等待时间、收费窗口访问频次、检查划价收费等是影响门诊效率的关键因素。但是,目前国内大多数医院在医疗大数据利用方面,仍然处于数据的报表化或图表化数据分析展示阶段,只能对当前或历史数据进行简单的分析与展示。这种方式虽然对医院的管理分析有一定的帮助,但对于管理决策层的“先知、先觉、先判”需求还有较大的差距。本文通过研究基于数据中心的预测模型,建立了关于排队时间、床位资源使用等方面的预测模型,不仅可以持续改善医院预警的反应性和一致性,降低成本和风险,增加可用度;还可以让决策层提前掌握医院的发展趋势,帮助决策层做出正确响应,适时做出流程优化再造和资源的合理调配,优化医院管理效能。
2 基于医院大数据的管理效能优化预测模型的方法研究
2.1 建立数据中心
本文建立的管理效能优化预测模型是在医院运营数据中心(Operation Data Repository,ODR)的基础上实现的,因此本项目首先要建立全院级的运营数据中心ODR。其过程是:医院从人事、财务、HRP、物资和设备等多个数据源,采集并整合医疗服务及临床业务系统产生的运营过程记录信息,通过数据的清洗及质控,建立ODR。ODR的建设过程主要包含两大部分:第一,先建立数据复制库,然后对复制库中的数据经过ETL过程后存储到数据中心,对数据进行采集和整合;第二,数据的多维度分析与展现,其中包含了OLAP。医院通过这两部分的建设,一方面可以提高全院数据的完整性和准确性;另一方面可以深入对数据进行利用、挖掘和分析,使预测模型更加准确。
2..2 建立预测模型
在ODR基础上,笔者对标准化存储的数据进行分析、利用,建立预测模型。为了简化分析过程,笔者首先根据数据特点将数据中心的数据分为两类。第一类是横截面數据,该数据是大体上同时或者和时间无关的不同对象的观测值组成的数据;第二类是时间序列数据,这是在不同时间点上收集到的数据,这类数据反映了某一现象或事物等随时间的变化程度或状态。因此本文建立的预测模型的是在时间序列数据基础上进行的。时间序列可以用一个变量过去的观测实际值来预测同一变量的未来值,也就是说,时间序列的因变量为自变量未来的可能值。
由于时间序列具有非线性、非平稳性、快速变化并且包含噪声干扰的特点,所以国内外很多专家对时间序列进行了深入研究,并提出了多种针对时间序列的预测方法。从大的分类来说,时间序列主要分为两类:一类是基于模型的时间序列预测,如自回归滑动平均(Auto-Regressive and Moving Average,ARMA)模型、自回归求和滑动平均(Auto-Regressive Integrated Moving Average,ARIMA)模型等;另一类是基于人工智能的时间序列预测,如递归神经网络(Recurrent Neural Network,RNN)预测、回声状态网(Echo State Network,ESN)预测等。
本文采用自回归求和滑动平均ARIMA模型。该模型的基础是自回归和ARMA模型。假定时间序列用X1,X2,…,Xt表示,则一个纯粹的AR(p)模型意味着变量的一个观测值由以前的p个观测值的线性组合加上随机误差项at(该误差为独立无关的)而得。
Xt=φ1Xt-1+L+φpXt-p+αt(1)
本文采用的ARIMA模型方法比传统方法更加可靠,因为ARIMA模型的拟合综合考虑了序列的趋势变化、周期变化及随机干扰,并借助模型参数进行了量化表达,拟合效果的验证在理论上具有说服力,在应用上切实可行。ARIMA模型一般情况下有多个参数,利用差分来消除趋势或循环成分,在对医院就诊这样的有季节和趋势等成分的时间序列进行ARIMA模型的拟合研究和预测时,不像纯粹的、满足可解条件的ARMA模型那么简单。因此,实际建模会更加复杂,需要经过反复比较。
3 应用预期成效
目前,医院门诊患者数日益增长是造成患者排队时间长、床位资源紧张的重要原因,本文通过提前预测出未来门诊就诊的患者数量,可以为医院制定各种预案提供充足的缓冲时间。笔者所在单位通过对已建成的运营数据中心中的5~10年的门诊相关历史数据进行分析建模,可预测医院在未来某个时间段内患者各个就诊环节的排队及等候时间,帮助决策者提前采用诸如通过扩展第三方支付方式、扩大预约途径与范围、改变楼层职能布局、增加床位数量等方式,优化就诊流程,提高患者就诊效率,改善就医体验,提高患者满意度,解决“看病难”的问题。预测分析结果如图1所示,该模型通过对挂号排队时间、挂号后就医等待时间、医生问诊时间、门诊缴费等待时间、发药等待时间、化验等待时间、检查等待时间和报告等待时间等指标进行预测分析,可得出患者在就诊各个环节花费的时间,从而有针对性地对花费时较长的环节进行优化。图2为科室单日挂号人次预测趋势图。
另外,医院住院床位紧张也是各大医院的突出问题,本文通过建立课题预测模型可以解决这一难题。本文通过建立预测模型,不仅可以预测住院人数,还可以深入分析现有的病床使用情况,使病床得到充分利用,进一步使医院资源得到有效分配,为病人带来方便。
4 结 语
本文通过建立医院大数据的管理效能优化预测模型,实现了医院对患者就诊整个流程的实时监测和预测分析,包括对门诊患者和住院患者的人数预测。该系统最大的创新点有以下两个方面。首先,在标准规范和安全体系架构下,该模型将全院数据进行标准化存储建成数据中心,从而建立相关预测模型,确保了数据的完整性和统一性,减少了预测的误差,使预测更加精准,为医院领导层提供更加准确的决策支持。其次,该模型能够充分利用医院历史和实时数据,为医院管理者提供处理关键报警所需的信息和指导,提升医院的总体管理效率,并缩短患者就诊时间,有效解决患者“看病难”的现状,为广大医疗患者谋福祉,响应了国家政策。
主要参考文献
[1]宁媛,李皖.图像去噪的几种方法分析比较[J].贵州工业大学学报:自然科学版,2006(34).
[2]李彦,汪胜前,邓承志.多尺度几何分析的图像去噪方法综述[J].计算机工程与应用,2011(47).
[3]范启勇,秦晓宏,刘青,等.上海市医院信息集成平台建设与实践应用指南[M].北京:科学出版社,2016.
[4]白国刚,杨宏桥.医院数据中心建设研究[J].中国医疗设备,2012(7).
[5]伦淑娴,林健,姚显双.基于小世界回声状态网的时间序列预测[J].自动化学报,2015(9).
[6]饶运章,徐水太,熊灵燕.基于ARIMA模型的矿区重金属污染时间序列预测[J].金属矿山,2010(6).
[7]霍晓宇,杨仕教,吴长振.基于BP神经网络的混沌时间序列预测方法及应用研究[J].南华大学学报:自然科学版,2012(2).
[8]王卫琪,景立伟.自回归求和滑动平均模型在医院药品收入预报中的应用[J].山西医科大学学报,2008(3).endprint