高馨,田杰,宋萍
(1.重庆医科大学公共卫生与管理学院/医学与社会发展研究中心/健康领域社会风险预测治理协同创新中心,重庆市 400016;2.重庆医科大学,重庆市 400016; 3.重庆医科大学附属儿童医院病案统计科,重庆市 400016)
◁信息管理▷
门诊信息数据挖掘研究进展*
高馨1,田杰2,宋萍3
(1.重庆医科大学公共卫生与管理学院/医学与社会发展研究中心/健康领域社会风险预测治理协同创新中心,重庆市 400016;2.重庆医科大学,重庆市 400016; 3.重庆医科大学附属儿童医院病案统计科,重庆市 400016)
【摘要】随着医院信息化的不断推进与发展,信息资源需求与利用匮乏之间的矛盾也日益突出。在我国对于信息的研究仅仅是停留在信息平台的建设与搭建,对于信息资源的挖掘和应用研究很少,而大部分的信息研究还是以住院方面的为主。笔者从国内外对门诊信息化的建设发展到门诊数据的逐步利用情况进行了探索,希望从门诊提供一个视角,能够利用数据挖掘从门诊积累的数据中分析出深层次的、高价值的信息,来为医院甚至卫生部门的各种决策提供支持和方向。
【关键词】门诊信息;数据挖掘;信息资源;医院信息化
门诊是医疗机构中接触病人数量最多,影响范围最广的重要板块,是医院的服务窗口,关系到医院的声誉和形象。同时,它也体现着医院的整体管理水平、医疗质量以及服务质量。更重要的是其存储的大量的医疗及管理信息可以为疾病研究、医院管理、医疗政策的制定提供丰富的研究数据,从而为提高全民健康水平提供科学依据。探索国内外门诊信息的研究状况以及大数据背景下门诊数据挖掘方面的研究重点和方向,以期为门诊信息挖掘相关的研究提供参考。
1国外研究状况
1.1医院管理信息系统(HIS)的发展
美国著名信息学教授Morris.Collen于1988年将医院信息系统定义为:利用电子计算机和通讯设备,为医院所属各部门提供病人诊疗信息和行政管理信息的收集、存储、处理、提取和数据交换的能力,并满足所有授权用户的功能需求。HIS注重的是患者的健康数据,通常包含门诊、住院两部分。早在20世纪60年代初,美国便开始了HIS的研究。著名的麻省总医院开发的COSTAR系统是60年代初开始并发展至今仍在使用的大规模临床病人信息系统。随着计算机技术的发展,70年代HIS进入大发展时期,美日欧各国的医院,特别是大学医院及医学中心纷纷开发HIS,成为医药信息学的形成和发展的基础。70至80年代,美国的HIS产业已有很大发展。日本的HIS开发和应用始于70年代初,多数日本医院是80年代以后才开始运用HIS工作的,但发展十分迅猛,主是以大型机为中心的医院计算机系统。欧洲的HIS发展比美国稍晚,大多数是70年代中期和80年代开始的。
1.2信息化建设在门诊的应用
美国利用门诊数据进行了如下研究:婴儿发烧不使用抗生素的门诊管理研究[1],研究结论得出,绝大多数1~2个月的发烧婴儿都可以安全地在门诊进行治疗且不使用抗生素;成人恶性肿瘤发热和中性粒细胞减少的抗菌预防用药和门诊管理[2],该研究对中性粒细胞减少性肿瘤发热和中性粒细胞减少的门诊患者提供了抗菌素预防用药参考;门诊辅助治疗的费用是否能节省国家开支[3],研究得出,门诊辅助治疗虽然需要国家投入大量的卫生资源,但总体上可以减少严重精神病患者的服务成本,对于不符合门诊辅助治疗资格的精神病患者,根据目标人群和当地的服务系统,可以自愿参加社区服务,随着时间增加也能减少国家整体的服务价格;列出各项门诊诊疗单价的影响[4],研究得出,医生开处方时为医生列出各项诊疗费用单价可以减少患者总的诊疗费用;此外,还有门诊治疗28~89天发热婴儿肌肉注射头孢[5],流感对住院人次、门诊人次和儿童抗生素疗程的影响[6]等多方面的研究。瑞士利用门诊数据进行了门诊管理对急性胸痛和轻度心肌钙蛋白浓度增加患者的安全性研究[7];英国对痰液颜色与急性加重型COPD门诊管理的关系进行了研究[8];爱尔兰的学者利用门诊信息分析了内分泌学家和一般医生对糖尿病患者门诊护理的差异[9];比利时学者对1997年至2009年门诊喹诺酮类用药进行研究,进而对欧洲抗生素消费进行监测[10]。
2国内历史阶段
2.1门诊信息化建设发展历程
国内的门诊信息化最早要追溯到20世纪70年代末20世纪80年代初,一些医院利用单机操作,开始了门诊收费的应用;到80年代中期,在部门局域网基础上,进一步开发了门诊计价与收费发药系统;从90年代开始,由于“八五”课题和“金卫”工程的开展,HIS进入到快速发展阶段,医院相继在100M快速以太网上建立了较为完整的医院信息系统,门诊挂号系统、门诊收费管理系统在此基础上得到进一步的发展[11]。进入21世纪,特别是2003年SARS的突然暴发,进一步刺激了医院信息系统的发展,尤其是门诊信息系统、医学图像处理系统(PACS)、实验室(检验科)系统(LIS)的建设以及门诊病人标识码(DI)的工作,主要解决了门诊病人实名就诊和医学图像传递的问题[12]。随着无线网络和移动计算技术的不断发展,以及医院信息化的不断深入,开始向数字化医院(E-hospital)、“三无”(无纸、无胶片、无线网络)医院不断迈进,使区域医疗卫生信息化、远程医疗、移动医疗等成为可能。
2.2门诊信息数据积累
随着门诊信息化的逐步建立,门诊信息记录的载体实现了从纸质到电子化的转变。最初的门诊数据仅仅是被储存、收集到相应的数据库中,只起着记录的作用。随后逐步实现了从信息的局部传输到大范围的信息共享。门诊信息系统的逐渐发展,数据类型也发生了很大的变化,从以文本信息为主,发展到现在包括文本、结构化文本、图片、影像等多样的信息数据。目前医院信息系统内已经存储了海量的信息数据,为门诊医疗信息大数据的开发和应用提供了可能。
2.3门诊信息数据利用历史进程
2.3.1统计利用阶段。随着医院信息化的发展和医院管理方面的需要,信息数据也在逐步得到利用。从20世纪80年代末开始到90年代,就陆续开始在利用门诊数据。杨建南[13]对医院的门诊量进行了季节性的分析,易东等[14]对门诊量进行预测,罗丽妮等[15]对门诊医师的工作量进行了统计分析,李伟等[16]进行了关于门诊项目成本及收费的研究。
2000年以后,随着医院市场经济弊端的突显,各地医疗资源发展的不平衡,造成国内大型综合性医院普遍存在“三长一短”的突出问题,并已经成为门诊医疗服务中的主要矛盾。因此,对门诊业务流程进行优化重组,是业界认可的提升门诊就诊效率、规范医疗业务管理、提高门诊医疗服务质量的有效方式[17]。例如,通过对门诊、临床科室工作量以及医疗设备使用率等情况的统计分析和审核,可以从侧面反映出医院的发展规模以及服务水平[18];通过门诊病人的相关特点,统计门诊病人投诉的原因分析[19],统计门诊变化量趋势[20],关于病人的疾病谱分析等。赵英等[21]分析了流程再造在门诊静脉输液护理中的应用,任月红等[22]分析了门诊诊疗人次季节动态变化,贾茂俊[23]论述了门诊药房的管理。但这段时期对于门诊信息的利用仅仅停留在利用统计分析的方法上,且数据量较小。
2.3.2门诊信息化挖掘研究阶段。2011 年 5 月,麦肯锡公司在大数据的报告中首次提出大数据的概念[24],而后,大数据迅速成为政府、科技等各个行业关注的热点。医疗领域也不例外,医院的生存发展靠的是正确的决策,而决策的基础是信息。大数据时代下,对于海量数据,无法再用统计的方法来进行,数据挖掘逐渐替代传统的统计,成为研究数据的重要手段和方法,对于门诊信息的利用和挖掘也更为深入和有效。
目前,国内已经有许多医院利用门诊数据结合数据挖掘方法进行了相关的研究和应用。李运明等[25]利用ARIMA模型对某三甲医院3年的门诊患者数据进行了拟合评价,预测了未来2年的门诊量,为门诊管理决策提供依据。傅翔等[26]对某门诊处方数据进行了分析,利用数据挖掘软件PASW®Modeler13,建立Apriori关联分析模型,挖掘处方中药物之间的关联规则,发现药物与年龄、医保、疾病类型之间的关系。韩蓉等[27]对医院门诊用药的合理性进行了分析,从海量的医疗数据中找出门诊各科室医生、处方金额、药品用量、是否医保政策允许范围药品等之间的关联规则,找出门诊用药可能存在的问题。
左嵩等[28]以聚类方法进行数据挖掘建模,对门诊就诊数据中包括年龄、性别、病人类型、就诊日期时间、挂号代码和医生工号等有用字段进行挖掘,从而对病人的年龄结构、病人类型、诊断结果、门诊时间以及病人所选择就诊医生的情况进行了分析。罗衡郴等[29-30]通过使用关联规则中的Apriori算法,挖掘出门诊电子病历系统中的门诊处方,寻找到门诊处方中常用药物的联合配伍。之后进一步采用FP-Growth算法从中挖掘出隐含在其中的医疗诊断规则和模式,进行了处方和药物关联规则的分析,寻找出了常用药物配合联伍、疾病诊疗方案、医生用药偏好、病患的辩证施治等各类模式,供临床、科学研究和医院管理使用。郝璐等[31]基于ODS数据集成信息资源库的多维联机分析(OLAP)门诊医生工作站病人诊断信息,通过对门诊病人就诊病种填写情况监测,制定措施,获得准确门诊病种,掌握门诊优势学科和优势病种,合理调整门诊资源配置。杨海青[32]对于门急诊就医趋势、门诊病人疾病谱分析、门急诊病人人次进行了相应的数据挖掘分析,为门诊管理工作提供了参考依据。
3研究方向展望
3.1信息数据标准化
目前医院的系统如HIS、LIS、RIS、CIS、PACS等系统都是事务性数据库,它们对于医院流程规范、工作效率的提高等起着不可替代的作用。但由于缺乏统一的标准,使得多个数据库之间关联分析存在很大的问题。制订和实施全国统一的信息标准,使医院管理系统之间实现无缝连结和运行是接下来首先应该研究解决的问题。另一方面,对于一些重要字段,尽管有标准但没有强制统一运行,比如疾病诊断,尽管全国已经有统一的ICD-10编码字典库,但卫生行政部门没有对医院提出应对门诊疾病诊断进行标准化编码的要求。没有统一的标准,将很难实现疾病数据的交换、共享和统计。而对于门诊病人疾病的研究将是医院研究的重要领域。
3.2区域平台共享与协同
英国、美国、加拿大、澳大利亚等一些国家先后投入巨资,开展了国家和地方级以电子健康档案和电子病历数据共享为核心的区域性卫生信息化建设。这些举措的主要推动力来自于伦理上的需求——最大限度地保证公民的医疗质量和安全,以提升整体医疗服务质量、提高医疗服务可及性、降低医疗费用、减少医疗风险。区域平台的共享与协同理应成为下一步医疗信息领域的重点研究方向,而前提条件是所有患者的健康档案必须是电子化的。
3.3智能健康顾问
随着未来医疗模式的改变,逐渐倾向于“4P”:可预见性(Predictive)、可预防性(Preventive)、个人化(Personalized)、参与性(Participatory),医生的角色也将发生变化,医疗重心将转移到预见性和预防性方面,大数据时代的到来,使得与传统门诊相比,医务人员所做的很多如检查、诊断、开药、护理、回访等工作,可能被大量的传感器、成千上万的数据点、实时的远程数据分析等行为代替[33]。所以,未来的数据挖掘,将更倾向于从预防和自身健康管理的角度来进行,即每个人往往都可能是一个巨大的数据源,其本身纵向的数据量能够为其提供很好的健康参考及预防提示,那么在一定程度上就能起到疾病的预防和防控作用。这无疑也是医疗卫生领域研究的重要方向。
3.4新的医疗管理流程再造
基于海量数据的挖掘,除产生挂号信息流、诊断信息流、医技管理信息流、处方处理信息流还会增加收费、候诊管理、健康服务、科研等大量的管理信息流,在这些大量的信息资源中,隐藏着巨大的信息宝库值得去挖掘。大数据支撑下的全新的门诊流程再造将更加科学、有效。
纵观国内外对于门诊信息的利用研究,最初仅是对数据进行管理,采用传统数据统计,之后开始从某一个方面或者局部某一个领域去展开进行挖掘研究,所获得的信息也往往有限,只能够在其研究领域发挥作用。门诊信息中存在很多空白部分等待去被挖掘研究。而随着信息数据的日积月累,以及数据挖掘技术的出现,大数据背景下的门诊医疗研究将成为可能和趋势,并具有极大的意义。
参考文献
[1]Baker MD,Bell LM,Avner JR.Outpatient management without antibiotics of fever in selected infants[J].N Engl J Med,1993,329(20):1437-1441.
[2]Flowers CR,Seidenfeld J,Bow EJ,et al.Antimicrobial prophylaxis and outpatient management of fever and neutropenia in adults treated for malignancy: American Society of Clinical Oncology clinical practice guideline[J].J Clin Oncol,2013,31(6):794-810.
[3]Swanson JW,Van Dorn RA,Swartz MS,et al.The cost of assisted outpatient treatment: can it save states money?[J].Am J Psychiatry,2013,170(12):1423-1432.
[4]Tierney WM,Miller ME,McDonald CJ.The effect on test ordering of informing physicians of the charges for outpatient diagnostic tests[J].N Engl J Med,1990,322(21):1499-1504.
[5]Baskin MN,O'Rourke EJ,Fleisher GR.Outpatient treatment of febrile infants 28 to 89 days of age with intramuscular administration of ceftriaxone[J].J Pediatr,1992,120(1):22-27.
[6]Neuzil KM,Mellen BG,Wright PF,et al.The effect of influenza on hospitalizations,outpatient visits,and courses of antibiotics in children[J].N Engl J Med,2000,342(4):225-31.
[7]Meune C,Reichlin T,Irfan A,et al.How safe is the outpatient management of patients with acute chest pain and mildly increased cardiac troponin concentrations?[J].Clin Chem.2012,58(5):916-924.
[8]Stockley RA,O'Brien C,Pye A,et al.Relationship of sputum color to nature and outpatient management of acute exacerbations of COPD[J].Chest,2000,117(6):1638-1645.
[9]O′Donnell M,de Siún A,O'Mullane M,et al.Differences in the structure of outpatient diabetes care between endocrinologist-led and general physician-led services[J].BMC Health Serv Res.2013,13:493.
[10]Adriaenssens N,Coenen S,Versporten A,et al.European Surveillance of Antimicrobial Consumption (ESAC): outpatient quinolone use in Europe (1997-2009)[J].J Antimicrob Chemother,2011,66(S6):47-56.
[11]赛迪顾问.医院信息化发展调查研究报告[R].www.ccidnet.com.
[12]何雨生.2003年医疗卫生领域信息化进展[J].中国医院,2004,(10):7-11.
[13]杨建南.医院门诊工作量的季节性分析[J].中国卫生统计,1991,(5):46.
[14]易东,尹全焕.改进的单段函数残差辨识法在医院门诊工作量预测中的应用[J].中国医院管理,1992,(10):28-30.
[15]罗丽妮,蔡巧玲.医院门诊医师工作量统计现状分析[J].中国卫生统计,1994,(2):64.
[16] 李伟,陈浩.门诊项目成本与收费研究[J].中国社会医学,1994,(4):61-62.
[17]刘剑锋,周来新.信息技术在门诊的综合应用与体会[J].中国数字医学,2011,6(4):99-101.
[18]季燕.医院信息统计作用分析[J].现代经济信息,2015,(1):99.
[19]陈木莲,梁洁萍.339例门诊病人投诉原因分析[J].现代医院,2011,11(3):123-124.
[20] 李海燕,张徐龙.2000—2009年门诊量变化趋势分析[J].中国病案,2011,12(6):60-61.
[21]赵英,杜小芳.流程再造在门诊静脉输液护理中的应用体会[J].浙江医学教育,2007,(2):29-30,57.
[22]任月红,赵晓娟,张雅琼.门诊诊疗人次季节变化动态分析[J].中国病案,2008,(1):28-29.
[23]贾茂俊.门诊药房的管理[J].内蒙古医学杂志,2009,(S4):177-178.
[24]James M,Michael C,Brad B,et al.The next frontier for innovation,competition,and productivity[R/OL].[2015-10-15].http:∥www.mckinsey.com/Insights/Business_Technology/Big_data_The_next_frontier_for_innovation.
[25]李运明,吴凡.某三甲综合医院门诊量ARIMA预测分析[J].中国病案,2014,15(8):53-55.
[26]傅翔,陈盛新,杨樟卫.门诊处方药物关联的数据挖掘[J].药学实践杂志,2011,29(2):131-135.
[27] 韩蓉,吴俊.基于数据挖掘技术的门诊合理用药分析[J].中国医疗设备,2014,29(4):48-50.
[28]左嵩,张雄,刘礼德.基于数据挖掘的门诊信息资源分析[J].现代生物医学进展,2013,13(23):4568-4573.
[29]罗衡郴,周晓辉.Apriori算法在电子病历门诊处方系统中的应用[J].广西工学院学报,2009,20(3):66-69.
[30]罗衡郴,周晓辉.FP-Growth算法在电子病历挖掘中的应用[J].大众科技,2010(12):26-28.
[31]郝璐,姚远,刘建超,等.基于OLAP的门诊医生工作站诊断信息分析[J].中国医院,2009,13(1):65-66.
[32] 杨海青.数据挖掘技术在医院管理中的应用[J].中华医院管理杂志,2005,21(7):497-499.
[33]解丹,郝星星,毛树松,等.基于大数据的门诊信息流重构及其发展趋势探讨[J].湖北中医杂志,2014,36(11):80-81.
(编辑马兰)
*基金项目:重庆医科大学医学信息学院院级课题(2014A001)
【中图分类号】R197
【文献标识码】A
【文章编号】1672-4232(2016)01-0075-04
【DOI编码】10.3969/j.issn.1672-4232.2016.01.025
通信作者:宋萍(1973-),女,高级统计师,主任;研究方向:医院病案管理与医院统计。
收稿日期:2015-11-05
Development of the Study on Outpatient Information Data Mining
GAO Xin1,TIAN Jie2,SONG Ping3
(1.School of Public Health and Management/Research Center for Medicine and Social Development/Innovation Center for Social Risk Governance in Health,Chongqing Medical University,Chongqing 400016,China; 2.Chongqing Medical University,Chongqing 400016,China; 3.Medical Records and Statistics Room,Children′s Hospital of Chongqing Medical University,Chongqing 400016,China)
【Abstract】With the advancement and development of hospital informatization,the contradiction between the demands for information resources and deficient utilization of the resources is increasingly prominent.Information study rests on the establishment of information platform in our country.Least study was on information excavation and its application while much was on hospitalization.Therefore,this article explores the construction and development of outpatient informatization,and the gradual application of outpatient data.It is expected that an outpatient view angle can be helpful in discovering deep-seated and highly valuable information from development among the accumulated outpatient data,which provides support and direction for hospitals and health sectors making various decisions.
【Key words】outpatient information;data mining;information resources;hospital informatization