骆夏草
摘 要 伴随着信息技术高速发展,信息的提取和利用技术逐渐占据重要地位。本文首先介绍了数据挖掘的概况,其次基于挖掘技术提取某市级三甲医院上报的肝炎病例,通过细致研究和探讨,分析该医院服务范围内2008-2016年肝炎的流行趋势,对本地区做好肝炎的防控工作提供数据依据和支持,以发挥数据挖掘的最大价值。
【关键词】数据挖掘 流行趋势 防控措施
本研究基于挖掘技术对市某三级甲等医院信息系统中的数据进行提取与处理,以2008年1月~2016年12月时间段内诊断并上报的肝炎临床资料为例,深入研究肝炎的发病规律和流行趋势,为更好地预防和控制该地区肝炎的流行提供科学依据。
1 数据挖掘的概述
1.1 数据挖掘的概念
数据挖掘也称数掘库中的知识发现(Knowledge Discovery in Databases),简称:知识发现(KDD)。就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘与传统的查询、报表等数据分析方法具有本质的区别,主要表现在数据挖掘在对业务信息进行挖掘时并没有明确的目标。
1.2 医疗信息数据的挖掘过程
数据挖掘是一个交互,反复的过程,鉴于医疗信息数据的特点,对它的挖掘不同于常规的数据挖掘,但依然有规则可循,一般分为以下几个过程进行(如图1)。
2 原始数据的特征和提取方法
医院业务生产中产生的数据与其它行业生产积累的数据相比,有其自身的独特性。医生在诊治过程中产生的数据,包括与病人的交谈记录,各种医学仪器拍摄的图片,主观的观察说明等,这些医疗信息数据基本具有多样化、非标准化、低数学性、私密性、不完整性、冗余性、时效性等特点。
本文将研究的数据为某三甲医院运营中所产生的业务数据,多个数据表存储有相同字段,病人信息表,病案主页表,病人诊断记录是各自独立的,三个表之间通过病人id进行关联,提取本次研究所用到的字段。2008年~2016年,该院共报告肝炎病例12910例,大大高于其他传染病种,故选取肝炎病例作为本次挖掘的资料来源。
3 挖掘实例分析
3.1 某三级甲等医院肝炎上报病例流行趋势
其中男性病例为8075例(62.55%),女性病例为4835例(37.45%),男女性别比:1.67:1;平均发病年龄(43.86±13.48)岁,未发现死亡病例;从肝炎的型别看,乙肝病例11300例(87.53%),丙肝1583例(12.26%),其他肝炎27例(0.21%)。
该院2008~2012年肝炎上报病例的变化趋势如图2所示,乙肝上报病例数呈明显上升趋势,至2013年达到高峰后又逐年下降;丙肝上报病例也呈明显上升趋势,但上升速度慢于乙肝。
3.2 某三级甲等医院肝炎上报病例的年龄分布
该院上报的肝炎病例发病年龄为1~92岁,乙肝病例的平均发病年龄为(42.61±13.46)岁,男性(41.12±12.40)岁,女性(45.39±13.46)岁,该院上报的男性乙肝病例年龄低于女性乙肝病例。丙肝病例的平均发病年龄为(52.78±13.83)岁,男性(51.71±15.60)岁,女性(53.65±12.68)岁,男性丙肝病例的年龄也低于女性乙肝病例。
该院上报的肝炎病例的年龄变化趋势见图3,可见,乙肝病例以31~45岁组最多,丙肝以46~65岁组最多。
3.3 讨论与分析
本研究的结果显示乙肝病例占该院上报肝炎病例的87.53%,是名副其实的肝炎优势病种,这提示:在该院服务半径内,肝炎(特别是乙型肝炎)仍需要广大居民采用主动、积极的预防措施。该院上报的肝炎发病年龄集中在31~66岁的青壮年,男性病例远多于女性;目前,接种肝炎疫苗是有效防控肝炎流行的最为有效、最为经济的预防措施之一。有研究报道:随着乙肝疫苗及时接种率提高及高危人群疫苗接种的加强,乙肝病毒携带人数将逐渐下降,从而引起总体发病率的下降。2013~2016年,该院上报的乙肝病例呈现明显的下降趋势,提示:这可能是本地区采取的加强乙肝疫苗的接种政策取得了积极有效的防治效果,与上述报道一致。另有研究表明,丙肝疾病的自然过程和感染机率的增加是老年龄组人群丙肝发病率增加的原因,丙肝发病率在30岁以下年龄组人群发病率较低,发病高峰向老年龄组转移;该流行特征与本研究结果基本一致。
4 结果与建议
通过数据挖掘技术,对现有数据进行再利用,提出以下建议,以期达到提高工作针对性的目的。
(1)在加强<15岁儿童肝炎疫苗查漏补种工作的同时,针对成年人群(尤其是30~60随年龄组)进行乙肝和丙肝疫苗的强化接种,提高全人群的肝炎抗体水平,在高危人群中建立有效的免疫屏障。
(2)加强对≥40岁年龄组人群加强血源及不安全注射的管理,强化该年龄段人群的卫生意识,并开展针对流动人口的丙肝抗体监测与管理,及时查漏补种丙肝疫苗,强化免疫。
(3)对广大居民加强健康宣传教育,加大肝炎防控知识的宣传,特别是针对重点人群普及乙肝传播途径的知晓面;同时积极引导广大居民培养良好的卫生习惯,提高主动预防各类肝炎的意识,减缓肝炎病毒的传播。
参考文献
[1]John Satzinger,Robert Jackson,Stephen Burd.系统分析与设计(第四版)[M].北京:机械工业出版社,2009:275-480.
[2]彭统乾.教学管理决策支持系统中数据仓库的设计与实现[D].西安:西安电子科技大学,2011:22-37.
[3]Lin TY.Data Miningand Machine Oriented Modeling:Agranular Computing Approach[J].Applied Intelligence,2000,13(02):113-124.
[4]洪弘.医疗数据挖掘的特点_过程及方法[J].价值工程,2011,32-0166-02.
[5]张万军,张瑾,袁兆虎等.江苏省镇江市2004-2015年病毒性肝炎流行特征分析[J].中国卫生统计,2017,34(02):240-242,246.
[6]张丽,刘甲野,吕静静等.2014年山东省育龄期妇女乙型肝炎流行现状分析[J].中华预防医学杂志,2017,51(06):475-479.
[7]黄丽芳,周勇,郑金凤等.福建省乙型肝炎高流行区急性乙型肝炎发病影响因素研究[J].中华预防医学杂志,2016,50(12):1102-1104.
[8]嵇玮嘉,颜学兵.2016年与2015年欧洲肝病学会丙型肝炎治疗指南关于直接抗病毒药及药物间相互作用的比较[J].临床肝胆病杂志,2017,33(06):1033-1039.
[9]中华医学会肝病学分会,中华医学会感染病学分会.丙型肝炎防治指南(2015年更新版)[J].中华实验和临床感染病杂志(电子版),2015,9(05):590-607.
作者单位
西安市中医医院 陜西省西安市 710021