,
随着医疗信息化程度日益加深,医疗数据大量积累,医疗大数据时代已经到来[1-2]。医疗大数据是对患者在医疗活动中产生的全体数据的集合,包括患者个人信息、诊疗信息、电子病历、用药数据、医学影像数据等[3]。医疗大数据为医疗卫生事业的发展带来了巨大的机遇,也为循证医学的发展提供了宝贵的数据资源。为促进医疗大数据的发展,我国陆续出台了多项相关政策,将医疗大数据发展纳入国家大数据发展战略,全面推进医疗大数据的挖掘和应用[4-5]。如何科学有效地对医疗大数据进行挖掘与分析,为临床实践提供全面、可靠的数据支持,推动强调证据为基础的循证医学的发展,促进医疗大数据在医学领域的应用与研究,成为当前医疗行业发展的必然趋势[6-7]。
儿童的各个器官都处在生长发育的特殊阶段,肝肾解毒功能较差,容易出现用药安全问题[8]。据调查,我国每年约30 000名儿童由于用药不当导致耳聋, 约7 000名儿童因此失去生命[9]。因此,充分挖掘儿童用药大数据,发现其中潜在的规律,可为儿科医生临床用药提供决策支持。本文尝试将数据挖掘技术应用于儿童过敏性紫癜用药模式分析,为儿童用药决策以及合理用药提供循证医学支持。
数据挖掘是指通过对大量有噪声、不完整的模糊数据进行探索和分析,发现数据有潜在价值的模式和知识[10-11]。数据挖掘的流程包含数据收集、数据预处理、数据挖掘、结果解释与评价[12]。
数据挖掘有多种算法,本文使用关联规则算法进行挖掘,关联规则算法包含频繁项集和关联规则2个核心概念。频繁项集是指经常一起使用的药品或药品组合,包含k种药品的项集称为k-项集,频繁项集要满足最小支持度,即药品出现的频率要高于某一阈值;关联规则是蕴含关系A→B,表示如果使用了药品A,就会与使用药品B产生关联。强关联规则要满足最小支持度和最小置信度,有效的关联规则要满足提升度>1。支持度(Support)、置信度(Confidence)和提升度(Lift)的公式如下[13-14]:
Support(A→B)=P(A∪B)
Confidence(A→B)=P(B/A)
Lift(A→B)=P(B/A)/P(B)
本文利用数据挖掘技术对儿童用药模式进行挖掘。过敏性紫癜是儿童多发的一种血管炎疾病,主要临床表现为皮肤紫癜,伴有关节肿痛、腹痛、肾脏损害和消化道出血等症状[15-16]。通过对儿童过敏性紫癜药品使用频率、药品之间的关联性进行分析,发现儿童用药的特点及规律。
收集2012年1月~2018年5月日照市某市级公立医院收治的年龄介于2~14岁的505例(男孩309例,女孩196例)过敏性紫癜患儿用药数据。
医疗大数据经常存在噪声、不完整和不一致的问题,因此在数据挖掘前要对儿童过敏性紫癜用药数据进行预处理。
2.2.1 隐私保护和属性提取
医疗大数据中包含多项患者的隐私信息,必须进行保护。首先对数据库中的数据进行匿名化处理,隐藏与患者隐私相关的属性,如姓名、家族病史等信息;然后根据数据挖掘的目标,在数据库中进行属性选择,提取患者的病历号、医嘱内容、医嘱时间等属性,忽略其他无关的属性。
2.2.2 数据清洗
对数据库中的医嘱数据进行清洗。除去临床上常用的药物溶媒以及护理、禁食等医嘱内容,对不同时间段多次使用某种药品造成的数据冗余进行消除重复处理,填补医嘱数据中的缺失,删除医嘱数据中的异常值,提高数据的完整性。
2.2.3 药品名规范和编码
由于医院数据库中的药品名称不规范,根据《中华人民共和国药典》将药品名规范统一化。如将“西替利嗪糖浆”统一为“盐酸西替利嗪糖浆”,“孟鲁司特咀嚼片”统一为“孟鲁司特钠咀嚼片”,保证药品名的一致性。最后,用d1,d2,……,dn对药品名进行编码,其中,“n”表示药品种数,能够在某种程度上简化挖掘过程。
在R语言中实现关联规则Apriori算法,挖掘儿童过敏性紫癜用药模式。为便于R语言接收,需要把数据另存为csv格式,通过read.csv()函数读入R中,用data表示读入的待挖掘数据。
2.3.1 用药统计汇总
通过summary()函数对data统计汇总,得到最小值、最大值、四分位数和均值等统计信息。语句为summary(data)。
2.3.2 发现频繁项集
通过eclat()函数,设置支持度阈值为20%,最大项数为1,找出用药数据的频繁1项集。语句为eclat(data, parameter=list(support=0.2, maxlen=1))。
通过eclat()函数,设置支持度阈值为30%,最小项数为2,最大项数为5,找出频繁项集。语句为eclat(data, parameter=list(support=0.3, maxlen=5, minlen=2))。
2.3.3 发现关联规则
通过apriori()函数,设置支持度阈值70%,置信度阈值80%,得到用药数据的关联规则。语句为apriori(data,parameter=list(support=0.7,confidence=0.8))。
儿童过敏性紫癜用药数据的统计信息见表1。
表1 儿童过敏性紫癜用药统计信息
从表1可以看出,在不考虑溶媒的条件下,过敏性紫癜患儿在治疗过程中最少使用2种药品,最多使用13种药品;四分之一的患儿用药种数≤6种,一半的患儿用药种数≤8种,四分之三的患儿用药种数≤9种,而患儿平均用药种数为7.604种。
3.2.1 频繁1项集
利用函数inspect()察看支持度最高的前10项频繁1项集,得到过敏性紫癜儿童最常用的10种药品(表2)。
表2 过敏性紫癜儿童常用药品
从表2可知,维生素C注射液、西咪替丁注射液、盐酸西替利嗪糖浆、双嘧达莫片和低分子肝素钠注射液应用最多。维生素C注射液主要用于紫癜的治疗,西咪替丁注射液可以抗组胺、减轻腹痛,盐酸西替利嗪糖浆主要是抗组胺,双嘧达莫片用于阻止血小板聚集和血栓形成,低分子肝素钠注射液可以抗凝血、预防血栓,说明过敏性紫癜的治疗主要为对症支持,抗组胺、抗凝治疗。
3.2.2 频繁项集
利用函数inspect()察看支持度最高的前10项频繁项集,得到最常用的10种药品组合(表3)。
表3 过敏性紫癜儿童常用药品组合
在这些药品组合中,维生素C注射液联合西咪替丁注射液是减少紫癜和抗组胺,西咪替丁注射液联合盐酸西替利嗪糖浆是抗组胺和抗过敏,维生素C注射液联合盐酸西替利嗪糖浆是减少紫癜和抗组胺、抗过敏,西咪替丁注射液联合双嘧达莫片是抗组胺、减轻腹痛和抗凝,说明过敏性紫癜儿童可能与食物、微生物和药物等因素相关,但没有确凿证据,因此发病原因难以确定。过敏性紫癜患儿的治疗主要为对症处理,补充维生素,应用抗组胺药物,腹痛时应用西咪替丁、抗凝药物、激素和免疫抑制剂,抗生素应用较少。
利用inspect()函数按提升度>1.04筛选并察看关联规则,得到12条药品关联规则(表4)。
表4 过敏性紫癜儿童药品关联规则
对部分关联规则说明如下:
双嘧达莫片和盐酸西替利嗪糖浆联合使用的概率是81.19%。如果患儿使用了双嘧达莫片,则有95.35%的可能使用盐酸西替利嗪糖浆;如果使用了盐酸西替利嗪糖浆,则有91.11%的可能使用双嘧达莫片。
盐酸西替利嗪糖浆和西咪替丁注射液联合使用的概率是88.12%。如果患儿使用了盐酸西替利嗪糖浆,则有98.89%的可能使用西咪替丁注射液;如果使用了西咪替丁注射液,则有92.71%的可能使用到盐酸西替利嗪糖浆。
盐酸西替利嗪糖浆联合低分子肝素钠注射液和西咪替丁注射液的概率是73.27%。如果患儿使用了盐酸西替利嗪糖浆和低分子肝素钠注射液,则有100%的可能使用西咪替丁注射液。
维生素C注射液联合双嘧达莫片和盐酸西替利嗪糖浆的概率是78.22%。如果患儿使用了维生素C注射液和双嘧达莫片,则有95.18%的可能使用盐酸西替利嗪糖浆;如果使用了维生素C注射液和盐酸西替利嗪糖浆,则有90.80%的可能使用双嘧达莫片。
总的来看,双嘧达莫片与盐酸西替利嗪糖浆,盐酸西替利嗪糖浆与西咪替丁注射液在儿童过敏性紫癜治疗中具有较高的相关性。双嘧达莫片主要有抗凝的作用,盐酸西替利嗪主要用于抗组胺、抗过敏,西咪替丁主要是抗组胺、解痉、减轻腹痛,说明抗凝、抗组胺、抗过敏是过敏性紫癜(皮肤型)的主要治疗方案,而抗组胺、抗过敏、护胃解痉是过敏性紫癜(腹型)的主要治疗方案。
此外,盐酸西替利嗪糖浆与低分子肝素钠注射液、西咪替丁注射液的关联广泛,3种药品的合并用药可以抗组胺、抗凝、解痉,治疗过敏性紫癜腹痛。维生素C注射液与盐酸西替利嗪糖浆、双嘧达莫片的关联关系说明在减轻紫癜的基础上,抗组胺、抗凝是治疗儿童过敏性紫癜的主要思路。
经过与患儿所在医院的儿科主任医师沟通,以上挖掘结果与儿童过敏性紫癜的临床用药情况相符合,体现出了儿科医师治疗该病时的用药习惯和诊疗思路,在辅助临床给药、传承用药经验和促进用药规范等方面具有实用价值。
随着医疗行业信息化的不断深入,医疗大数据的价值正日益显现。如何充分利用医疗大数据,挖掘医疗大数据背后隐藏的价值,提高医疗服务水平,成为医疗大数据时代的重要研究领域。
本文利用医疗大数据和数据挖掘技术,挖掘儿童过敏性紫癜的核心用药及药品间的关联规则,分析儿童用药的特点和规律,为指导儿童临床用药提供了偱证医学支持。
但是需注意的是核心用药及用药规律仍要在临床实践中不断验证和评价,才能更好地发挥其在指导儿童用药方面的作用。