基于开放数据的降血脂药物不良反应数据挖掘

2017-03-21 05:10
中华医学图书情报杂志 2017年5期
关键词:降血脂药品途径

, , ,

1 背景

药物不良事件报告包括药物厂商、监管机构和公共卫生监测中心等维护的药物上市后的不良反应报告信息。虽然这些信息通常有不同的报告标准、编码词表和数据录入规则,也存在各自局限性[1],但仍有巨大的潜在价值。不良反应数据集的开放及相关信息系统的建设提升了不良反应报告和预警的科学性和及时性,如美国的食品药品监督管理局药品不良事件报告系统[2]。研究者通过对开放药物不良反应数据进行有效识别、处理、分析、组织与利用,得到有意义的药品不良反应知识发现,为药物管理及临床用药提供参考。

血脂异常是冠心病、心肌梗死、缺血性脑卒中等心脑血管疾病的重要独立危险因素之一[3]。据最新调查统计[4],2004年我国成人血脂异常患病率已达18.6%,预计全国患病人数达1.6亿。世界卫生组织(WHO)统计结果显示,如果未来五年内40岁高血脂患者的血清胆固醇下降10%,则能降低50%心脏病发病率[5]。近年来国内外医学界对降血脂健康教育的不断加强,推动了降血脂药在慢病管理的应用[6]。随着应用人数的增加,降血脂药不良反应(Adverse Drug Reaction,ADR)的监测应受到更多的重视。

本文利用国家人口与健康科学数据共享平台提供的药品不良反应数据库和降血脂药数据库[7],根据降血脂药数据库中的药物名称从药品不良反应数据库中提取降血脂药的ADR数据,利用回顾性统计方法、logistic回归等数据挖掘方法分析降血脂药的主要不良反应,为降血脂药的监测管理提供参考,提高降血脂药用药的合理性和安全性。

2 国内外研究现状

目前,药品不良反应挖掘的方法主要有比例失衡算法(Disproportionality Analysis)、逻辑回归建模(Logistic Regression Modeling)[8]、关联规则挖掘(Association Rule Mining)[9]、聚类分析(Clustering)、网络分析(Network Analysis)和决策树(Decision Tree)等方法,这些方法常被应用于药品不良反应分析中[10]。许多国内外学者、研究机构和卫生管理部门应用这些方法,对药品不良反应数据进行了信息处理和数据挖掘,并对其中的不良反应信号进行监测,及时发现潜在的问题。

荷兰药物警戒中心(The Netherlands Pharma-covigilance Centre Lareb)利用逻辑回归建模对合并用药导致的不良反应信号进行探测[11];蒋朋利使用逻辑回归法对他汀类降血脂药与雷诺嗪联用是否导致横纹肌溶解进行了挖掘,他选取他汀类药物单独使用、雷诺嗪单独使用和两种药物合并用药的ADR记录,采用Ω收缩法和logistic回归法进行分析,得出合并用药发生横纹肌溶解的风险比雷诺嗪单用高近两倍的结论[12];Berlin等利用逻辑回归算法和比例失衡算法中的多项伽马-泊松分布缩减算法(Multi-item Gamma Poisson Shrinker,MGPS)对药物的不良反应进行探测显示两种算法的信号挖掘结果及性能大致相同[13];熊日成选取2003-2005年广州军区广州总医院416例接受冠状动脉介入治疗(PCI)术的急性冠性动脉综合征患者的资料,对患者基本情况、用药情况和患病情况等因素进行多元逻辑回归分析的。结果提示,氯吡格雷维持时间超过12月是引起出血的独立危险因素,同时提示,合并使用质子泵抑制剂则是减少出血并发症的因素[14]。

3 材料与方法

3.1 数据来源

本文数据来源于国家人口与健康科学数据共享平台提供的药品不良反应数据库和降血脂药数据库,数据库资料来源为国家食品药品监督管理总局信息中心。药品不良反应数据库中,包含7 367例去除隐私信息的个体不良反应记录,涉及多种药物;降血脂药数据库共有2 650条降血脂药的临床试验信息,每条记录包含了人群的基本情况、对照设置、药物效用、药理作用分类及不良反应发生情况等信息。

从上述数据库中提取数据,根据《中华人民共和国药典》2015年版对药物的描述,对药物进行筛选,去除其中非降血脂药记录,得到579条降血脂药相关不良反应记录。对579条不良反应记录中年龄、药物名称、给药途径等特征进行规范化处理。年龄采用向上取整的方法,如5个月为1岁,缺失值保持缺失状态;药物名称采取“药物名+剂型”方式进行规范,如“注射用藻酸双酯钠”规范为“藻酸双酯钠注射液”。

3.2 药物不良反应规范化描述

不良反应名称的规范采用机器和人工相结合的方法。从该数据集中不良反应描述“ADR_SIGN”中提取不良反应信息。首先参照世界卫生组织创建的药品不良反应术语集1.0版本(WHO Adverse Reaction Terminology,WHO-ART)[15],采用完全匹配方法进行机器提取,初步得到不良反应规范词。鉴于机器提取的局限性(如出现“无呕吐症状描述”,而机器匹配为WHO-ART中的“呕吐”),对不良反应 “ADR_SIGN”进行人工标注。根据数据集中“ADR_SIGN”的描述和WHO-ART建立不良反应匹配词典(见表1)。该词典可作为训练数据,为自动抽取不良反应的监督式机器学习提供语料[16]。

此外,参照《药品不良反应报告和监测管理办法》和现有文献报道中的分级标准[17],本文设计了新的不良反应严重程度分级标准(见表2),并根据该标准对每条记录进行人工标注,为后续的数据挖掘分析提供素材。

表1 不良反应匹配词典(部分)

表2 不良反应严重程度分级标准

3.3 研究方法

为了探索该数据集中降血脂药不良反应的发生情况及发生规律,首先对患者的性别、年龄、给药途径、ADR累及器官系统分布情况进行回顾性统计分析。同时,选取循环系统用药类药物ADR记录,筛去含有异常值和缺失值的记录,对剩余349条记录进行单因素分析和多因素非条件Logistic回归分析,找到不良反应严重程度可能的影响因素,纳入信息包括性别、年龄、给药途径、药物类型。多因素分析中,P<0.05的因素具有统计学意义,赋值方法见表3。

表3 循环系统用药不良反应严重程度及其影响因素赋值

4 结果及分析

4.1 患者及药物使用情况

579条记录中男性患者301例,占51.9%;女性患者278例,占48.1%。患者最小年龄为1岁,最大年龄为89岁,具体分布见图1。

给药途径包括静脉滴注、肌肉注射、口服、皮下注射和未知。其中以静脉滴注为主,共436例(占75.4%);其次是口服,共128例(占22.1%)。给药途径分布情况见表4。

图1 降血脂药不良反应的性别和年龄分布

表4 发生不良反应患者的给药途径分布

4.2 药物及其不良反应

该数据集共包含101种降血脂药,其中中药45种(占44.6%),化学药品48种(占47.5%),生物制品8种(占7.9%)。我们根据这101种药物的药理作用进行分类,共得到9类降血脂药,见表5。

从表5可以看出,其中循环系统用药为70种(占69.3%),涉及降血脂药不良反应记录353条(占61%),该类药物的主要不良反应为胸闷、瘙痒、呼吸困难;其次为血液及造血系统用药15种(占14.9%),涉及降血脂药不良反应记录的有85条(占14.7%),该类药物的主要不良反应为呼吸困难、胸闷、心悸。

表5 降血脂药的药理作用分类及其主要不良反应

4.3 药物不良反应累及器官、系统及临床表现

该数据比较集中,降血脂药的不良反应主要表现为全身性损害,共涉及354例次(占22.9%)。其主要临床表现为发热、不适、厌食、无力,主要涉及药品包括阿托伐他汀钙片、阿魏酸钠注射液等。其次累及皮肤及其附件,涉及176例次(占11.4%)。其主要临床表现为斑疹、瘙痒、红色丘疹,主要涉及药品包括阿托伐他汀钙片、阿魏酸钠注射液等。ADR及药品的具体情况(按例次数排列前十)详见表6。

表6 不良反应累及器官或系统及其主要临床表现和涉及药品

4.4 药物不良反应影响因素

为了进一步识别降血脂药不良反应严重程度的影响因素,本文对349条循环系统用药不良反应记录进行单因素分析,对其中不良反应严重程度可能的影响因素:性别、年龄、给药途径、药物类型进行挖掘。后选取渐进法P<0.4的影响因素,对其进行多因素非条件Logistic回归分析与单因素分析得到的结论进行对比分析。

单因素分析结果表明给药途径因素具有统计学意义(表7),多因素非条件Logistic回归分析结果同样显示给药途径因素具有统计学意义(表8),表明给药途径可能是不良反应严重程度的影响因素。以往的其他研究也有提示,给药途径对药物不良反应的严重程度具有一定影响[18,19]。

表7 降血脂药不良反应严重程度影响因素的单因素分析

表8 降血脂药不良反应严重程度影响因素的多因素logistic回归分析

5 讨论

目前常用的不良反应开放数据资源已初具规模,来源渠道呈多样性。其中包括国家数据库,如美国食品药品监督管理局药品不良事件报告系统(FDA Adverse Event Reporting System,FAERS)和综合了多个国家数据的药品安全数据,如欧洲药品管理局(European Medicines Agency,EMA)维护的EudraVigilance数据库。本文利用国家人口与健康科学数据共享平台的开放获取数据,对降血脂药ADR相关数据进行提取、清洗、统计、挖掘的结果显示,579条不良反应记录中男性患者301例(51.9%),提示男性在应用降血脂药后发生不良反应的可能性较大;436例患者(75.4%)给药途径为静脉滴注,提示在静脉滴注降血脂药时,需要密切关注患者的情况;循环系统用药涉及ADR记录353条(占61%),主要表现为胸闷、瘙痒、呼吸困难,这可能与该类降血脂药使用频率高、量大有直接关系。不良反应涉及人体多个器官系统,其中“全身性损害”构成比较多,主要临床表现是发热、不适、厌食、无力。单因素分析和logistic回归分析显示,给药途径对于不良反应严重程度的影响具有统计学意义。结合回顾性分析的结论,分析可能是由于给药途径中的静脉滴注是药物直接进入血液,避免了肝脏首关效应[20],作用迅速而强烈,可能引起较为严重的不良反应,提示在静脉滴注给药时,应密切监测患者的反应及各个指标变化,必要时及时调整治疗方案,防止严重不良反应的发生。

本文的局限性体现在该数据集约30%的降血脂类药物是与其他药物联合使用,约1/3的不良反应是由药物相互作用引起的[21 ,22],而本文在分析时未排除合并用药的情况。同时,原始数据集中也存在许多数据缺失、记录不规范甚至记录错误的情况,对于模型的建立及研究结果也会产生一些影响。降血脂药中循环系统用药人群多,导致该类药不良反应次数出现多的可能性大,一定程度上提示在应用此类药物时,需要加强监控。另一方面需要积极利用其他数据挖掘方法来确定该类药相对于其他类型的药物用药安全性高低,进而对药物实施更有效的监管。

不良反应开放数据资源中包含了大量患者用药及不良反应信息,具有十分强大的潜在利用空间。数据挖掘技术与统计学方法配合,可以深入分析药品不良反应的特点,探索其发生规律,从而为临床合理用药和药物安全监测提供参考和支持。

猜你喜欢
降血脂药品途径
是不是只有假冒伪劣药品才会有不良反应?
降血脂乳粉的生产工艺研究
构造等腰三角形的途径
(2E,4E)-N-(2-氨基乙基-5-(苯并[d][1,3][二氧杂环戊烯]-5基)戊-2,4-二烯酰胺的合成及其降血脂作用
多种途径理解集合语言
减少运算量的途径
药品采购 在探索中前行
药品集中带量采购:谁赢谁输?
药品集中采购将走向宽松
高含量DHA/EPA甘油三酯的降血脂和保肝作用的研究