代 菲,舒丽芯,储 藏,陈盛新,储文功(第二军医大学药事管理教研室,上海200433)
目前,我国药物不良反应报告数据的提取主要从医院信息系统(hospital information systems,HIS)和国家药物不良反应监测中心提取,而国外药物不良事件报告多来自自发呈报系统,随着近年我国医院信息系统的完善和药物不良反应信息知识的宣传,我国ADR自发呈报数据数量迅速增加,如何从中提取药物的不良信号,为临床合理用药提供参考,成为大家关注的问题。经相关文献研究,总结了目前国内和国外应对药物不良信号监测的几种常见用法。而这些常用方法都是基于比例失衡报告信号基础上发现的,因此首先我们应该了解什么是比例失衡。
比例失衡是指将药物不良反应(adverse drug reaction,ADR)数据库中所有药物不良事件报告作为一个整体和背景,如果某特定药物-药物不良反应(Drug-ADR)组合报告比例在此背景下表现失衡即称为比例失衡[1]。一些方法就是通过药物不良反应比例失衡报告来发现ADR信号。对自动上报系统(spontaneous reporting system,SRS)的数据执行比例失衡分析所使用的不同数据挖掘算法,很大程度上促进了药物安全监测的发展,然而有些比例失衡报告信号只是与药物作用于人体的某项指征有关,而不是一个不良事件或不良反应。
目前美国、欧洲和日本等对于数据挖掘算法应用相对比较成熟,经国内外的文献研究,除了传统的方法提取不良反应信号外,还总结了目前国内外使用的所有药物不良反应信号挖掘方法如下:壶模型(urn-model)、报告比数比法(reporting odds ratio ROR)、比例报告比值法(proportional reporting ratio PRR)、综合标准法(MHRA或MCA)、伽玛泊松分布缩减法(gamma Poisson Shrinker GPS)、经验贝叶斯监测(EBS)、多项伽马-泊松缩量估计法(multi-item gamma passion shrinker,MGPS)和贝叶斯可信传播神经网络法(Bayesian confidence propagation neural network,BCPNN)、最终实验室检查结果比较法(comparison on extreme laboratory test results,CERT)。上市后药物ADR信号监测方法主要用于监测和分析自主呈报系统的ADR报告的数据。拓展临床评价更大组别的分析能力。
2.1 壶模型(urn-model) 壶模型是由Hochberg等人描述的,壶模型原来是判断摸到壶里各种颜色球的概率,后来扩展应用到数据库分布相关的某一行为表现[2]。病例报告和证据水平的分类是按纳兰霍(Naranjo)标准执行,对一些问题进行打分即Yes、No和 Black三种打分法。壶模型报告比值(RR)>1.0,事件计数>2,统计上不会发生预想结果的值>N/0.05,N表示所有不良事件的总的数量,同时满足这些条件,表示产生药物不良反应信号。被应用于美国FDA不良事件报告系统数据库,产生1 562个不相称报告信号。
2.2 报告比数比法(ROR) 报告比数比法(ROR)代表比例失衡的一种测量方法,频繁被用于自发报告的分析,用于鉴别报告药物与不良事件之间的潜在的联系,ROR比较了每种药物相对于所有其他药物相应的比值。在整个观察的数据中目标不良事件与非目标不良事件的比值,体现一个显著有意义的比例失衡就是95%的可信区间的下限>1,说明该药物所导致的药物不良反应是值得注意的ADR信号。应用ROR方法,在验证抗菌药与扭转性室速是否存在联系时,除了发现药品说明书上会出现的药物不良反应,还发现了5个新的信号[3]。
2.3 比例报告比值 比例报告比值(PRR)是由Evans等描述的,PRR算法须满足PRR>2.0,事件计数大于2,关联的卡方值χ2>4.0。PRR和ROR的计算是基于一个四联表,体现了药物-事件的组合,它包括了目标药物和目标事件的数目、目标药物以外的其他药物及目标事件以外的其他事件的数目,从而计算PRR值。计算PRR的95%的可信区间(CI),如果95%CI下限>1,则表示生成一个信号。PRR算法很少用于处理分层问题,文献研究发现Woo[4]等基于PRR算法首次使用分层分析,但是分层的效果发现比例失衡报告信号的数量是适度的,敏感性和特异性却很低。
2.4 综合标准法 综合标准法(MHRA或MCA)是含有多个指标的综合标准法,同时也是基于四联表的数据进行计算,判别信号的标准是:a≥3,PRR≥-2,χ2≥4,3个条件同时具备,才提示生成一个信号[5]。
2.5 伽玛泊松分布缩减法(Gamma Poisson Shrinker,GPS)和多项伽马-泊松缩量估计法(multi-item gamma passion shrinker,MGPS)GPS算法是由Du-Mouchel描述的,用SAS/IML程序可执行,通过限制编码经验贝叶斯几何平均数(EBGM)95%的可信区间下限,一般用EB05计算信息分数。GPS算法需要药物的一个输入矩阵以及所有药物个数和所有事件术语即至少100个案例(N代表药物不良反应数目,i代表行变量,j代表列变量 Nj>100,Ni>100),可在年龄、性别和报告资源的年份上进行分层。GPS算法一般用 EB05的分数 >2.0,N>0,EB05的值低于经验贝叶斯几何平均数(EBGM)的95%可信区间,满足这个条件,可生成一个比例失衡报告信号。MGPS是 GPS的扩展,是由美国的Waltham提出的,用于探索用药人群特征是否与不良事件之间存在关联及变量的交互作用等[6]。MGPS可用EBGM>2或者EB05≥2发现信号。
2.6 贝叶斯可信传播神经网络法(Bayesian confidence propagation neural network,BCPNN) 贝叶斯可信传播神经网络法反映一种关联程度,通过药物发生的先验概率和后验概率的比值的对数值来表示,即 IC(information component),IC >0,IC 95%可信区间的下限>0,说明可疑药物与可疑不良反应发生之间存在某种联系,提示生成一个信号,当药物-事件的组合尽最大可能多报告时,IC接近于0[7]。乌普萨拉监测中心(Uppsala Monitoring System,SRS)是由47个国家组成的世界卫生组织(WHO)合作中心用于世界范围的药物信号监测,率先使用BCPNN方法监测36 000例报告,监测IC的信号由阴性值变为阳性值[8]。
2.7 最终实验室检查结果比较法(Comparison on extreme laboratory test results,CERT)和卡方 CERT方法[9]是由Man Young Park描述的,将药物与实验室检查结果进行配对,用配对t检验的概率P值或McNemar's检验值与0.05进行比较,当P<0.05时,即生成一个信号。2011年韩国亚洲大学医学院首次使用10年的医院电子病历的数据,总共523 829例病人,包含32 033 710张处方115 241 147项实验室检查,用某种具有代表性的实验室检查来观测药物不良反应的发生,随机选择10类药物进行分析与51项实验室的值进行配对,得到结果:每种药物实验室检查异常信号的平均值为27±7.5,敏感性、特异性、阳性预测值、阴性预测值分别为64% ~100%,22% ~76%,22% ~75%,54% ~100%。
卡方计算信号生成方法,即当χ2>3.84时,且n>1时[10],生成一个药物不良反应信号,被用于中枢性神经药物哌甲酯的信号监测。
由于不良反应数据的不完整性,各种算法生成信号限制的条件和原理也有一定程度的不同,所以信号产生的数量也不同以及假阳性和假阴性的结果也有差异。为了减少遗漏的信号,药物-不良事件常采用多种方法联用,以减少偏倚和降低假阳性和假阴性信号的数量。
3.1 壶模型、GPS和PRR方法联用 美国FDA使用自动呈报系统数据库中2002~2005年的报告数据,采用壶模型产生1562个比例失衡报告信号(SDRS),用伽玛泊松分布缩减法(GPS)获得比列失衡报告信号的最低总产量(763),在匹配相关事件数据库方面获得最高数量(89 SDRS,比例失衡报告信号11.7%),壶模型产生相对多的比例失衡报告信号SDRS(1 562),获得相对低的匹配(175 SDRS,11.2%)。PRR监测了更多的SDRS(3 616),但是却获得更低的配对(296 SDRS,8.2%),在这些算法中,在比例失衡报告信息的重叠性方面,PRR独一无二的监测了最高数量的SDRS(2231,144,或者6.5%,匹配)。接着是壶模型(212,26,或者12.3%,匹配),然后是GPS 监测到0 个SDRS[11]。3种方法中GPS的敏感性和特异性最好,PRR敏感性和特异性非常的低,壶模型居中。
3.2 PRR和MGPS联用 34个相关的新奇的反应包括29种药物,17种不同的药品分类,用PRR算法12个药物-事件联合在MEDLINE里出现过,4个是同时发生的,11个是之后才有的,用MGPS的EBGM分析,12个信号以前监测到,3个同时发生的,第一次文献引文出版后有11个。EB05分析6个信号以前检测到,2个新产生的,4个在MDELINE引文后才有的[12]。相比MGPS法用PRR法发现了最多的信号,具有高度的敏感性,EBGM分析比EB05监测到了更多的信号。
3.3 GPS、BCPNN、MCA 、PRR 和ROR联用 Kubota K等提取日本自动报告系统1998年~2000年数据,使用5种方法,总共有38 731个药物-事件的组合,发现PRR 95%CI和ROR 95%CI的kappa值>0.9,MCA 和 BCPNN的 kappa值 >0.9,GPS和MCA的kappa值大约是0.6左右,GPS和BCPNN的kappa值大约也在 0.6,其它对比都小于 0.2[13]。ROR和PRR之间,MCA和BCPNN之间具有最好的一致性;GPS和MCA之间,GPS和BCPPN之间也具有良好的一致性。
除最终实验室检查结果比较法(CERT)以外,其余几种方法主要基于一个四联表来计算。见表1和表2。
表1 药物与药物不良反应四格表
表2 几种信号挖掘算法的计算公式
5.1 江苏省药物不良反应监测中心数据库 2006年复旦大学首次在国内尝试使用报告比(proportional reporting ratios PRRs)方法对江苏省药物不良反应监测中心数据库2004~2005年所有不良反应报告的信号筛选与检测,筛选结果与同期的产品说明书进行比较。共对数据库进行了三次信号检测,第一次信号检测对象为该中心数据库中2004年所有病例报告,获得115个符合最低检测标准且没有在说明书上标明的阳性结果。同时,在2005年新增报告的基础上进行第二次、第三次的信号检测,检测周期为半年。分别获得133个和268个符合条件的结果。
5.2 上海市药品不良反应监测中心数据库 2008年第二军医大学统计学教研室总共收集上海市药品不良反应监测中心2003年12月~2007年4月间上报的不良反应报告31 930份,其中涉及药物2 147种,不良反应621种,药物-不良反应组合共计61 444个。通过贝叶斯神经网络可信区间递推法(BCPNN)筛选得到可疑信号1 340个,并对该1 340个信号进行了敏感度与特异度的分析,得到结果:灵敏度0.29(去除小于3例的报告后可达到0.62),特异度0.92,假阴性率0.71,假阳性率0.08,约登指数0.21,ROC曲线下面积0.657(P<0.001)。2009年第二军大学统计学教研室利用上海市药物不良反应监测中心2003年12月~2007年4月的数据库32 746份原始不良反应报告运用ROR、POR、BCPNN、MHRA分别监测到1 430、1 419、868、997个可能的药物-事件组合的信号。
5.3 广东省药物不良反应监测中心的数据库2009年广东工业大学和第四军医大学合作利用广东省药物不良反应监测中心的数据库采用BCPNN方法对2006第4季度~2007第4季度的甲硝唑和恶心反应信号监测,结果显示这4个季度的IC均>1.5,从而进行自动预警。
上述所介绍的方法均是用来监测药物不良反应的信号,信号监测方法为药物和药物导致的ADR提供了额外的附加信息,且这些信息可以周期性的产生。此外定量的信号挖掘算法还可以被用于研究复杂的联系,比如药物和药物之间相互作用与相应的症状之间的关系,信号挖掘算法则是对传统方法分析的额外补充。文献研究显示,国际上使用的数据挖掘算法并没有一种统一的标准,每种方法都有其优点和局限性,目前国内仅有广东、上海、江苏3个地区药品不良反应监测中心借鉴国外的一些算法简单的对数据来发现不良信号。由于我国自动呈报系统数据的质量与国外存在差别,几种监测方法联合使用可同时监测到不同信号,因此根据研究的需要找出适合的药物不良反应的信号监测算法是十分必要的。由于我国患病人口基数大,使用这些方法在一定程度上不仅可以初步检验药品说明书上的不良反应书写的完整性,同时对于药品的安全用药也起到预防作用,增强药物使用的安全警戒,从而提高人类的生命质量。
[1]Moore N,Thiessard F,Begaud B.The history of disproportionality measures(reporting odds ratio,proportional reporting rates)in spontaneous reporting of adverse drug reactions[J].Pharmacoepidemiol Drug Saf,2005,14(4):285.
[2]Rahul S,Amitava M.An urn model with applications to database performance evaluation[J].Computers &Operations Research,1997,24(4):289.
[3]Poluzzi E,Raschi E,Motola D,et al.De Ponti F.Antimicrobials and the risk of torsades de pointes:the contribution from data mining of the US FDA Adverse Event Reporting System[J].Drug Saf,2010,33(4):303.
[4]Woo EJ,Ball R,Burwen DR,et al.Effects of stratification on data mining in the us vaccine adverse event reporting system[J].DrugSaf,2008,31(8):667.
[5]陈炯华,魏永越,谢雁鸣.基于SRS的中药上市后安全性信号监测方法介绍[J].中成药,2010,(06):1036.
[6]叶小飞,王海南,陈 文,等.数据挖掘在药物警戒中的应用[J].中国药物警戒,2008,(01):36.
[7]Manfred Hauben,Sebastian Horn ,Lester Reich Potential.Use of Data-Mining Algorithms for the Detection of surprise Adverse Drug Reactions[J].Drug Saf,2007,30(2):143.
[8]Bate A,Lindquist M,Edwards IR,et al.A Bayesian neural network method for adverse drug reaction singal generation[J].Eur J Clin Pharmacol,1998,54(4):315.
[9]Man YP,Dukyong Y.A novel algorithm for detection of adverse drug reaction signals using a hospital electronic medical record database[J].Pharmacoepidemiol Drug Saf,2011,20(6):598.
[10]Kim J,Kim M,Ha JH,et al.Signal detection of methylphenidate by comparing a spontaneous reportingdatabase with a claims database[J].Regul Toxicol Pharmacol,2011,61(2):154.
[11]Hochberg AM,Hauben M,Pearson RK,et al.An evaluation of three signal-detection algorithms using a highly inclusive reference event database[J].Drug Saf,2009,32(6):509.
[12]Bate A.Bayesian confidence propagation neural network[J].Drug Saf,2007,30(7):623.
[13]Kubota K,Koide D,Hirai T.Comparison of data mining methodologies using Japanese spontaneous reports[J].Pharmacoepidemiol Drug Saf,2004,13(6):387.