冯 硕,刘文佳,胡 晶,张会娜,李 博*
(1 首都医科大学附属北京中医医院,北京 100010;2 北京市中医研究所,北京 100010;3 山东中医药大学附属医院,济南 255014)
药品安全性评价可追溯至1961年欧洲的反应停事件,这一药品在缺乏安全性评价的情况下流通6年,从而导致了成千上万的海豹肢畸形。人们由此认识到了药品不良反应监测和报告的重要性,推动了这一领域研究方法的形成和发展。
药品安全性评价的重点在于,利用收集的不良事件和不良反应相关信息判断药品与可疑不良反应之间的因果关系。这一过程涉及诸多研究类型、信息收集方法和评价技术。
通常情况下,药品在上市前已开展有效性和安全性评价的临床试验。然而临床试验仅针对可能出现的用药风险谱有一定的验证作用[1]。尽管随机对照试验位于证据等级金字塔的顶端,被视为疗效评价的金标准,但在安全性评价方面,由于其实施难度和潜在的伦理学影响,又因其样本代表性受限的特点[2],所以无法反映药品真实的不良反应发生率和归因危险。
从群体事件的角度,临床试验在统计分析时多使用差异性检验和点估计,即有差异的概率与P=0.05这一数值相比较。然而,在事件本身发生率特别低的情况下,有限的样本量很难得出有统计学差异的检验结果,从而容易得出假阴性结果。对受试者个体而言,临床试验收集到的用药背景信息和不良事件发生相关的信息不容易完整,评价不良反应的发生和药品之间的因果关系有一定的困难。
因此,药品安全性评价更多依赖真实世界的信息收集和上市后的临床安全性评价。实际操作中,判断某个药品与特定不良反应的发生是否构成因果关系主要涉及可疑不良反应信息的收集和药品不良反应因果关系的判断。此外,一些数据挖掘算法可以对药品不良反应起到提示作用。
英国于1964年“反应停”事件后率先实行自发呈报制度[3],以黄卡形式上报。然而黄卡的上报率仅为5%,大量的数据缺失限制了药品安全性评价的实施[4]。英国政府于2014 年又发起了“不良事件报告倡议计划”,倡导患者主动配合上报[5]。美国于1993年制定了Med Watch制度,其结合了互联网的优势,也使报告制度的教育得到普及[6]。目前全球覆盖面最广的自发呈报系统是WHO于1978年成立的全球药物警戒监测中心(Uppsala Monitoring Centre,UMC),总部位于瑞典乌普萨拉,迄今已有150余个成员国加入,拥有全球最庞大的化学药物不良反应数据库[7-8]。
我国从1998年起成为了WHO药物监测体系的成员国,国家药品监督管理局下设的药品不良反应监测中心建立了不良反应监测系统,负责收集相关的信息,成员国可以邮件、传真等形式定期向UMC报告本国不良反应数据。近年来,开发的移动客户端APP也可协助上报信息[9]。然而,自发呈报系统有赖于药品上市许可的持有人主动上报,对此并未施行强制要求,因此常存在漏报现象[10-11]。此外,由于繁忙的临床工作和填报信息复杂或意识缺乏,医生和药师的主动上报率较低[12-13]。仅仅依靠自发呈报系统并不能满足药品安全性评价的需求。
医院集中监测法始于1969年,当时Hurwitz和Wade在BMJ杂志发表了一项关于1268例精神病患者的药物不良反应监测研究[14]。医院集中监测要求在一定时间和范围内对某一家医院或某一地区(可以是多家医院和地区)使用某种药物的用药信息和不良事件进行详细记录,在此基础上判定不良反应,探讨药品不良反应的发生规律。
与自发呈报相比,医院集中监测以监测人群作为观察队列,因此有分母,能够计算事件发生率。通过在大样本人群中对某个产品进行监测,对产品的安全性有较为全面的认识,所得到的数据能反映不良反应发生率。该方法尤其针对上市后的药品,有利于发现未知的或非预期的不良反应,可弥补上市前研究的局限性。我国在2009年由原国家食品药品监督管理总局发布了“关于开展中药注射剂安全性再评价工作的通知”,中成药及注射剂的上市后集中监测已成为趋势[15]。目前可以检索到我国已开展的包含上万例用药者的真实世界中的不良反应监测研究[16-17]。
然而医院集中监测法需经过严格的设计,实际操作中工作内容较多。为使样本具有足够的代表性,可能需要多家医院的多个科室共同完成;同时需要有便捷的数据管理系统来承载相应的信息收集,如EDC系统;也需要专门的研究人员负责跟踪和记录,药品使用情况和患者信息均需要详细登记;对于慢性不良反应和罕见事件的发生,可能需要较长的观察周期。尽管此种方法全面而规范,但需要耗费一定的人力财力和物力。
个体水平的不良反应评价主要针对特定不良事件,即可疑不良反应和药品之间的因果关系判断。群体水平主要涉及不良反应的信号挖掘。
因果关系判断方法多针对单个病例,主要评价药品导致该不良反应的可能性。在评价时一般需要逐个案例进行分析。其大致可以归纳为全面内省法和计分推算法。
全面内省法主要依靠专家的个人知识和经验进行。专家需要综合考虑各种相关因素,然后做出药物与可疑不良反应之间的因果关系判断,此过程类似于根据患者症状和体征做出的临床诊断[18-20]。全面内省法并非一类标准化和定量化的方法,受主观因素的影响,不同专家的意见可能存在较大的差距,而且可重复性差,限制了其内部一致性和外部一致性,因此不利于推广使用。
相较于全面内省法,计分推算法是一种可重复性较强的方法。目前已有不少于20种的计分推算法[21],其中最为常用的包括Naranjo APS评分法及乌普萨拉评分法等,后者是世界卫生组织全球药物警戒监测中心所倡议的评分方法[22]。计分推算法主要对药物和事件之间的关联性强度给出评分,在应用时,对可疑的不良反应根据表格中不同条目的分值计算总分,以评定不良反应与药物间的因果关系强度。然而各类计分推算法的判断结果也存在一定差异[23-24],并且针对不同条目之间的权重也存有争议[25]。
基于大数据和数理统计的信号挖掘算法是一种有效的、新颖的和逐渐被接受的不良反应监测方法,能发现隐藏在数据中的不良反应发生规律。信号挖掘算法的应用环境可以是自发呈报系统的数据库。随着数据挖掘技术的发展和电子化病历管理系统的应用,信号挖掘算法逐渐普及到一些电子医疗数据库[26]。信号挖掘算法是利用一些数学模型,从数据库中对现有的报告病例进行挖掘,作为信号提示,以便进一步分析不良反应与其他因素之间的关系。
传统信号挖掘算法包括频数法、回归法等。其中频数法计算简单,但假阳性率较高,容易受到噪音干扰[27-29]。在此基础上结合贝叶斯理论派生出了一些新的算法。传统的信号挖掘算法主要以概率论为基础,而贝叶斯逻辑学可用来解释因果关系判定中的不确定性问题,根据背景统计信息计算出药品与不良反应因果关系成立的可能性[30],具体包括贝叶斯可信递进神经网络法、伽马-泊松缩量估计法、欧米伽收缩测量法、机器学习法等[29,31],其中贝叶斯可信递进神经网络法能计算出药品引发不良反应的信息成分[32],被乌普萨拉药物警戒中心所采用。
近年来针对大型电子医疗数据库,又衍生出一些新的信号挖掘方法。一般多用于上市后药品的具体评价。在应用各种方法时需要考虑方法的可行性和数据资料的可利用性。处方序列对称分析(prescription sequence symmetry analysis)多针对有详细用药记录的医疗信息管理系统的数据,通过评价用药前和用药后事件(通常为不良事件或标签药物)分布的对称性,来评价药物与不良事件是否存在关联[33]。倾向评分匹配树状扫描统计量 (propensity score matched tree-based scan statistic)方法多针对纵向数据,可以将不良事件按类别和发展程度进行等级划分,在经过倾向评分匹配调整混杂因素后,估算可疑不良反应的发生率[34],从而形成多层级不良反应分类树形图。时间关联规则(temporal association rules)主要用于对一些无法提前预期的可疑不良反应进行预警,该分析方法主要根据因果关系的时序性进行信号挖掘,并用统计分析方法过滤掉一部分假阳性信号,对在医疗管理数据库中发现新的不良反应有一定的潜力[35]。
我国在中药安全性评价方面尚处于起步阶段。截至目前,在中国知网中,以“中医”和“中药”为主题词,同时以“不良反应”为支持基金检索词进行检索,可以检索到14篇文献;同时检索“不良反应”和“安全性”共可以检索到28篇文献。其中包括部分中成药品种尤其是注射剂的上市后安全性医院集中监测研究,以及部分来自自发呈报系统的信号监测。中成药的不良反应报告和监测大致可以按照化学药物的研究方法进行,但针对复方,尤其是诸多饮片构成的中医处方的安全性评价仍然面临方法上的挑战。
由于中药多为复方制剂,一次用药多包含数十种药材及众多的化合物成分,而药物警戒系统中一般的数据挖掘方法则针对的是单一药物。复方中可能存在配伍减毒、炮制减毒等影响因素;复方的不良反应监测方法的稳定性受疾病特征、性别、年龄、耐药性等因素的影响[36-37]。鉴于以上影响因素众多,传统方法很难计算处方中某一味药材与不良反应的因果关系程度。在这一领域,未来有待开发高维的统计分析模型来解决这些障碍,进行方法学的探索。
在美国,正是由于不良反应受害者的强烈呼吁和要求,促成了厂家对安全性问题的重视[38]。美国从2007年起立法要求药品的上市后安全性再评价工作。而我国的不良反应监测制度还应进一步完善,尤其在主动监测和中药不良反应评价方法上与美国相比还有一定的差距。在政府加强监管力度的情况下,还有待于从法律和法规层面促使企业加大对药品上市后安全性再评价工作的投入[39-40],建立适合我国国情的用药安全性保障体系。