翟静波 郑文科 雷 翔 曹红波 王 辉 商洪才
零膨胀模型在药品安全性计数资料分析中的应用※
翟静波 郑文科 雷 翔 曹红波 王 辉 商洪才*
(天津中医药大学,天津300193)
零膨胀模型是一类用于处理存在零膨胀现象计数资料的统计模型,广泛应用于保险费率厘定、车祸发生频次等研究。药品安全性分析中的计数资料可能存在零膨胀现象。poisson回归模型或负二项回归模型用于拟合存在零膨胀现象的计数数据可能存在拟合不良的问题。零膨胀模型可能是一类更优的替代模型,且已有相关实例研究报道。将零膨胀模型用于不良事件/反应发生频次的影响因素分析,可以有效处理数据中可能存在的零膨胀现象,对于提高参数估计精度、探索药品(特别是中药注射剂)安全性事件的发生规律、识别重要危险因素以及预测等均具有重要意义。
零膨胀模型;药品安全性;计数资料
自从Singh S在1963年首次提出零膨胀模型以来,零膨胀模型得到不断的改进和完善,同时在保险理赔、林火预测、交通安全预测等多个领域都得到广泛应用,但是在药品安全性评价领域的应用较少。本文将通过介绍零膨胀模型和药品安全性计数数据的特点,探讨零膨胀模型用于药品安全性计数资料分析的可行性。
在科学研究的计数数据中常存在大量个体取值为零的现象,相同零值可能表示不同的含义,零值的比例超出了poisson回归或负二项回归等模型的拟合能力,称为零膨胀现象[1]。零膨胀现象在公共健康领域较为常见[2]。
为了解决计数数据中零膨胀现象导致的模型拟合问题,Lambert(1992)[3]详细论述了零膨胀模型。该模型的基本原理是将数据分解为全部由数字零构成的数据集和服从poisson分布或负二项分布数据集[4]。该模型将事件的发生看成两种可能的情况:第一种是假定事件发生取值只能为0;第二种是假定对应事件发生数取值为0或正的事件数,且服从poisson或负二项分布[3-4]。研究者通过一些特征变量识别和排除全零数据集,然后对服从poisson分布或负二项分布的数据集进行建模分析[5]。若数据的均值与方差基本相等,认为属于等离散,近似服从poisson分布,可以拟合零膨胀泊松回归模型(zeroinflated poisson regression models,ZIP);若数据的方差明显大于均值,认为属于过离散,近似服从负二项分布,可以拟合零膨胀负二项回归模型(zero-inflated negative binomial models,ZINB)[5]。
零膨胀模型是对poisson回归或负二项回归模型的改进,包括一系列模型,在处理存在零膨胀、个体聚集性等现象的大样本、低发生率数据方面优于poisson回归或负二项回归模型。
零膨胀模型广泛应用于小概率事件发生频次影响因素或预测研究,例如:Jiang X等[6]采用零膨胀模型评估车祸碰撞伤害的危险因素;Kilic D等[7]将零膨胀负二项回归模型用于烟草消耗与性别之间的关系研究;项氏[2]用零膨胀poisson回归模型拟合汽车保险索赔频率数据并对变量选择和参数估计进行比较;王氏[8]使用零膨胀模型进行避孕知情选择对中国人工流产的影响研究,结果表明零膨胀模型的拟合曲线比poisson回归和负二项回归模型更逼近真实观测值的分布。
研究者还将零膨胀模型用于疗效评价,例如:Lu CY等[9]采用零膨胀模型评估治疗时期对疗效的影响;Haroon N等[10]使用零膨胀负二项回归模型评价肿瘤坏死因子抑制剂对强直性脊柱炎患者进展性脊柱损害的疗效;Ritter AV等[11]将零膨胀负二项回归模型用于木糖醇防治龋齿的疗效评价。
药品临床安全性评价中的计数资料主要指不良事件或不良反应的计数资料。分析内容常包括发生率、发生频次、影响因素分析等。其中,不良事件或不良反应的发生频次数据分析非常重要。有研究表明,在公共卫生规划和质量管理规划评估领域中,不良反应发生频次研究更为重要[12]。
当临床研究进入Ⅲ、Ⅳ期之后,不良事件或不良反应发生频次数据具有样本量大、发生率低、多次重复发生且相互独立、多种混杂因素干扰等特点。同时,不良事件或不良反应计数数据属于公共健康领域的计数资料,该类计数资料的特点决定其可能存在零膨胀现象。
目前,研究者常假设不良事件或不良反应发生频次数据服从poisson分布或负二项分布,通过拟合poisson回归或负二项回归模型进行影响因素分析。但是,许多研究表明,poisson回归或负二项回归模型并非不良事件或不良反应发生频次影响因素分析的最优模型。李婵娟等[13]研究表明,poisson回归模型过低估计不良事件频次为“零”的发生,过高估计不良事件频次为“1”、“2”的发生。在处理个体聚集性现象时,负二项回归模型优于泊松回归模型,但是也存在事件分布偏离负二项分布的现象。Khokan C Sikdar等[14]研究表明,老年住院患者不良反应发生频次影响因素的建模中,ZIP和ZINP模型的拟合效果要优于poisson和负二项模型。
模型应用条件与数据特点的不匹配是模型拟合不良的一个重要原因。Poisson回归模型和负二项回归模型在拟合过程中未考虑数据中可能存在的零膨胀现象,可能是药品不良事件或不良反应发生频次影响因素的poisson回归和负二项回归模型拟合不良的重要原因。识别和控制不良事件或不良反应发生频次数据中可能存在的零膨胀现象对于改善模型拟合效果具有重要意义。零膨胀模型可能是更优的一类替代模型。
零膨胀模型的特点决定了其非常适合用于不良事件或不良反应发生频次数据的分析。为了解零膨胀模型在药品安全性评价领域中的应用现状,本文以CNKI、CBM、Pubmed、SCI Expanded数据库为检索库,adverse event(s)、adverse drug reaction(s)、zero-inflated为主题词,时间设定为截止到2013年10月15日,经计算机检索和人工核查,共检索到3篇相关文献[14-16],均被SCI收录。最早1篇由C.E.Rose等[15]发表于2006年,内容为零膨胀模型和Hurdle模型用于疫苗不良事件计数资料建模的研究。SCI Expanded数据库检索结果表明,截止到2013年10月15日,该文已被引用44次。A.L.Baughman等[16]于2007年发表了1篇文章,对Rose在2006年发表的这篇文章进行了更深入的研究。Khokan C Sikdar等[14]在2012年发表的老年住院患者不良反应发生频次影响因素研究采用了零膨胀模型。
尽管目前相关文献数量有限,但是这些研究表明,零膨胀模型用于药品不良事件或不良反应发生频次影响因素分析具有一定的可行性且优于poisson回归模型和负二项回归模型。
综上所述,将零膨胀模型用于不良事件或不良反应发生频次的影响因素建模,是处理数据中可能存在的零膨胀现象、个体聚集性等问题的重要统计分析方法,对于提高参数估计精度、探索药品不良事件、不良反应及其他安全性事件的发生规律、识别重要危险因素以及预测等均具有重要意义。
中药(特别是中药注射剂)的临床安全性是社会关注焦点。2012年5月,国家食品药品监督管理局(SFDA)发布的2011年国家药品不良反应监测年度报告[17]中指出,中药注射剂依然是中药制剂的主要风险。中药上市后临床安全性急需大样本、多中心、高质量的临床安全性再评价研究进行论证。考虑到poisson回归模型和负二项回归模型处理存在零膨胀现象计数数据的不足,将零膨胀模型用于中药上市后临床安全性计数资料的分析,可在丰富中药上市后安全性再评价分析方法的同时,为提高中药临床安全性研究质量和证据强度提供依据。
[1]王婷,曾平.ZIP模型在临床研究中的应用及SAS实现[J].中国卫生统计,2011,28(6):670-673.
[2]项丽雅.ZIP回归模型的变量选择及其在保费厘定中的应用[D].复旦大学,2012:5-8.
[3]田娇妮,刘桂芬,张军锋.多水平零膨胀计数模型在骨关节疼痛影响因素中的应用研究[J].中国卫生统计,2012,29(1):44-46.
[4]徐涛.零频数过多资料的统计学模型应用研究-亚健康状态研究中的应用[D].北京:北京协和医学院,2011:17-18.
[5]王存同.零膨胀模型在社会科学实证研究中的应用-以中国人工流产影响因素的分析为例[J].社会学研究,2010,(5):130-148.
[6]Jiang X,Huang B,Zaretzki RL,et al.Investigating the influence of curbs on single-vehicle crash injury severity utilizing zero-inflated ordered probit models[J].Accid Anal Prev,2013,57:55-66.
[7]Kilic D,Ozturk S.Gender differences in cigarette consumption in Turkey:Evidence from the Global Adult Tobacco Survey[J].Health Policy,2013.
[8]王存同.避孕知情选择对中国人工流产的影响分析[J].人口与发展,2010,16(3):17-26.
[9]Lu CY,Srasuebkul P,Drew AK,et al.Trastuzumab therapy in Australia:Which patients with HER2+metastatic breast cancer are assessed for cardiac function[J].Breast,2013,22(4):482-487.
[10]Haroon N,Inman RD,Learch TJ,et al.The Impact of TNF-inhibitors on radiographic progression in Ankylosing Spondylitis[J].Arthritis Rheum,2013.
[11]Ritter AV,Bader JD,Leo MC,et al.Tooth-surface-specific effects of xylitol:randomized trial results[J].J Dent Res,2013,92(6):512-517.
[12]Donaldson MG,Sobolev B,Cook WL,et al.Analysis of recurrent events:a systematic review of randomised controlled trials of interventions to prevent falls[J].Age Ageing,2009;38:151-5.
[13]李婵娟.新药临床研究中安全性评价的统计方法[D].西安:第四军医大学,2005:9-13.
[14]Khokan C Sikdar,Jdffrey Dowden,Reza Alaghehbandan,et al.Adverse Drug Reactions in Elderly Hospitalized Patients:A 12-Year Population-Based Retrospective Cohort Study[J].The Annals of Pharmacotherapy,2012,46(7):960-971.
[15]C.E.Rose,S.W.Martin,K.A.Wannemudhler,et al.On the Use of Zero-Inflated and Hurdle Models for Modeling Vaccine Adverse Event Count Data[J].ouranl of Biopharmaceutical Statistics,2006,16(4):463-481.
[16]A.L.Baughman.Mixture Model Framework Facilitates Understanding of Zero-Inflated and Hurdle Models for Count Data[J].Jouranl of Biopharmaceutical Statistics,2007,17(5):943-946.
[17]2011年国家药品不良反应监测年度报告.http://www.sda.gov.cn/WS01/CL0078/72193.html.
Application of Zero-inflated Models in Drug Safety Analysis of Count Data
Zhai Jingbo Zheng Wenke Lei Xiang Cao Hongbo Wang Hui Shang Hongcai✫
(Tianjin University of TCM,Tianjin,300193,China)
Abastact:Zero-inflated model is a statistical model for handling zero-inflated count data.It's widely used in modeling insurance data,investigating the influence of curbs on single-vehicle crash injury severity and so on.Zero-inflated phenomenon may existed in drug safety analysis of count data.There is the problem of poor fit in modeling zero-inflated count data by poisson regression or negative binomial regression model.Zero-inflated model may be a better alternative and the related examples have been reported.The zero-inflated models could be used to model adverse events or adverse reactions count data.It consider the zero-inflated phenomenon and Improve accuracy of parameter estimation.There is great significance in exploring drugs(especially traditional Chinese medicine injections)security events occurrence,identifing important risk factors and so on.
Zero-inflated model;Drug safety;Count data
10.3969/j.issn.1672-2779.2013.21.116
1672-2779(2013)-21-0164-02
吴义红
2013-07-08)
国家自然科学基金[No:81303093];“十二五”重大新药创制项目[No:2011ZX09304]
*通讯作者