王丰 张威鹏 任平一 深圳市市场监督管理局许可审查中心 (广东 深圳 518000)
内容提要: 针对定量体外诊断试剂产品的参考区间研究资料归纳出审评关注点,并分别提供了参数法与非参数法建立参考区间的案例进行分析。以期供评审人员在技术审评过程中参考,帮助企业理解和把握整个研究资料的编写要点。
参考区间通常由其参考上限和参考下限组成,部分产品可仅有参考上限或下限。拟上市产品在注册申报时主要讨论健康人群的参考区间。现对定量体外诊断试剂参考区间研究资料的审评关注点进行归纳,并举例说明。
国内外无上市同类产品应建立参考区间。国外有已上市产品可验证原始参考区间在中国人群的适用性。国内有已上市同类产品,可选择建立或验证国内已注册产品的参考区间。已经有国内共识、医学决定水平的检测项目,可不再建立参考区间[1]。对拟上市产品可参照图1进行初步判断,选择合适的途径。
图1.参考区间的确定路径图
关注点:是否需要建立或可验证转移参考区间。国内外已有同类且成熟产品,可采用验证的方法转移其参考区间。
1.2.1 样本的选择
应制定纳排标准,选择“表观健康”的适用人群入组,并按临床决策意义、筛选个体的特征等因素进行分组。入组的参考人群分布组成直接影响着参考区间建立的科学性与适用性。根据最新公布的《体外诊断试剂参考区间确定注册审查指导原则》[1],建议申请人通过多中心招募的形式纳入参考人群。
关注点:确定待检项目的适用人群,明确该项目“表观健康”的参考个体,明确纳排标准。可参考对比试剂说明书、临床检验章程、标准及指导原则等进行判断,考察参考个体的分布组成是否满足以上要求。
例如:脂蛋白相关磷脂酶A2测定试剂盒,纳入排除标准中应排除无动脉粥样硬化的患者;雄烯二酮测定试剂盒要明确是否排除遗传性肾上腺皮质增生、肾上腺皮质功能减退等疾病人群;D-二聚体测定试剂盒的排除标准应考虑产品宣称的“弥散性血管内凝血及溶栓治疗”适应证;叶酸(Folate)测定试剂盒是否排除巨幼红细胞性贫血人群等。
1.2.2 样本采集与处理
采样前应确保参考个体的状态良好,并按说明书进行样本的采集与处理。
关注点:纳入的参考个体是否处于良好的状态;采集的样本是否明确其来源和机构名称;采用的样本是否符合说明书声称的要求;研究报告中是否已详细说明样本类型、储存方式等情况。
例如:血液样本应区分采样部位,如醛固酮测定试剂盒需补充仰卧位、直立位样本的采集方法,且该项目与生理节律有关,还应明确采血时间,并相应在说明书中列明[2];尿液样本应明确采集时间和方式,说明是否添加防腐剂等,如尿转铁蛋白测定试剂盒。
1.2.3 样本检测
应采用产品宣称的检测系统(含样本前处理产品、检测试剂、校准品、质控品、检测设备等)进行样本检测。
关注点:是否与说明书宣称的保持一致。
1.2.4 数据分析
检测项目可根据临床意义研究参考区间的单侧或双侧界限。详细的分析过程见图2。
图2.参考区间建立的数据分析过程
关注点:参考对比产品或同类产品的说明书。根据预期用途、专家共识等判断采用双侧还是单侧界限。
1.2.4.1 确定样本数量
根据CLSI EP28-A3c[3]的要求,采用90%置信区间估计参考区间时,样本量应≥120例,如需分组则每组都要≥120例。新生儿、幼儿、老年人等样本难以获得的人群可以少于120例[4]。
关注点:根据采用的置信区间不同,审核样本的例数是否满足要求。
例如:孕酮测定试剂盒应根据孕周的大小对其参考区间进行分组,如采用90%的置信区间则每组应采用至少120例样本进行研究。
1.2.4.2 绘制分布图
可通过绘制分布图的方法可以直观地了解所得数据的分布特性(如数据对称性或正态峰)[1]。可使用SPSS对参考值的统计数据进行正态性检验分析,根据数据的特征进行选择适用的检验方法。
关注点:判断数据的分布特征为正态或偏态,选择下一步分析方法及途径。
例如:糖化血红蛋白测定试剂盒需要补充各研究数据属于正态分布的统计分析过程等。
1.2.4.3 判断离群值
推荐使用Dixon方法和Tukey法两种方法进行离群值的判定。
Dixon法适用于非正态分布数据,通常利用比值D/R≥1/3来判断离群值[1];Tukey法用于正态分布数据,通常取四分位间距上下限[Q3+1.5×IQR,Q1–1.5×IQR]来判断其离群值[5,6]。
以上两种方法确定的离群值均需要有明确原因的才可剔除,如无明确原因,应将该数据保留。
关注点:离群值的判断是否正确,是否需要剔除,剔除后需补齐样本数重新进行判定。
1.2.4.4 分组比较
参考区间的分组比较应根据以下准则:是否对临床决策有意义或是否具有明确的生理学意义。应结合数据的分布特征选择分析方法,如数据呈正态分布、且两组间的比较时,申请人可采用Z检验,而多组间比较可采用F检验等。不存在统计学意义的组间可以合并参考区间[7]。
关注点:根据临床意义进行分组(可参考对比试剂),分组后每组的样本量都要满足要求。
例如:脂蛋白相关磷脂酶A2测定试剂盒的参考区间与年龄有高度相关性,应确保每个年龄段有一定的样本量,并分别统计分析。
1.2.4.5 建立参考区间
主要分为参数法和非参数法。①参数法亦称正态分布法。采用该方法要求数据接近正态分布或经转换后呈正态分布,样本量见表1。该方法建立参考区间的结果比较稳定,不易受到两端数据的影响[1]。②非参数法亦称百分位数法。如参考值数据呈偏态分布,可采用非参数法确定参考区间,样本量见表1。该方法容易受到两端数据的影响,不适用于样本含量较小时[1]。
表1.采用参数法/非参数法的样本数量、置信区间及参考区间上限和下限
关注点:分析方法是否适宜,样本量是否满足所宣称置信区间的最低要求,结果是否正确。
例如:可溶性生长刺激表达基因2蛋白检测试剂盒,未提供样本分布状态的研究,应明确数据呈偏态分布才适用于百分位数法。
验证参考区间必须同时满足:原始参考区间的研究具可信性,如有已发布实施的临床检测参考区间标准等;检测系统需具有可比性;分析前因素需具有可比性;参考人群的适宜性,即适用人群相一致,或包含其参考人群[1]。
如不能同时满足上述条件,则需要建立自己的参考区间。参考区间建立及验证流程可见图3。
图3.参考区间建立及验证流程
关注点:以上四个条件缺一不可。
1.3.1 比对评估研究
可参照《免于临床试验的体外诊断试剂临床评价技术指导原则》[8],通过方法学比对的方法,对申报产品与原始参考区间建立时的检测系统的可比性进行研究。通过列表的方式,对比参考人群分布的地理位置、生物特征、参考区间研究分析前的因素等[1]。
注意,采用验证方法转移参考区间时,应首选转移注册申报中临床试验或临床评价所选择的对比试剂的参考区间。
关注点:注意方法学比对的样本量能否满足统计学要求,两检测系统的检测结果应高度一致。
例如:超敏C反应蛋白测定试剂盒在直接验证并转移参考区间过程中,申报试剂与比对试剂方法学、工艺不同,参考值不应直接进行转移,应对检测结果进行统计分析后得出自己的参考值范围。
1.3.2 验证参考区间
1.3.2.1 小样本量的验证
依照CLSI/NCCLS C28-A2[3]、WS/T 402-2012[9]的要求,小样本量的验证应选择至少20例参考个体进行研究。建议制造商、用户(如医院)或接收实验室采用小样本量验证并转移已建立的参考区间。验证通过法则:原始参考区间外的观察值不超过2例(即10%)。如超过了2例(即10%),应另选至少20例重新进行验证[9]。
1.3.2.2 大样本量的验证
应选择至少60例参考个体,参照小样本量的方法进行验证。验证并转移原始参考区间时,建议采用大样本量。
关注点:样本例数(含不同组别)是否满足验证的要求。验证前应先做对比评估研究,评估原始参考区间能否转移。
例如:尿免疫球蛋白G测定试剂盒直接验证参考区间的研究试验中,样本例数应不低于60例。
在参考区间研究资料的技术审评过程中,还存在以下常见的问题点,同样需要引起关注。①参考区间确定的方法和依据不详细;②参考区间研究样本的来源不明确;③未对参考区间试验资料详细地总结归纳[10];④关于非同源样本,如尿液、血液样本,应分别建立其参考区间;如不能证明同源样本(如血清、血浆、全血)之间的一致性,应分别建立参考区间;⑤校准品和质控品不需要提交该项研究资料。
例如:肌红蛋白测定试剂盒在建立参考区间时,对比试剂肝素血浆、血清与EDTA血浆参考值差异较大,而申报试剂不同样本类型无差异,应应分别进行不同样本类型参考值研究;生长激素测定试剂盒宣称可用于新生儿,则需证明脐带血样本与静脉血样本之间是否可比,针对每个年龄段、不具可比性样本应采用至少120例样本对参考区间进行研究。
抗凝血酶Ⅲ活性测定试剂盒临床上主要用于辅助诊断血栓形成性疾病[11]。研究中共筛选了240例经临床诊断无心血管疾病史或凝血疾病史、未处于妊娠或哺乳期的健康人群,年龄范围为10~80岁,男女均等。检验结果按男女分为两个亚组经Z检验显示,两组均值间不存在统计学上的显著差异(Z
全程C反应蛋白测定试剂盒可作为非特异性炎症指标[12]和用于评价心血管疾病风险[12]。基于产品的预期用途,分别建立超敏C反应蛋白和常规C反应蛋白的参考区间。研究过程中分别入组400例无心血管疾病和400例无非特异性炎症的正常人,年龄范围为0~80岁,男女均等。统计分析根据年龄、性别差异分为四个亚组,采用Z检验对各亚组进行组间比较,经分析样本中男性和女性、成年与未成年人的C反应蛋白检测结果之间没有显著性差异。所测得的C反应蛋白浓度水平经K-S检验数据呈偏态分布,可采用百分位数法。结合该项目的临床特点取第95百分位数测试结果作为其参考上限,建立C反应蛋白参考区间:作为非特异性炎症指标时为0.00~10.00mg/L;用于评价心血管疾病风险时为0.00~1.00mg/L。
产品的参考区间跟临床用途紧密联系。产品的目标人群、使用环境、样本类型及要求、检测结果的预期用途等,都影响着参考区间的确立[13]。在往常的申报材料中,企业针对参考区间的研究和认识程度远远不够;甚至是上市后,临床医生的使用过程中容易跟其他概念混淆。很多企业并不理解参考区间的建立、转移/验证的原则,花费了大量的时间和精力去建立常规试剂盒的参考区间;在建立入排标准、分组情况时,未能依照产品的个性化需求入组符合要求的“健康人群”;不懂统计方法,无法识别数据中的错误;更有企业纳入了大量低于线性范围的数据,导致整个验证结果不科学等[10]。正确了解参考区间建立的准则与方法,理解和把握整个研究资料的编写要点,有助于企业提高自身研发能力,优化产品的临床性能,科学合理地评价产品,加快产品上市的步伐。