高宇 吕允凤
随着分子生物学技术的发展,靶向治疗作为一种低毒、高效的肿瘤疗法已经成为研究热点,并得到了广泛的应用[1]。靶向治疗药物在临床应用时需通过有效手段将可能从靶向药物中获益的患者筛选出[2-5],该试剂被命名为伴随诊断试剂(Companion Diagnostics,CDx)[6]。为了确认在临床应用时伴随诊断试剂对可获益患者的筛选性能,伴随诊断试剂上市前的临床评价研究需要通过受试者的药物治疗效果进行评价[7],是一种难度较高的临床评价方法。通常,每个临床试验仅能针对一种药物及其伴随诊断试剂的相关性验证。然而随着靶向药物的增加以及高通量测序技术的发展,传统伴随诊断试剂及其临床评价模式已经难以满足临床的需要。
传统伴随诊断试剂一次检测通常仅能针对一种药物的应用进行指导,如果一种疾病有多种伴随诊断药物,就需要进行多次检测,不仅增加的检测费用及时间,同时增加了所需要的活检样本量。高通量测序技术可以通过一份样本对于几乎全部感兴趣的基因位点进行检测,一次检测可以同时指导多个以基因检测结果作为伴随诊断位点的药物的使用[8]。这虽然在技术层面解决了传统伴随诊断试剂所造成的问题,但当其作为一个产品进行上市评价时,按照传统临床评价方式逐一进行检测位点与药物相关性之间的临床验证,这也是不现实的。
前美国FDA审评员Li于2015年9月提出伴随诊断Follow-On临床评价方法并于2016年9月公开发表论文对该评价方法的统计原理进行了详细的阐述[9]。该方法的基本原理是通过与已上市试剂进行符合率(Percentage of Agreement)研究推导二者的临床应用时的等效性(Concordance)。2017年,美国FDA首次使用Follow-On临床评价方法批准了基于高通量测序技术的伴随诊断试剂Foundation-One CDx上市。本文基于Follow-On临床评价方法的统计学原理,结合美国FDA公开的已批准上市产品的安全有效性数据综述(Summary of Safety And Effectiveness Data,SSED)[10-12],分析美国FDA对于Follow-On临床评价方法的评价思路以及高通量测序体外诊断试剂的评价思路,以期为我国同类型产品的临床评价提供参考。
FoundationOne CDx基于高通量测序方法学共检测324个基因的突变,其中检测7个基因的突变用于指导用药(见表1)以及不单独用于指导用药的300余个基因。不单独用于指导用药的位点包括用于计算肿瘤突变负荷(Tumor Mutation Burden,TMB)、检测微卫星不稳定性(microsatellite instability,MSI)以及其他具有显著临床意义[13]的基因位点。在临床上,TMB指标用于临床医生决策PD-L1药物的使用[14],但FDA并未将该用药指导列入预期用途。本文仅针对指导用药的伴随诊断位点的临床评价方法。
表1 FoundationOne CDx伴随诊断检测基因突变对应肿瘤及相应药物Table 1 Tumor Mutations of FoundationOne CDx and Corresponding Drugs
根据Follow-On临床评价方法的统计学原理,应入组数量基本相等的阳性和阴性样本(各约150例),对入组样本进行两次对比试剂(Comparator Companion Diagnostic,CCD)检测及一次考核试剂检测(Follow-on Companion Diagnostic,FCD)。分别以对比试剂第一次(记为CCD1)及第二次(记为CCD2)检测结果为基准,计算另一次对比试剂检测结果及考核试剂检测结果与基准检测符合率的差值,从而评价FCD与CCD的临床等效性。样本入组的预筛试剂可以是包括对比试剂在内的任意检测试剂,而对比试剂必须选择已上市的伴随诊断试剂。如果使用对比试剂作为预筛试剂,预筛检测结果可以作为等效性研究的两次对比试剂检测结果中的一次使用。FoundationOne CDx临床试验所选择的预筛选试剂、第一次对比试剂(CCD1)检测试剂、第二次对比试剂(CCD2)检测试剂参见表2。
表2 FoundationOne CDx临床试验试剂的选择Table 2 Test Selection in FoundationOne CDx Clinical Trail
统计分析时,根据指标在预期人群阳性率(Prevalence)及入组人群比例校正计算CCD1分别与FCD和CCD2的符合率的差值、CCD2分别与FCD和CCD1的符合率的差值,并通过Bootstrap法得到差值的95%置信区间[15]。在Li的文献中,非劣效界值设定为5%。但在SSED中,所有基因位点中与之对应的差值ζ最大95%置信区间上限最大值为13.6%。可以看出在产品临床评价中对非劣效界值的设定根据产品的实际情况进行了调整。见表3。
表3 Follow-On临床试验结果表格Table 3 the Form of Follow-on Clinical Trail Results
在6个试验的结果表格中有3个对于不一致样本的结果进行了注释,所注释单元格均为FoundationOne CDx检测与两次CCD之间检测结果不一致的样本,即FoundationOne CDx为阳性而两次CCD检测结果为阴性样本、FoundationOne CDx为阴性而两次CCD检测结果为阳性样本。对于其他的结果数量并未进行注释。
Follow-On可理解为是一种临床应用模拟评价的方法。当已上市试剂的两次检测均为检测结果阳性,则判定样本来源受试者使用相应药物可获益,而考核试剂的检测结果应与之一致。试验的实施与一般体外诊断试剂临床符合率研究相似,但评价的方法却有较大区别。
为有效评价阴阳性符合率,该临床评价方法以检测结果作为入组标准。以任意的检测结果入组阴、阳性样本各约150例。如以对比试剂结果作为入组依据,该结果可作为正式试验的一次对比试剂检测结果。在对比试剂选择时,不限制于对比试剂方法是否相同,但应尽量选择检测同一生物标志物的试剂。
数据汇总时,应剔除CCD1、CCD2、FCD结果不完整的样本。统计分析时,应根据标志物在预期人群阳性率及入组受试者阳性率进行校正计算。当基于样本全集的统计结果表明与对比试剂有较大差异时,可以通过分层分析考察影响因素,如样本量、人口学特征等。如调整后具有较好的临床等效性,应当基于分层统计结果将影响因素写入说明书中“局限性”部分。对于检测不一致样本,应当着重对申报试剂与两次CCD之间检测结果不一致的样本进行分析,分析结果同样应当写入说明书中“局限性”部分。
在对比试剂的选择时,方法学的一致性并非主要考虑因素,但必需具有同样的伴随诊断预期用途。当有多个针对同一药物的伴随诊断试剂时,应选择方法学更加准确的伴随诊断试剂作为对比试剂。例如,ALK重排的研究中,样本基于免疫组织化学试剂结果入组并作为CCD1结果,但考虑到免疫组织化学的在临床使用中所可能遇到的内部质控难度的问题[16],将CCD2改为原位杂交伴随诊断试剂。
在FoundationOne CDx的SSED临床评价部分开篇就明确了所使用的是按照Li所提出的Follow-On的伴随诊断试剂临床有效性评价方法进行研究。该文献中的举例中的样本量与实际产品临床试验的样本量相似。但FoundationOne CDx临床试验中,部分突变位点ζ的置信区间与文献中所提及的5%非劣效界值有较大差异。因此在实际的临床评价中,正如Li在文章中说“非劣效界值δ的设定需要考虑试剂、临床、统计、监管等多方面因素”。
在FoundationOne CDx的临床试验数据中有部分位点的临床试验ζ的95%置信区间上限较高。对于高ζ的情形,应当基于样本信息进行分层分析,包括但不限于基因型、人种、性别等。根据高通量测序的流程,样本体积是否充足是影响检测准确性的重要影响因素。在FoundationOne CDx临床试验的统计分析时也分别对全样本集和大于0.6 mm2的样本集进行了分层分析。根据统计结果,大于0.6 mm2的样本具有更好的符合率从而可以推定更好的等效性。据此,在SSED所记载的检测流程中0.6 mm2规定为是有核细胞充足的判定标准,而在Foundation Medicine网站所公布的样本要求中更为保守地规定了最小样本体积为1 mm2[17]。
在统计结果表格中,除以免疫组织化学和原位杂交为方法学的对比试剂外,均在检测结果中对FoundationOne CDx与两次CCD之间检测结果不一致的样本进行了注释,解释了不一致的原因,并将相应的解释写入说明书中。这些注释表明,在评价的过程中应重点分析在临床有较大用药可能的样本检测结果不一致的原因,而CCD1、CCD2本身检测结果不一致样本的检测结果相对弱化。
高通量测序伴随诊断试剂使用Follow-On临床评价方法可以进行多位点多药物伴随诊断性能的临床评价。Follow-On伴随诊断试剂评价方法是通过特殊的临床实验设计更多地依靠统计学方法进行评价的临床评价方法。由于脱离了药物治疗效果的研究,不仅需要考虑产品评价方法,还应在临床评价方法适用性方面有更深入的考虑。设定产品的接受标准时也应结合产品的实际情况,根据患者的风险及获益评价其临床性能。此外,该方法虽然在一定程度上解决了用药受试者样本稀缺的问题,但对于阳性样本数量的要求会高于传统的伴随诊断试剂临床试验。同时由于需要进行3次检测,纳入样本的样本体积也会有“硬性”的要求,需要完成三次检测。这也高于传统的伴随诊断试剂临床试验。