从K药的研发过程看肿瘤临床试验统计学的挑战*

2022-10-12 01:55黄丽红

中国卫生统计 2022年4期

黄丽红陈峰

【提要】药物的命运和临床试验的设计与实施紧密联系。在K药的研发过程中，不乏创新且意义重大的试验设计与分析策略。纵观K药研发之路，相对于其他疾病的药物临床试验，肿瘤临床试验面临诸多新的挑战。本研究梳理了当前肿瘤临床试验面临的8大挑战，并对现代统计学的应对策略进行了总结，针对具有突出贡献的创新性设计和统计学方法进行了述评。尽管现代统计学的应对策略不断推陈出新、蓬勃发展，但必须清楚认识坚持临床试验的三大原则，保持临床试验完整性，及开展高质量的临床试验的重要意义。

帕博利珠单抗(Pembrolizumab)，商品名为Keytruda(可瑞达)，俗称K药。美国食品药品监督管理局(FDA)已批准其用于包括黑色素瘤、非小细胞肺癌、尿路上皮癌等在内的17个癌种及微卫星高度不稳定/错配修复功能缺陷(MSI-H/dMMR)与高组织肿瘤突变负荷(TMB-H)≥10个突变/Mb两个不限癌种适应症[1]。我国国家药品监督管理局(national medical products administration，NMPA)也已批准其适用于包括不可切除或转移性黑色素瘤患者的二线单药治疗、EGFR基因突变阴性和ALK阴性非鳞状非小细胞肺癌患者的一线联合治疗、PD-L1 TPS≥1%且EGFR基因突变阴性和ALK阴性的局部晚期或转移性非小细胞肺癌患者的一线单药治疗、转移性鳞状非小细胞肺癌患者的一线联合治疗、PD-L1 CPS ≥10局部晚期或转移性食管鳞状细胞癌患者的一线单药治疗、PD-L1 CPS≥20转移性或不可切除的复发性头颈部鳞状细胞癌(HNSCC)患者的一线治疗[2]。

K药研发过程中的代表性临床试验概述

药物的命运与临床试验的设计与实施紧密联系，在K药的研发过程中，不乏创新且意义重大的试验设计与分析策略(表1)，有可能成为教科书中的案例。整个研发过程以拓展性多队列(expansion cohort)I期临床试验(KEYNOTE-001)拉开帷幕，初步确立了K药的使用方法和剂量，确定了PD-L1的检测方法、阈值(cut-off)，同时也探索了PD-L1表达对免疫治疗的预测价值[3-4]。2014年9月4日，基于KEYNOTE-001的数据，FDA加速批准K药用于经ipilimumab治疗(若为BRAF V600突变阳性，则需接受过BRAF抑制剂治疗)后出现疾病进展的不可切除或转移性黑色素瘤患者。这是K药的首个获批适应症，也是FDA批准的第一款抗PD-1产品[5]。KEYNOTE-002发现K药在伊匹单抗难治性晚期黑色素瘤患者中的疗效，被FDA批准为黑色素瘤的二线用药[6]。随后，KEYNOTE-006对比伊匹单抗，验证了K药在晚期黑色素瘤患者中的疗效，获批黑色素瘤的一线用药[7]。2015年10月2日，基于KEYNOTE-001的数据，FDA加速批准了K药用于PD-L1高表达(PD-L1 PS ≥ 50%)的晚期经治非小细胞肺癌患者的单药治疗[8]。随后，KEYNOTE-024显示与化疗相比，K药在PD-L1TPS≥50%的非小细胞肺癌患者中的疗效，动摇了化疗在晚期肺癌一线治疗中的地位；KEYNOTE-024 采用的生物标记物富集设计以及独特的期中分析策略也使得K药在非小细胞肺癌一线治疗适应症的争夺上获得了先机[9]；随后KEYNOTE-042 通过期中分析及序贯检验(hierarchical testing)策略进一步确认了K药在非小细胞肺癌一线单药治疗OS上的获益和相应的PD-L1 TPS阈值[10]。在非小细胞肺癌一线联合治疗上，KEYNOTE-021 创新性的I/II期设计使得K药在2017年获得了FDA的加速批准[11]。随后KEYNOTE-189和KEYNOTE-407分别验证了K药在转移性非鳞状非小细胞肺癌患者和转移性鳞状非小细胞肺癌患者中的疗效，完成了其在一线非小细胞肺癌中的全面覆盖[12]。

表1 K药研发过程中的代表性临床试验汇总

在药物研发的不同阶段，上述试验步步为营，以不同的终点/人群/设计选择奠定了K药在非小细胞肺癌适应症上的成功和领先地位。2017年，FDA加速批准K药用于治疗MSI-H/dMMR的实体瘤末线患者[1]。此次获批也是全球首个获批于不限癌种而是基于特定肿瘤基因突变类型生物标志物的治疗，K药成为了真正的“广谱精准抗癌药”，其中KETNOTE-158提供了强有力的证据[13]。

从K药研发之路看肿瘤临床试验的挑战

恶性肿瘤是严重威胁人类健康的一类疾病，尽管现有治疗手段取得了一定疗效，但多数肿瘤患者生存时间有限，缺乏有效的可以治愈的药物，因而抗肿瘤药物一直是新药研发热点。近年来，免疫治疗成为了最热门的抗肿瘤药物研发方向。纵观K药研发之路，相对于其他领域的药物临床试验，肿瘤临床试验面临诸多挑战。

1.对于严重危及生命且尚无有效治疗手段的肿瘤，如何在保证伦理和科学性的情况下，加快研发速度，让患者早日获益，是抗肿瘤新药研发的巨大挑战。

2.肿瘤I期临床试验一般选择患者作为研究对象，需尽可能避免患者不必要地暴露于低于或高于治疗剂量的治疗(即尽可能多地在治疗剂量范围内治疗受试者)。但患者的基本情况各异，变异较大，给早期剂量探索带来了新问题。

3.大部分恶性肿瘤发病率较低，招募患者相对困难。

4.肿瘤种类繁多，适应症难把握：人体任何部位、任何器官、任何组织几乎都可发生肿瘤，不同的发病部位、组织来源的肿瘤类型不同，肿瘤处于不同的疾病发展阶段，对药物的反应也可能不同，确定受试者人群有时显得很困难。

5.OS是评价抗肿瘤疗效的金标准。对于经过积极治疗生存情况较好的肿瘤，为获得目标把握度所需的事件数，需要很长的随访时间，在有些情况下可行性较差。PFS和ORR也是评价疗效的常用指标，两者均为基于肿瘤测量的终点指标，但一方面肿瘤评估易受主观性的影响，尤其在非盲状态下；另一方面，PFS和ORR对OS的预测能力尚不清楚，尤其是对创新药物。因此，在选择主要疗效指标方面存在决策困难。

6.如何选取合适的生物标志物、确定生物标志物阈值？如何根据生物标志物进行合理设计，例如选用生物标志物富集设计还是生物标志物分层随机设计？

7.在随机对照试验中，虽然不同治疗组的基线具有可比性，但试验进行期间所出现的混杂、所发生的伴发事件(包括但不限于出于伦理考虑的治疗转组、使用其他可延长生命的治疗，或失访、死于其他疾病等)，将严重影响疗效评估，此时如何评价试验结果？

8.在复杂设计中，可能涉及多阶段、多终点指标、多剂量筛选、多适应症选择、多个生物标志物亚组、期中分析等，如何确保试验的完整性和科学性，并正确控制Ⅰ类错误？

现代统计学的应对策略

统计学作为一门学科已有三百多年的历史。20世纪，随着各类统计推断方法的提出，统计学发生了划时代的改变，不再拘泥于描述性统计方法，自此进入了现代统计学阶段。统计学的发展一向以实际需求为驱动，伴随着需求和数据的改变逐步向前发展。随着生物统计学方法在临床试验中应用的不断加强，大大促进了临床试验事业的进步，并日益显示出强大的方法学支持作用，临床试验统计学(clinical trial statistics)应运而生[14]。面对肿瘤临床试验的诸多挑战，该应用领域的临床试验统计方法学研究备受关注，创新的临床试验设计类型和方法层出不穷，详见表2。

表2 肿瘤临床试验中的现代统计学方法汇总

这些创新性试验设计和统计分析方法的灵活应用，在抗肿瘤药物研发过程中至关重要。其中，多重终点指标、成组序贯设计及OS敏感性分析策略的提出，对于科学评价药物疗效，提高研发效率意义重大。

1.多重终点

临床试验中的多重终点策略，包括在一个试验中对多个指标(比如PFS、OS和ORR)，对多个人群(比如生物标志物阳性人群和全人群，鳞癌人群和全人群)进行多次假设检验。在采用多重终点时，要注意提前定义检验假设和总Ⅰ类错误率(family-wise error rate，FWER)的控制方法。如果多个主要终点指标均要求有统计学意义方可认为该试验成功(co-primary endpoints)，则不会引起FWER膨胀，但此时需考虑Ⅱ类错误的膨胀，即检验效能的降低。如果多个主要终点指标中至少有一个终点指标有统计学意义即可认为该试验成功(multiple primary endpoints)，则会引起FWER膨胀，此情况下必须采用多重性策略和调整的办法来控制FWER。目前，解决多重性问题的决策策略主要有平行策略、序贯策略和分阶段的整体决策策略。平行策略中常用的多重性调整方法有Bonferroni、加权Bonferrori和前瞻性α分配法(PAAS)等。序贯策略中常用的多重性调整方法有固定顺序法、回退法、Holm法和Hochberg法等。分阶段的整体决策策略中常用的多重性调整方法有α分配再回收策略、守门法(gatekeeper)、图形法(graphical approaches)等[15]。在KEYNOTE系列研究中，KEYNOTE-042采用了固定顺序法依次检验了K药在PD-L1 TPS≥50%，PD-L1 TPS≥20%，PD-L1 TPS≥1%转移性非小细胞肺癌患者上OS的疗效。KEYNOTE-407采用了图形法检验了K药在转移性鳞状非小细胞肺癌患者的PFS、OS和 ORR的疗效。合理的多重性策略和方法可以更有效率地研究试验药物。反之，不恰当的多重性策略和方法可导致试验把握度下降甚至试验失败。在制定多重终点策略时，需要综合考虑人群特点、药物特点、法规要求和统计性能。2020年12月，NMPA发布了《药物临床试验多重性问题指导原则(试行)》，为确证性药物临床试验中如何控制FWER提供指导意见[16]。

2.成组序贯设计

成组序贯设计是指方案中预先计划在试验过程中进行一次或多次期中分析，依据每一次期中分析的结果做出后续试验的决策，决策通常有四种可能：(1)依据优效性提前终止试验；(2)依据无效性提前终止试验；(3)依据安全性问题提前终止试验；(4)继续试验。对于肿瘤临床试验，尤其是晚期肿瘤患者或者临床上治疗手段有限的适应症，成组序贯设计(包括无缝设计)对患者、临床医生、监管机构、药企在伦理和试验操作上都有巨大的价值。对于药效良好，甚至极佳的药物，依据优效性提前终止试验可以让患者更早获益；对于疗效欠佳的药物，可以早一点停止试验，避免患者长时间暴露在无效的试验药物中，符合伦理要求的同时也节约了宝贵的临床资源。但成组序贯设计对试验的设计者和执行者提出了更高的要求：主要终点的选择、Ⅰ类错误的控制、期中分析的时间选取等等都会在试验设计及执行层面对结果的解读、研发的决策，乃至研发的成败，有着巨大的影响，这里涉及的许多重要的问题都与统计学密切相关。例如，选择期中分析的时间点时，若期中分析为了验证药物的安全性和无效性，时间点的选择应侧重于如何最大程度地保护受试者；若存在以优效性提前终止试验的可能，时间点的选择需考虑期中分析时的数据量是否充分以及随访时间是否足够以便能够提供可靠的疗效估计和安全性评价的结果。2020年12月，NMPA发布了《抗肿瘤药物临床试验统计学设计指导原则(试行)》，专门针对成组序贯设计提出了指导意见[17]。

3.OS敏感性分析

OS是评价抗肿瘤疗效的金标准，在肿瘤免疫治疗研究的浪潮下，一系列免疫靶向新药相继问世，OS评估受到后续治疗影响的问题也更加突出。如果我们所关注的科学问题是病人在没有接受特定后续治疗的情况下试验组相对于对照组的OS改善，则可以考虑使用估计目标(estimand)框架下解决伴发事件的假想策略[18]，并使用RPSFT[19]、IPCW[20]等方法校正后续治疗对OS的影响。RPSFT方法通过构建虚拟的生存时间来校正观察到的生存时间，意味着随机分配至对照组且接受了特定后续治疗的受试者需要校正其开始后续治疗后的生存时间。但需要注意的是，RPSFT模型假设了药物治疗效果不会因为开始接受治疗的时间不同(作为后续治疗而非入组后即接受的治疗)而改变，且该模型不能同时对试验组和对照组患者的生存时间进行校正。IPCW方法也可用于校正受试者接受后续治疗所造成的影响，该方法将生存时间人为地删失在接受后续治疗之时，并对接受后续治疗之前的生存时间进行加权，而接受后续治疗后的生存时间将被忽略(权重为零)。IPCW方法假设所有与接受后续治疗的决定相关的因素都是可以测量的并且被考虑在模型当中，然而，这一假设一般无法在观察到的数据中得以验证。

讨论

针对肿瘤临床试验的各种不同挑战和需求，现代统计学的应对策略推陈出新，大大促进了先进统计方法的快速进展，但应注意以下问题。

1.坚持临床试验设计的基本原则

随机、对照、重复是试验设计的三大原则。随机是统计推断的基础，也是现代统计学的标志性技术，随机分组是目前确保组间(已知、未知混杂因素)均衡的经典方法，ITT(intention to treat)原则的初衷就是为了维持试验的随机性。对照是鉴别比较的基础，选择合适的对照，是临床试验成功的关键步骤之一。重复(replication)是指在相同的试验条件下进行多次研究或多次观察，以提高试验的可靠性与科学性。广义地讲，重复包括研究本身的重复、研究对象的重复(样本量估计)及观测的重复，其中样本量估计是临床试验设计中的一个极为重要环节。

2.临床试验完整性的保持是注册研究的首要条件

试验的完整性是试验结论的真实性、可靠性、科学性的总和。在临床试验设计、实施、数据管理、统计分析和结果解释的各个环节应采取恰当的措施尽可能地减小各种偏倚对试验结果的影响，从而将试验结论的假阳性率α、假阴性率β控制在设计时既定的范围内。

其中需要强调的是，Ⅰ类错误是把无效药物当作有效药物批准上市的可能性，是监管机构严格控制的，其重要性不可挑战。FDA一般要求严格控制Ⅰ类错误(概率为0.0252=0.00625)，任何可能增加Ⅰ类错误的做法(多次假设检验，多个主要终点等)都需要进行α水准的校正。虽然对于肿瘤或罕见病没有要求两个独立的确证性临床试验，但若采用复杂的设计(如适应性设计)作为主要研究，则需要从统计学上证明或用模拟试验说明该试验设计的Ⅰ类错误是能够得到控制的。

从统计分析层面保持试验的完整性，需要保证统计分析计划的前瞻性；需要提前定义假设检验和进行Ⅰ类错误控制，未提前定义的假设检验或分析只能作为支持性数据或者产生新的假设，而不能作为确证性证据；应正确选择统计方法、统计图表；即使是开放研究，也需按照盲态管理；统计计算应采用可靠的商用软件；统计分析应尽可能采用ITT分析原则；缺失值的填补应合理；并进行必要的敏感性分析以考察研究结论的稳健性。

ICH-E9(R1)提出了估计目标框架，为保持临床试验完整性，从统计分析的角度给出了指导原则。它将试验计划、设计、实施、分析和解释融为一体，为探讨和评估伴发事件的影响提供了实用的指导。估计目标框架将是今后临床试验设计需要遵循的通用标准框架。

3.高质量的临床试验是药物研发的必备条件

随着科学技术的发展，现代临床医学认识的进步主要依赖于临床试验的研究结果，高质量的临床试验是进行新药、新器械安全性和有效性评价的前提。药械研发困难重重，但不能因此放松对临床试验的要求。高质量的临床试验应具备：科学合理的试验设计、严格规范的操作实施、完善可控的质量管理、完整真实的数据信息、准确可靠的分析结果的要求。

致谢：

感谢吴海燕、杨平、李贲和王武保为本文的起草和修改提供建议。

从K药的研发过程看肿瘤临床试验统计学的挑战*

K药研发过程中的代表性临床试验概述

从K药研发之路看肿瘤临床试验的挑战

现代统计学的应对策略

讨 论

讨论