贝叶斯统计医疗器械临床试验应用指导原则研究

2020-08-13 09:18
中国医疗器械信息 2020年13期
关键词:样本量先验贝叶斯

1 辽宁省检验检测认证中心认证审评院 (辽宁 沈阳 110003)

2 辽宁省检验检测认证中心医疗器械检验检测院 (辽宁 沈阳 110179)

内容提要:《贝叶斯统计医疗器械临床试验应用指导原则研究》是在美国食品药品管理局(FDA)的“贝叶斯统计医疗器械临床试验应用指导原则”理念基础上,结合我国实际需要,扩展贝叶斯临床设计理念在我国医疗器械临床试验中的应用思路。

贝叶斯分析在医疗器械临床试验中的应用始于20世纪90年代末。其目的是有效地利用大量已有的医疗器械临床试验先验信息,同时,改善现有的医疗器械临床评价方式,使其更适应医学技术的飞速发展所导致的发明过程和更新换代明显加快的情况。美国器械与辐射防护中心(Center for Devices and Radiological Health,CDRH)2010年2月5日发布了《医疗器械临床试验贝叶斯统计应用指导原则》,该指导原则不仅对贝叶斯统计基本概念,贝叶斯临床试验设计,贝叶斯临床试验分析,贝叶斯上市后监测等问题进行了全面论述,而且对贝叶斯统计的应用条件和资料编写等技术细节进行了详尽描述,本文通过对FDA《医疗器械临床试验贝叶斯统计应用指导原则》进行研究和分析,提出贝叶斯临床试验在我国应用的建议。

1.贝叶斯统计的概念

贝叶斯统计是一种从积累的证据中学习的方法。经典统计方法(即频率法)就是通过选取一定的样本信息来推断总体数据信息,而贝叶斯统计则是通过样本信息加上先验信息来推断总体数据信息(见图1)。

图1.经典统计与贝叶斯统计关系

在医疗器械临床试验中,经典统计方法,以往的先验信息仅在试验设计阶段利用,而在数据分析阶段,以往的先验信息仅被认为是正式分析的补充数据而不是其中一部分数据。贝叶斯统计则是使用贝叶斯理论在考虑数量利益(即满足尽可能少的试验样本量)的前提下正式将以往的先验信息与当前的信息结合,将先验信息和当前的试验结果均考虑作为连续数据流的一部分,因此,每当有新数据产生,推论就会更新。

与经典统计相比贝叶斯统计的优点主要有两点:①当医疗器械具有良好的临床使用相关的先验信息时,贝叶斯统计方法可以将此先验信息纳入临床试验的统计分析,在某些情况下,可减少临床试验的样本量。②通过适当的规划,贝叶斯统计可以提供灵活的试验设计过程中的变化,比如去除不利的治疗装备或修改随机计划,贝叶斯统计在临床试验过程中可以特别灵活地改变和控制随机化。叶斯统计在处理漏失数据方面具有更大的灵活性。其缺点主要也有两点:①在试验设计的操作上,贝叶斯设计需要大量的模拟设计,试验设计需要的计算工作量比后期的数据分析要大得多,这在经典统计中是难以想象的。②需要专业人才设计和审评,对审评人员的能力挑战极大。

2.FDA《医疗器械临床试验贝叶斯统计应用指导原则》的基本内容

《指导原则》全文共分为8章38节,内容可归纳为以下5个方面[1]。

2.1 贝叶斯临床试验概述

在《指导原则》前三章,FDA对医疗器械临床试验有关的贝叶斯统计基本概念进行概述,如先验分布、后验分布、似然函数、预测概率、可交换性等。此外,也阐述了医疗器械临床试验中为什么要应用贝叶斯统计,贝叶斯统计在当前使用的更普遍的原因以及使用贝叶斯统计的潜在效益和挑战。

2.2 贝叶斯临床试验设计

与经典统计相比,贝叶斯临床试验设计样本含量的确定和试验设计的具体操作有明显差别,贝叶斯统计不是事先制定一个固定的样本量,而是指定一个停止试验的标准,而经典统计通常需要事先确定样本含量。此外,为了防止贝叶斯临床试验设计样本含量确定时的随意性,须事先确定最小样品量和最大样品量,最小样本量应根据安全性和有效性等参数确定,最大样本量应考虑经济、伦理和规范等方面要求。在先验信息选取上,应采用量化的客观的先验信息,比如来自器械自身的信息、对照组的信息或两者兼之,不能采用专家意见等主观先验。在试验设计的操作上,贝叶斯设计往往涉及大量的统计模拟。FDA要求提供有关试验设计详尽的模拟实验结果。不同试验环境和条件的模拟设计对制定满足需求的贝叶斯试验方案具有重要价值,但工作量巨大。

2.3 贝叶斯临床试验分析

同经典统计一样,贝叶斯统计推断包括假设检验和区间估计。但是,贝叶斯假设检验和区间估计是以后验分布为基础的,因此在结果解释上和经典统计的意义不完全相同。

在贝叶斯统计分析中,通常采用期望值概率分析。所谓期望值概率,是指给定结局在未来是否发生的概率,用于决定何时停止试验、用于预测当前患者的临床结局以及调整有缺失数据的试验结果和模型检验等,是一种特殊类型的后验概率。在制定临床试验方案时,可将期望值概率作为停止试验的标准,当期望值概率足够高时则可以停止试验并宣布成功,概率足够低时可以认定器械不满足要求而停止试验并减少损失。这一特点显示了贝叶斯临床试验的灵活性,具有重要的实际意义。

2.4 贝叶斯上市后监测

贝叶斯统计有利于医疗器械的上市后监测数据分析。“今天的后验是明天的先验”,可以将上市前研究数据的后验分布作为上市后监测的先验分布,并通过不断收集上市后监测数据,再不断更新先验分布来提高贝叶斯统计推断的质量,可有效利用上市后监测数据。

2.5 临床试验资料的技术细节

《指导原则》还描述了贝叶斯统计临床试验资料准备及提交审评的技术细节,有利于申报者在医疗器械临床试验中正确应用贝叶斯统计方法以及向FDA上报规范的临床试验技术资料,比如研究方案应包含模拟实验方法、模型选择方法、可交换性检查以及计算方法等。

3.《医疗器械临床试验贝叶斯统计应用指导原则》在我国应用的启示

3.1 规划我国《医疗器械临床试验贝叶斯统计应用指导原则》拟定和实施步骤

FDA《指导原则》从方向酝酿、框架拟定、草案形成和最终发布过程大概有十年的时间。早在1998年,FDA举办了一次贝叶斯统计研讨会,向申报者发出了明确信号:CDRH愿意接受基于贝叶斯方法的申请项目。到2004年已有基于贝叶斯方法的成功案例和获批产品,在此背景下,FDA与约翰霍普金斯大学生物统计学系、美国国立卫生研究院举办了一次专题研讨会,这次研讨会各方所达成的共识形成了《医疗器械临床试验贝叶斯统计应用指导原则(草案)》,FDA于2006年5月发布了该草案,在草案公布后,FDA接到了很多有意义的反馈意见,这些意见经专家讨论后于2010年2月形成了最终的指导文件[2]。

医疗器械临床试验贝叶斯统计应用,需要一定的社会科技发展基础和监管机构的人才储备基础,因此我国制订《医疗器械临床试验贝叶斯统计应用指导原则》应分阶段逐步完成:①进行基础研究,了解贝叶斯统计方法和国外的应用案例;②依据审评能力建设情况,选择性试运行;③依据试运行情况,制订《医疗器械临床试验贝叶斯统计应用指导原则(试行)》;④推广运行阶段;⑤依据推广运行情况,制订最终《医疗器械临床试验贝叶斯统计应用指导原则》。

3.2 医疗器械临床试验贝叶斯统计应用需要关注的问题

3.2.1 要有良好的预设计。在贝叶斯试验中,预设计十分关键,必须在实验设计阶段就考虑到以下因素:先验信息、本次试验所能获得的数据及将二者有机结合所需的数学模型。对于先验信息的不同选择或者对于模型的不同选择将会产生不同的结论。在临床试验的后期改变先验信息或者计算模型将可能危及试验结果的科学有效性。因此,贝叶斯临床试验的设计需要提交先验信息和计算模型相关的规范和协议。由于达成协议往往是一个反复的过程,在使用贝叶斯统计时应提前召开正式的协议会来确证预设计方法是否科学合理,并建议与审评机构沟通协调以便就贝叶斯临床设计的基本要求达成一致。

建议从临床和统计两方面考虑先验信息的选择是否科学合理;建议通过进行灵敏性分析来验证所选择的数学模型在选择不同先验分布时的稳定性。

3.2.2 建立科学合理的数学模型。使用贝叶斯统计进行临床试验涉及广泛的数学建模工作,包括选择能够反映先验信息的概率分布、多个先验信息源之间的关系、协变量对于患者治疗结果及漏失数据的影响及模型选择的灵敏度分析。

关于数学模型的选择,建议与审评机构以及统计学和临床试验专家进行密切合作从而达成一致。

3.2.3 选择正确的统计分析方法和软件。贝叶斯分析常常计算强度很大。但是,最近计算算法和运算速度的突破,使人们能够实现对非常复杂和现实的贝叶斯模型进行计算。基本的计算工具是一种叫Markov Chain Monte Carlo(MCMC)采样的方法,该方法可模拟随机量分布,可用于:分析临床试验数据、检查模型假设、设计阶段评价先验概率、模拟评估各种结果的概率及估计样本量。

目前常用的贝叶斯分析的软件有WinBUGS,可专用于进行贝叶斯计算。BUGS是“应用吉布斯模型进行贝叶斯推理”的首字母缩略语,是MCMC采样的一种常见类型。WinBUGS催生了另外两个软件包,BRUGS和OpenBUGS。将来有望出现其他的贝叶斯软件包。建议在选择特定的软件产品之前,应就提交材料时所采用的计算方法来咨询审评机构的老师。

3.2.4 先验信息的选择。在先验信息选取上,应采用量化的客观性先验,如来自器械自身的信息、对照组的信息或两者兼之。不应采用专家意见等主观先验。

3.2.5 建议提交的审评文件要求。除了正规临床试验方案和临床试验报告之外,应提交有关贝叶斯试验设计特有的试验计划书。试验计划书应包含先验信息、试验终结的标准、拟定样本量大小的理由、试验概率、有效样本量、模型选择等。

贝叶斯模型的灵活性以及贝叶斯分析计算技术的复杂性大大增加了错误和误解发生的可能性。对于任何提交的文件,审评机构应进行详细的统计审查,包括使用相同的或者替代的软件进行结果验证。因此建议企业以电子文档的形式提交数据和使用统计分析程序获得的指令集。

3.2.6 贝叶斯分析和频率论分析可能得出不同的结论。贝叶斯分析和频率论分析对具有相同临床数据会得出不同的结论,而且每种结论都科学有效。但是如果临床试验已经启动,就不建议从频率论分析改变为贝叶斯分析(反之亦然),这种事后分析不科学合理,往往会削弱提交材料的可信度。

猜你喜欢
样本量先验贝叶斯
一种基于进化算法的概化理论最佳样本量估计新方法:兼与三种传统方法比较*
BOP2试验设计方法的先验敏感性分析研究*
医学研究中样本量的选择
基于贝叶斯定理的证据推理研究
基于贝叶斯解释回应被告人讲述的故事
一种考虑先验信息可靠性的新算法
样本量估计及其在nQuery和SAS软件上的实现*——均数比较(十一)
样本量估计及其在nQuery和SAS软件上的实现*——均数比较(十)
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究