邱仁宗,翟晓梅
(中国医学科学院/北京协和医学院生命伦理学中心,北京 100005)
近几年来,有关机构伦理审查委员会的建立、运作和管理出现了许多有争议的问题,引起了热烈的讨论。这是件好事,说明研究伦理审查方面的工作在走向深入,本文陈述笔者对这些问题的意见和看法,希冀推动更为深入的讨论。
国际伦理学研究的历史充满着有悖于伦理原则和价值的丑闻。这并不奇怪,人是通过从错误中学习而进步的。应该允许人们对研究伦理的认识和伦理意识有一个从无到有、由弱到强的发展过程。问题是我们是否充分吸取了教训,健全规章制度,切实改进我们的工作。例如前一阶段在我国发生的黄金大米试验案例,我们对这个案例的讨论有许多不足之处。我们认为,黄金大米试验案例给我们的教训之一是,我们亟需加强伦理审查的能力。例如机构伦理审查委员会(下面简称“伦理委员会”)在审查用儿童进行黄金大米试验的国际合作研究方案时应考虑到这一项目的3个特点:①涉及儿童这一脆弱人群,对这一人群要特殊保护。伦理委员会审查时就要问:有没有在成人身上做过试验?如果没有,接着要问:为什么在成人身上试验之前先在儿童身上试验?事实上该项目的美国主要研究者(Principal Investigator,PI)是2009年才在美国用两名男子和3名女子进行试验,那是在中国用儿童进行试验之后。②涉及转基因食品。这里的关键不是不能用转基因食品进行临床试验,相反我们一直主张这样做,以便获得转基因食品是否安全的可靠证据。这里的问题包括除了研究人员要知道我国的相关法律法规、规章的规定外,我们应考虑到转基因食品涉及科学家和转基因食品公司可能有的利益冲突。2009年美国PI有关5位成人试验的论文[1]发表。此时有22位国际科学家对黄金大米的试验提出质疑,[2]WHO的维生素缺乏专家Francesco Branca建议人们多种胡萝卜和绿叶蔬菜。[3]对某一行动作出伦理判断必须弄清那些事实和掌握必要的知识,委员会缺乏这方面知识可请专家列席提供意见。③涉及国际合作。国际合作应是平等关系,应互相尊重各国法律,不应在他国进行试验而其成果无法推广,仅是为了收集数据,以平息他国内的争论。委员会要问:主办国是否尊重了我国的法律法规,研究结果在中国能否推广使用?
黄金大米试验案例的教训之二是亟需加强对涉及人的研究和伦理审查委员会的监督管理:包括如何防范回避审查和监督,人员转移、试验地点转移;如何防范数据的捏造、篡改、窃取;如何防范隐瞒真情骗取受试者或受试者家长的同意;如何防范伦理审查委员会变成“橡皮图章”等。这也说明我们目前审查体系的一个缺点:几乎只做前瞻性的伦理审查,不做回顾性的伦理审查,一些研究人员千方百计通过伦理审查后就可肆意违反伦理规范进行研究,因为伦理委员会从不审查他们在研究方案通过审查后实际做得如何。
这些都是由这个案例产生的重要问题,需要我们研究解决。
我们工作中存在的一些问题或对一些问题的争论,部分原因是我们对伦理审查的研究伦理学基础缺乏足够的了解。我们的科学家和伦理委员会委员都很忙,缺乏充分的时间和机会对作为伦理审查基础的研究伦理学进行一番研讨,于是只好采取“急用先学”、“边干边学”的办法。当然这样做也是无奈之举,但对伦理学缺乏了解,甚至存在一些误解以致偏见却无法消除。
哲学的很大部分是探讨“知”(认识)的规范和“行”的规范,探讨行动规范的是伦理学,研究伦理学探讨研究领域人类行动的规范。我们称之为“研究伦理学”而不是“研究道德”就是因为被称为“道德”的行动规范,往往根据权威或传统建立,而无需概念分析和批判论证。哲学及其组成部分伦理学作为理性的学科特点就是批判论证,而人们往往将伦理学与宗教或传统的信仰混为一谈,宗教信仰是不容许批判论证的,而传统信仰是不加批判地被接受的。伦理学是提供一个伦理框架来评价我们已经或准备采取的行动该不该做。而评价一个行动该不该做,就要看行动的可能后果(风险、受益)如何来评价(后果论),也要看行动是否与我们公认的义务(尊重、公正)相符合来评价(义务论)。我们在与科学家对话中,发现他们往往知道要考虑他们的行动(治疗、研究)是否能使患者从中受益,但对要尊重病人或受试者的选择或者公平地对待他们缺乏足够的意识。在长期的研究实践中,尤其是从一些案例中,人们总结出了研究伦理学的三条基本原则,即有益原则——“有益”原则不是“行善”,有益于病人是义务,而行善不是我们的义务,是一种超越义务之上的行动,要求我们的研究方案有可接受的风险-受益比,风险最小化和受益最大化;尊重原则,要求尊重受试者的自主性,实施知情同意,保护隐私,对相关信息要保密;公正原则,要求公平选择受试者,以及对受试者的受益与负担要公平分配。这些基本原则既是我们的义务,也是评价我们在研究领域采取的行动、研究方案的伦理框架(应该做,不应该做,还是允许做)的标准。许多现有的国内国际的规章、准则实际上都是这些基本原则与具体实践结合的产物。
那么如何应用这些研究伦理的基本原则以及那些规章、准则应用于伦理审查,来对研究方案作出是否符合伦理的判断呢?有些人以为这是一个演绎问题。演绎在我们的伦理推理中起重要作用,一些比较简单的案例也许可以应用演绎法,但许多情况下演绎是不够的。在大家熟悉的北京一个临床案例中,医生仅根据从相关条例要求征得家属同意,推理出可以不给危重病人进行手术的结论。这就是演绎失败的一个案例。在可能更多的情况下,伦理推理是一个价值权衡的过程,伦理判断是对相关价值进行妥善权衡的结果。在北京的案例中,医生面临一个伦理困境(ethical dilemma):如果给病人进行手术,违反家属同意的规定;如果接受家属意见,病人就有丧命的危险。在这种两难情况下,我们应遵循“两害相权取其轻”的准则办事,这也是有益原则中受益最大化和风险或伤害最小化的要求。在这个案例中病人的生命健康必须置于家庭同意要求之上。研究实践中的著名例子是短程AZT试验。长程的AZT已被证明对阻断艾滋病病毒母婴传播有效,但十分昂贵,非洲人民负担不起,因而一些资助者和科学家拟在非洲进行短程的AZT试验,以安慰剂为对照。这一试验受到一些人的批评,认为这是一种“双重标准”,因为如果在西方进行新的艾滋病药物试验,就必须按照《赫尔辛基宣言》,以目前已被证明为最佳的药物进行对照。可是如果按目前最佳疗法的长程AZT对照,那么试验本身失去了意义,因为长程AZT与短程AZT不处于均势地位。这种批判就是按照《赫尔辛基宣言》演绎的结果。而在国际医学组织委员会(CIOMS)的《国际准则》中明确指出,为了为资源贫困国家研制可负担得起的药物,是可以使用安慰剂作为对照。在这里我们需要权衡的是:让贫困国家的人民获得安全、有效、可负担得起的阻断母婴传播药物是否应该作为首要价值来考虑。[4]
在我们进行伦理审查过程中,实际上是在提出、鉴定和解决一系列的伦理问题。伦理问题是我们伦理探究的逻辑起点。按照研究伦理的基本原则以及国际伦理准则,一个应该批准的合乎伦理的研究方案的基准是:是否有社会价值?科学设计是否合乎科学和伦理?受益/风险比是否可接受?知情同意是否有效?有无能力进行伦理审查?保密措施是否合适?利益冲突是否存在或如何避免?是否坚持研究诚信和有无不端行为?这些基准实际包含着对一系列伦理问题的解决。尤其是在评价受益/风险比是否可接受的过程中,我们要考虑对受试者的风险和受益如何,对其他病人的受益如何,以及对社会可能有的风险或受益如何。仅就对受试者的风险评估而言,我们要考虑风险的种类(如身体风险、精神风险、与信息相关的风险)、风险的性质(引起不可逆的伤害、残疾,甚至死亡)、风险的程度(最小程度风险、高于最小程度风险),如果对受试者的风险程度较高,我们要看试验的社会价值是否很高,足以为受试者可能经受较高程度的风险辩护。这是一个典型的价值权衡的过程,唯有经过细致的价值权衡才能作出风险/受益比是否可接受的结论。但保护受试者始终是我们的根本任务。
研究伦理学专家、美国爱因斯坦医学院的Ruth Macklin在全球研究伦理会议上报告[5]中指出,为确保有效保护受试者和促进负责任研究,必须在一个国家建立研究伦理的基本框架,包括有一个或一组由立法机关或政府颁布的规范(法律、条例、规章或准则),有一个功能良好的伦理审查组织(伦理审查委员会)体系,有一个有效的能力建设机制(对研究人员和伦理审查委员会委员进行系统培训,研究伦理专业人员的培训)以及有一个有效的质量控制、考评、监督或督察制度。就我国情况而言,只能说我们正在建设之中,但一些情况不是那么令人满意。以能力建设而言,从主管部门到地方和机构伦理委员会都缺乏规划和长远打算,也缺乏对能力建设意义的正确了解及其重要性的认识。能力建设是两部分,一部分是对科研人员、伦理委员会委员进行的研究伦理基本知识系统培训以及随后的继续教育,这种培养在内容上是应该系统的,在方式上要强调教学互动,多讨论,多进行案例分析,多做实习功课,而不是如目前一些机构所做的,每当启动重要的研究项目,请一、两个人作一个报告,这绝不是严格意义上的培训和教育,达不到能力建设的目的。另一部分是对研究伦理专业人员的培训,要求他们取得生命伦理学或研究伦理学的硕士或博士学位,毕业后担任伦理委员会秘书或副主任职务。我们目前有一些活跃于伦理审查工作的人士,往往缺乏研究伦理的专业培训,因此缺乏研究伦理学的学科根基,应付一些简单问题尚属可以,但对较深层次问题,往往缺乏洞见,甚至发表了一些不妥当的意见,造成不良的结果。
机构伦理审查委员会是根据国家的法律、法规或规章建立起来的,由多学科专业人员和社群代表组成的、按照国家颁发的有关伦理审查法律、法规或规章对本单位研究方案进行审批、检查、监督,由集体作出决定的组织。因此它具有合法性、多学科性、集体性,同时也是得到授权的。
研究伦理学的基本价值是促进负责任(保护受试者、坚持研究诚信)的研究,确保科研顺利、健康发展,以及保护受试者的权益。因此,伦理审查委员会与PI有共同的目标和价值:健康地发展科学研究和保护受试者。为了共同的目标他们互相帮助,审查是一个共同学习的过程。他们不是对手,更不是敌人,不能形成一方找毛病,另一方设法辩解那种对立关系。从审查的实际情况看,少数研究方案被伦理委员会否决,多数在委员会帮助下完善,得到批准,这也说明两者之间关系的性质。
在我国的《药物临床试验质量管理规范》和《涉及人的生物医学研究伦理审查办法》中都明确要求机构伦理委员会进行独立的审查。一些人认为机构伦理委员会不可能独立,因为是机构成立或任命的。在某大医院的机构伦理委员会的同意书上明确地写着:“本机构伦理委员会是相对独立的。”这是不是意味着伦理委员会无法脱离本单位,还是说伦理委员会的决定可以随医院领导的意志为转移呢?机构负责人干预机构伦理委员会的审查这种情况是存在的。但也有不少单位的院长或书记即使任主任,也并未干扰机构伦理委员会的独立审查。
在这里,笔者谈论的是伦理委员会在审查研究方案时独立地、不受任何第三方干扰地按照法律、规章、伦理准则做出批准、不批准或修改的判断,即是伦理或道德判断上的独立性,而不是指在行政关系上要独立于本单位,不能混淆这两者的关系。伦理委员会需要所在机构人员和经费上的支持,这并不意味着伦理委员会要根据领导意志行事。
有人认为解决独立性的办法是,伦理审查不由伦理审查委员会进行,由机构外伦理审查委员会进行。需要对伦理审查委员会与机构外伦理审查委员会进行比较。
同一单位的伦理审查委员会委员容易理解PI为什么选择研究这个项目,提出这个研究方案,审查过程中遇到问题也容易请院内院外的相关专家解决。伦理审查委员会能够帮助机构内提高伦理意识和加强人文考虑,将科学与人文的两个要素结合起来。事实上,不少伦理审查工作开展得好的机构确实能够在不同程度上做到科技与人文的结合。
机构外伦理审查委员会也许能够有助于避免研究单位行政的可能干预。但机构外伦理审查委员会也不能完全避免它自身行政管理机构的可能干预。机构外伦理审查容易加强机构内科技与人文分裂的传统。在商业化大潮下,机构外伦理审查委员会容易成为营利机构。目前在机构外也不存在那么多公正并且有伦理审查专业知识的专业人员。因此,企图依靠机构外伦理委员会来进行伦理审查,可能出现“南辕北辙”的结果。
伦理委员会的组成不仅要求科学内的多学科(与所研究问题相关的学科、药理学、统计学等)成员,而且要求科学医学以外的人文社会学科成员和受试者或老百姓代表。科学内各学科委员需要培训,科学外的委员也需要培训,这是许多单位忽视的。伦理学有许多分支学科,有些参加伦理委员会的伦理学代表并不懂研究伦理,如果他们参加伦理审查,那么也要经过研究伦理的培训。
各国的伦理审查委员会都是根据本国的法律法规规章进行审查的。我国必须根据国家食品药品监督管理局的《药物临床试验质量管理规范》(简称《规范》)或原卫生部的《涉及人的生物医学研究伦理审查办法(试行)》(简称《办法》)审查。《规范》和《办法》阙如的,则参照国际准则WMA《赫尔辛基宣言》和CIOMS/WHO的《国际伦理准则》,不必去参照其他更多国家的标准去审查(例如我国要求,当研究过程中受试者出现因参加研究而致的损伤时,研究人员和资助者应给予免费治疗甚或补偿、赔偿,但有些国家无此要求)。这也避免有些人觉得条框太多,无所适从。如发现《规范》和《办法》有缺点,或因出现新的挑战,可待下次修订时修改补充,或拟订细则或实施办法纠正。
有些伦理审查委员会说,他们只做伦理审查,不作科学审查,因为有专门委员会做科学审查。国际来华推销认证的机构负责人在北京培训会上说:“你们不要做科学审查,只做伦理审查。”凡是不科学的,也必定是不符合伦理的。即使有专门委员会做科学审查,也不应该阻止委员们就科研设计表示意见。尤其是在评价风险与受益比时,必然会涉及研究设计问题,如要不要那么多样本,要不要抽那么多血,要不要用安慰剂等。
随机临床试验不是可有可无的,它是检验一种新药是否比原有的更为安全、有效的金方法。所谓“干细胞治疗”的倡导者说:“只有病人才知道哪种疗法好。”不对。病人的感觉,甚至医生的感觉是主观陈述,本身不具可检验性和重复性。只有随机临床试验的结果,才能提供客观的证据,证明安全有效。像所谓“干细胞治疗”那样,未经临床试验就广泛应用于临床实践是不合伦理的,它有可能给病人造成身体、精神和经济上的伤害。单个病例报告不能说明疗法的安全有效,因为未能排除许多影响因素。2003年以前,世界上一些地方有不少用胎儿脑组织治疗帕金森病的案例报告。2003年,美国做了一个随机临床试验,试验组用胎儿脑组织,对照组用安慰剂,结果无统计学显著差异。当然,在特定情况下难以做到随机性,但对照试验是必须坚持的。
有人说安慰剂让病人受伤害,不能做,这种说法是不对的。在做干细胞临床试验时,PI和伦理委员会说,病人已经受苦了,不能让他们再在安慰剂组内受苦,因而改为“前后对照”。病人在3年前的身体状况以及所接触的环境因子与现在可能有很大差异,因此“前后对比”不能满足对照试验的基本要求,得出数据不能起证据作用。所谓“病人受苦”的理由被称为“丐辩”(question begging),即把本来待证明的命题当做前提。“干细胞治疗”是否比安慰剂好本来是要这次临床试验来证明的,他们却已经确定干细胞比安慰剂好,所以分配到试验组不受苦,分配到安慰剂要受苦。要做试验本来就是因为试验新药与现有最佳疗法(在没有疗法时是安慰剂)处于理论和临床均势状态,否则就没有必要做临床试验了。
未经随机临床试验的新疗法可以作为创新疗法或试验性治疗应用于无治疗办法的绝症病人(如果病人坚持要求),但这种疗法应有科学根据;应无严重风险;只能用于少数人;应有治疗计划;应加强监测;如有不良反应,应立即中止;如有苗头应立即转入临床试验。
在我国目前条件下,要注意受试者中有无职业受试者。职业受试者为了尽可能多参加试验,多获得补偿,往往虚报自己身体状况,甚至采取一些不正当措施,使自己看起来很正常。这就会损害受试者自身的健康和利益,也会损害其他受试者的利益,损害等待有效新药的其他病人的利益,浪费研究人员精力、时间和经费等,应格外注意。
一些机构的伦理审查委员会忙于制订SOP,有的机构制订了数百种SOP。SOP有助于将条例和准则中的伦理要求具体化,使之更具可操作性。伦理审查的基本目的是保护受试者和促进有益于社会的科学研究。伦理审查需要权衡利益攸关者的不同价值,其中受试者的利益最为重要。因而它不是一个按照固定的程序进行的机械过程。
伦理审查是一个来自不同学科的伦理委员会成员就研究方案是否符合伦理要求进行相互学习、沟通的动态切磋过程,在这个基础上伦理审查委员会经过深思熟虑作出道德判断。过多的SOP容易导致PI或委员会负担过重,甚至流于形式。
伦理审查委员会如何做出批准或不批准的决定?是进行公开讨论后尽可能取得一致意见还是采取秘密投票、少数服从多数的办法?如上述,伦理审查是一个相互学习、沟通的过程,伦理审查委员会成员以自身学科知识为基础,但又超越了自身局限,通过讨论改变自己原来的意见是常见的。这与选举领导人的情况不同。采取秘密投票、少数服从多数的办法关闭了相互交流、学习的大门,容易导致审查形式化、走过场。
伦理审查委员会应集中精力对风险比较大的,即超过最低程度风险较大的研究方案进行审查,这需要召开全体会议认真审查。而对仅具最低程度的风险的研究方案,则可采取简便审查、免审的办法。即“抓大放小”。如问卷调查、访谈、利用病历里已有材料等。但对认为风险小的免审项目要进行检查,看看受试者实际遭受的风险如何。然而,对任何试验或研究,都不能说“本试验无任何风险”,因为至少会有“信息风险”(如信息不慎泄漏造成的风险)。
伦理委员会对涉及人的研究或试验负有检查、监督责任。但是目前的伦理委员会都是强调前瞻性审查,而缺乏回顾性审查,即方案批准后PI是否切实按照规定的去做。因此,目前PI和伦理委员会的重点都是放在如何起草和审查研究方案,如何起草和审查知情同意书。但是在研究方案批准后,伦理委员会就不再过问研究活动了。这对保护受试者是不利的。
《办法》设计了一个二级的伦理委员会系统,一级是各研究机构、医院或中心的机构伦理审查委员会(简称伦理委员会),二级是省和直辖市的伦理委员会,对一级机构伦理审查委员会有监督、指导职责(设有专职人员的办公室),也可接受被伦理委员会否决的PI的上诉。
应该设立常规的基本制度,例如登记注册(或备案)、网站公布,年度总结和汇报;有计划地进行能力建设,包括研究伦理基本知识培训、继续教育和研究伦理专业人员的培养;进行考查和评价;进行监督和督察;制订奖惩办法;实行年会(或双年会)制度等。每年或每两年举行一次全国性的机构伦理委员会会议,探讨实践中提出的新问题、新挑战,交流在贯彻《规范》、《办法》,以及在组成、运作、能力建设、审查的内容和程序、SOP、考评、监督、督察、活动记录和文件保管方面的经验,是很有必要的。
很需要对我国的机构伦理委员会情况进行经验性的调查研究,可分配一部分资金招标由高等院校人文社会学科教研人员带领学生对机构伦理委员会进行问卷调查、访谈。鼓励人文社会学科研究生以机构伦理委员会相关问题作为其研究课题或学位论文选题。
一些医院迫切给他们的伦理审查委员会寻求认证,尤其是国外的认证。国外一些组织也先后来给其认证,如FERCAP,最近是美国的AAHRPP。前者论证了南京、上海等地的一些医院的伦理审查委员会,后者在中国认证了10家医院的伦理审查委员会。经过论证的北京一位医院院长非常自豪地说:我们是AAHRPP认证的唯一一家中国医院,我们终于得到了国际认证!
然而这些医院寻求认证的目的是什么:是为了提高伦理审查委员会伦理审查的质量,更好地保护受试者?还是有了这个认证可以更容易获得更多的研究资助?就为了提高伦理审查委员会伦理审查质量,更好地保护受试者而言,认证的作用是有限的。有一家医院经过认证后不久就发生了违规事件。提高审查质量的关键是:加强能力建设,加强对伦理审查委员会的考评和监管。
2003年国务院《认证认可条例》规定,任何外国认证认可机构未经国家认证认可委员会批准来华进行认证认可活动是非法的。FERCAP、AAHRPP来华进行认证活动没有经过国务院国家认证认可委员会批准,因此他们的认证是非法的、无效的(北京大学医学部的胡林英亲自询问过国务院认证认可委员会,该委员会负责人明确地说,国外机构未经该委员会批准,在我国进行认证认可活动是非法的)。
FERCAP(Forum for Ethical Review Committees in Asia and the Western Pacific,亚洲和西太平洋伦理审查委员会论坛),是 SIDCER(The Strategic Initiative for Developing Capacity in Ethical Review,发展伦理审查能力战略倡议)这个网络中的一个成员,SIDCER是由伦理审查委员会、医务人员、受邀的伙伴组织组成的一个民间网络,挂靠在 WHO热带病学研究所下面。AAHRPP(人类研究保护项目认证联合会,Association for the Accreditation of Human Research Protection Programs),是美国加州的一个私人的收费的认证机构。这就需要搞清两个问题。
问题一:FERCAP、AAHRPP如何证明它们有资格来中国对IRB进行认证?它们了解中国的法律、条例、规章吗?它们自身有资质吗?从AAHRPP的负责人在北京一次培训会上说“只做伦理审查,不作科学审查”来看,他们的资质值得怀疑。
问题二:它们的认证有资格称为国际论证吗?活动于西太的一个民间组织或美国加州的一个民间认证机构的认证如何成为国际认证?那我们一个机构去美国认证不也可以成为国际认证吗?
原卫生部医学伦理专家委员在上海一次会议上,在听取了一些单位经过FERCAP认证的医院汇报后,到会委员一致认为,伦理委员会的质量主要靠能力建设、考评、监管来保证,认证不能做到这一点。在伦理管理开展较好的国家,都没有要求认证(例如美国的FDA、NIH以及欧洲国家)。如果按如上所述开展认证,将花费极大的人力和社会成本。如果全国有好几百个机构伦理委员会,对它们的论证需要花费很大的人力、财力和物力。而且这样会转移我们伦理管理在其他方面更迫切需要的精力、时间和资源。这是一件事倍功半的事。认证还会给国外一些商业认证机构可乘之机,其在我国进行非法认证,并使国内一些人利用认证营利,干扰伦理委员会质量控制工作。
希望通过某个权威机构来对本机构的伦理委员会进行一番检查、考查,以认可其活动,这种要求有合理之处。因此,笔者建议,由有权威性的多学科专家成立相应机构对机构伦理委员会进行考评活动。
[1] Tang,Guangwen;Qin,Jian;Dolnikowski,Gregory G.;et al.Golden Rice is an effective source of vitamin A[J].American Journal of Clinical Nutrition,2009,89(6):1776 -1783.
[2] Scientists protest unethical clinical trials of GM Golden Rice,Institute of Science in Society[EB/OL].http://www.i- sis.org.uk/SPUCTGM.php,2009-02-16.
[3] Enserink Martin.Tough lessons from Golden Rice[J].Science ,2008,320(5875):468 -471.
[4] Cash,R et al.Casebook on Ethical Issues in International Research[Z].WHO,2009:63.
[5] Fostering research ethics infrastructure in the developing world and transition societies,Report of the Global Forum on Bioethics in Research,Eighth Annual Meeting[EB/OL].http://www.gfbronline.com/PDFs/GFBR8Report.pdf,Vilnius,2007:7 -8.