陈泓邑,庞 聪
(1 复旦大学人类表型组研究院,上海 201203,chhy@fudan.edu.cn;2 复旦大学哲学学院,上海 200433;3 复旦大学生命医学伦理研究中心,上海 200433)
生物样本数据库旨在长期保存研究参与者提供的样本,以及样本中可能提取的数据,用于未来目的不确定的研究,当下各类生物医学研究(人群基因组、表型组、精准医学)都离不开生物样本数据库。“长期”可能是永久性的,例如“永生不死”的细胞系和永远在云端的数据。随着生物技术的发展,可能开展的研究类型以及从数据中挖掘出的新信息,会超出今人的想象,并不能够在首次征求知情同意时被预见到。而传统知情同意原则要求限定样本数据的使用目的、方法和储存时间。于是,传统知情同意原则在生物样本数据库的实践中遭遇了挑战。挑战至少包括如下两个方面:①未来研究目的无法在征求同意时被预想到;②随着生物技术变得越来越复杂,研究人员与参与者之间的“知识鸿沟”导致参与者难以理解所披露的信息。为了处理上述问题,可以采用多种不同的同意模式,来征求样本提供者或数据主体的同意。主要模式包括动态同意(dynamic consent)[1]、宽泛同意(broad consent)[2-3]、元同意(meta consent)[4]、分层次同意(tiered consent)[5]和选择退出(opt-out)[3],并在同意过程中使用简单易懂的语言披露信息。文章将在介绍各类同意模式后,论证得到可靠治理体系支撑的宽泛同意模式,也即“同意治理”模式,能够更好地处理“理解难题”。
动态同意(dynamic consent)通过使用现代通信技术手段,例如建立一个网站,为每位参与者提供账户,在网站上向参与者持续不断地提供新近展开的研究信息,并征求同意,是传统知情同意的延续。
元同意(meta consent)是对动态同意的改进:在网站平台上,参与者可以依据不同的数据类型,选择不同的同意类型。例如参与者可以对更敏感的电子病历数据,选择要求总是征求同意,对样本中提取的各类不敏感的组学数据,选择不需要再征求同意。
宽泛同意(broad consent)向参与者提供如下两大类信息:样本数据可能的用途类型(例如,宽泛的“健康相关研究”)、样本和数据的治理安排。世界医学科学组织理事会(CIOMS)与世界卫生组织(WHO)在其共同发布的《涉及人的健康相关研究国际伦理指南》中提出,泛知情同意(broad informed consent)在伦理上可以被接受的条件在于合适治理(proper governance)[3]。2020年,上海市卫生健康委员会项目组也提出了类似主张,认为生物样本数据库的泛知情同意,只有在严格治理(strict governance)下才是伦理上可接受的[6]。如果在同意过程中披露治理安排,而不是传统知情同意所要求的具体的研究目的等信息,上述模式就也可以被称之为“同意治理”(consent for governance)[7]。治理安排的内容至少需要包括隐私保护方式、伦理监管措施、利益分配信息等。“宽泛同意”“泛知情同意”显然有共同指称,“合适治理”“严格治理”也有共同指称。文章接下来将把“合适治理”“严格治理”统归到“可靠治理”,把有治理支撑、并在同意过程中告知治理安排信息的宽泛同意统称“同意治理”。显然,“同意治理”并不等同于“可靠治理”,这是由于即使治理本身是可靠的,参与者也可能由于种种原因不同意,反之类似,即使参与者愿意同意,也不意味着治理就是可靠的。
分层次同意(tiered consent)指研究人员在采集数据与样本时,设想所有可能的研究类型,例如癌症相关研究、免疫相关研究……并在同意书中逐一告知,由参与者勾选是否同意某一类型的研究。但此类同意书一方面极为冗长,不便于参与者理解,另一方面依然无法覆盖到所有可能的研究,并且加剧了研究机构的管理负担。
选择退出(opt-out)是西方的一些福利国家,例如丹麦采取的模式。丹麦公民在医疗机构产生的数据和样本,除非个人明示不同意,并要求退出,否则将被默认可以被用于各种可能的研究。但该模式严格来说并不是一种同意模式。
对于生物样本数据库而言,何种同意模式更好?回答这一问题涉及一系列复杂的伦理、法律与政策问题,文章从生物医学研究伦理中“理解”切入考察上述问题。“理解”一直被认为是知情同意的要素之一,一般认为研究参与者需要“获得足够的相关信息,能够意识到他们行动的性质和结果”[8]时,即达到理解,其给出的同意才能够被认为是有效的。有些同意书会在页末让参与者自行报告是否理解了阅读的内容(主观理解),但自我报告不能排除主观偏差,更客观和尽可能排除主观偏差的方式是设置理解测试,根据同意书的内容设置题目,考察参与者是否能够完全答对,从而判断其是否达成理解(客观理解)。近期美国一项采用该方法的经验研究表明,该国有近三分之一的正常成年人,无法完全理解生物样本数据库研究团队提供的同意书内容[9]。在该调查中,每位研究参与者被要求阅读一份约1300字的同意书,并随后完成包含21个真/假问题的理解测试,在理解测试中答错的题目都可以重新回顾相关内容,并再次回答。但是,经过权重计算后,33.4%的人最终无法在测试中拿到满分。这一结果引起了巨大的反响。专家们对于参与者应该理解什么、不需要理解什么、是否应该继续招募没有达成理解的参与者以及“知情同意”应该被认为是一个“要求”(requirement)还是一个“理想”(aspiration)都产生了分歧。
对于生物样本数据库所采取的各类同意模式而言,该项研究结果意味着,如果不设置理解测试,在动态同意中,参与者可能每次都并没有理解披露的研究信息,就点选了同意,陷入了所谓的“同意疲劳”。元同意也面临着类似的挑战:无论其选择的是总是征求同意还是偶尔征求同意,在后续征求同意时,参与者可能都是在没有理解的情况下进行选择。如果一次又一次地对参与者进行理解测试,考察其是否理解了新近开展的研究的性质和目的,又会挫伤参与者的积极性。分层次同意冗长乏味,参与者需要一次性理解许多种可能的研究类型,长达四五十页的同意书令人望而生畏。而选择退出没有提供理解后同意这一选项,是一种彻底有别于以同意为基础的生物医学科研伦理的模式,目前文章还是将论域限定在以同意为基础的模式上。
同意治理模式的支持者提出,该模式可以在如下两个层面上缓解上述理解难题:①在经验层面上,关于具体科学研究的信息太过复杂,并且与研究参与者的生活缺乏关系,难以使研究参与者理解,且参与者也没有动机去理解所披露的具体科研信息。向其披露治理安排的信息能够更好地促进理解[10]。治理安排也更直接地与参与者的权益相关,理论上能使参与者更有动机去阅读理解同意书。相较于科学研究目的和方法的多变,治理模式是相对稳定的,参与者可以只签署一次同意书,并只进行一次严格的理解测试,这可以同时降低参与者与研究人员的负担——只要我们将有效同意的内涵拓展为包括理解治理安排。②在规范层面上,由于知情同意本身并不足以使一项研究成为伦理的,因而建立可靠的治理可以在参与者实际上没有理解,却依然愿意同意的情况下,保障所有参与者的权益。同时,建立可靠的治理也可以处理传统知情同意没有覆盖到的因素。
例如,当下的生物样本库可以利用多能干细胞培育类器官——一种功能上与人体器官接近的,但是在体外培养的组织,包括类脑。这一研究在传统的知情同意模式下,只需要样本是匿名化的就可以展开。动态同意等基于同意的模式中,由于样本已经匿名化,无法再次联系参与者征求知情同意,使用匿名化的样本进行研究不属于“涉及人的生物医学研究”,研究也不会对参与者造成侵入性风险,使用匿名化的样本开展研究在许多国家的法律框架内被豁免接受伦理审查。但是,开展类器官研究,尤其是类脑研究有明显的伦理问题,包括类脑是否具有道德地位,如果它具有道德地位,是否还能够仅仅将之视为一种科学研究的对象?样本提供者是否愿意他们的样本被用于此种研究(即使是样本是匿名化的)?以“匿名化”保护隐私,从而免去知情同意与伦理审查的策略,虽然确实保护了参与者的隐私,但却忽略了研究本身所蕴含的更复杂的伦理相关问题。同意治理的支持者提出,通过建立可靠治理,包括与样本提供者、公众、科研人员持续不断的接触、公开科研信息、就敏感研究进行充分的公共讨论,并在同意书中规定研究机构与研究人员有上述责任,可以避免此类敏感研究仅仅由于其匿名性、没有对样本提供者造成侵入性风险,就被认为没有伦理问题,可以不受限制地开展[11]。使用上述治理安排的英国生物样本数据库(U. K. Biobank)被认为可以提升公共理解,促进公众对科学的信任[12]。
有鉴于种种伦理上的好处,同意治理陆续被英国、美国、德国等西方国家接受,成为基于已保存的样本与数据开展生物医学研究的时代,被西方主流国家认可的同意模式,以丹麦为代表的福利国家甚至只有治理而无需同意。不过,一份德国的国家级经验研究还是表明,虽然该国参与生物样本数据库研究的代表人群中,有86%的人愿意接受同意治理(该文称为“宽泛同意”),但他们对同意书中披露的治理安排信息的理解程度仍然较低。在同意书的语言经过调整变得更清晰后,有90%以上的人愿意同意,理解程度也有所提升,但依然不能达到完全理解[13]。德国的经验调查的结果表明,即使是对于这样一个高收入、国民受教育程度较高的国家而言,生物样本数据库的潜在参与者接受同意治理的意愿虽然十分高,但其对同意书的理解程度却仍然较低。对于采用同意治理模式的生物样本数据库而言,如果要保证所招募的参与者都真正理解同意书,就需要通过理解测试进行参与者筛选,比如90%的人愿意同意,但其中只有54%的人达成理解,那么就需要排除未达成理解的人,只招募达成理解的人。从伦理上讲,使用同意治理模式的生物样本数据库有必要这样做吗?
文章接下来将在规范层面论证“不必要”。理由如下:①生物样本数据库治理安排的可靠与否,不依赖于个人是否理解它,即使个人在初次同意时没有完全理解,治理安排本身也可以在公共监督下良好运转,保障参与者权益。②假设治理安排是可靠的,研究参与者在没有完全理解的情况下,如果选择同意,这一决定就不能被认为是鲁莽(imprudent)决定。③传统的生物医学研究在招募受试者时,测试受试者理解程度的主要目的,是降低受试者非自愿地接受高风险的概率。但是,生物样本数据库研究不涉及侵入式风险,且涉及人群庞大,降低招募到没有完全理解的参与者的概率要求,需要与排除这些参与者所需的成本相平衡。
在日常生活与科学研究中,普通人或科研人员经常要利用到其不理解的事物。普通人使用抗体试纸自测是否感染某种病毒时,并不理解也不需要理解试纸的工作原理。试纸可以有一定的假阴率或假阳率,但只要试纸能够系统性、可预测地产生正确的检测结果,它就依然是可靠的。大部分临床医生并不理解,也不需要理解功能性核磁共振成像仪器的内部运作机制,而只需要学会按照操作说明使用这些仪器,使用其产生影像结果并对结果进行解读。在上述例子中,无论是普通人,还是临床医生,都默认他们所依靠的事物是可靠的。从哲学上讲,“可靠”是一个认识论概念,当A可以依靠B达到C,即使B有一定的可错率(例如之前所提到的假阴、假阳率),只要B能够系统性、可预测地帮助A成功达到C,那么我们就可以称B是可靠的,即使A不理解B的运作机制,A也可以依靠B达到C。伦理上讲,可靠是配享信任(trustworthy)的必要条件,尽管不一定是充分条件[14]。一位医生如果不能系统性地给出正确诊断,也是不可靠的,那么他显然就不值得信任。同样地,某一位患者是否认为医生可靠或不可靠,与该医生本身是否可靠无关。
上述对“可靠”的简单刻画同样适用于讨论生物样本数据库的治理安排。从伦理上讲,生物样本数据库的治理安排的目的在于,使基于样本和数据进行的研究尽可能都是合乎伦理的。哪些因素使得治理安排能够系统性地成功实现上述目标?这些因素至少包括:透明的信息政策、严格的伦理审查和监管[2]、充分的公共参与[15]、严密的隐私保护、保障退出权……透明的信息政策可以包括,每一种基于样本或数据开展的研究的信息,都在网站上充分公开,并公开负责审查该研究的伦理委员会信息,以及批准该研究的理由、研究的风险预估、相应的隐私保护方案等。严格的伦理审查和监管,包括审查研究是否给研究参与者带来不合理的风险,研究是否会带来剧烈的负面社会舆论等。充分的公共参与可以通过邀请参与者代表进入伦理委员会或决策咨询机构,使其能够参与到对是否开展某项研究的决策中,充分尊重其持有的价值。隐私保护方案可以包括对数据进行模糊化处理,使数据集在不损失的统计价值的情况下,不能够被用于识别到具体个人的真实身份。
上述因素以及其他可以补充的因素,使得生物样本数据库的治理安排,能够系统性地避免有人基于其样本或数据开展不合伦理的研究,使得其治理安排成为可靠的。与依靠可靠的试纸与功能性核磁共振成像仪产生正确的结果,而不需要理解其原理相似,如果治理安排是可靠的,那么参与者也可以在即使没有完全理解它的情况下依靠它。只是在尊重参与者自主性的意义上,需要将治理安排在一份同意书中告知,参与者自主选择是否同意。如果参与者不愿意,或者他认为治理安排不可靠,他可以不同意,即使同意了,也可以在任何时候自愿退出——保障参与者的随时退出权正是可靠的治理的要求之一。
如果之前的讨论是合理的,那么没有完全理解,但接受并依靠一种治理安排,至少是可供讨论的选项。但是,上述讨论还是没有直接回应如下担忧:个人在没有理解的情况下做出的同意并非有效同意。
当我们担忧一个人并没有充分理解同意书的内容,从而没有充分理解他即将做出的决定时,给出了并非有效的同意时,我们究竟在担忧什么?从常识来看,在没有达成完全理解的情况下给出的决定会被认为是鲁莽决定(imprudent decision),从哲学上来看,这意味着作出该决定并没有真正体现一个人的自主性,也就是说,这不是他的自主决策。当鲁莽决定可能对决策者本人造成伤害时,他人出手干预就是一种可以得到辩护的行为。例如当一个人不知道一座桥即将坍塌而准备过桥时,知道此事的人为了保护他而阻止他过桥,避免他受到自己的鲁莽决定的伤害,这样做其实可以保护他的自由。
将语境从日常转移到生物医学研究,就产生了如下要求:在开展高风险的临床研究前,必须验证受试者是否真的理解同意书中的内容,而不仅仅是向受试者披露这些内容,否则可能会招募到并非真正自主的受试者。这一错误类似统计学中的“一类错误”,或临床上的假阳性结果,而如果真正自主的受试者由于过于严苛的遴选条件而被排除,则类似于统计学中的“二类错误”或临床上的假阴性结果。我们会在下一节仔细讨论生物样本数据库参与者招募中的一类与二类错误。目前只需要知道,遴选条件越严苛,一类错误发生的可能性就越低,但同时也就越可能造成二类错误,实践中需要达到二者的平衡。
鲁莽决定导致的“一类错误”,在高风险的侵入性临床研究中,可能会给受试者本人带来其本人不愿意承担的后果,这种后果往往会十分严重,包括破坏受试者的身体完整性,并导致科研人员与科研机构陷入法律纠纷之中。一个典型例子是2018年的基因编辑婴儿事件。在该事件中,研究者为一项旨在使其后代能够终身免疫HIV的研究,招募男方感染HIV而女方身体健康的夫妇。研究方法是利用CRISPR/Cas 9技术,对所招募夫妇的受精卵进行生殖系基因编辑,敲除细胞中可能会导致免疫系统识别HIV的基因,然后,通过辅助生殖技术使夫妇诞下终身免疫HIV的后代。据报道,研究者在招募受试者的过程中,受试者“不可能理解”其所被告知与披露的内容[16]。另外,由于该研究问题本身是无科学意义的(至少其研究结果无法得到验证,因为不能将接受基因编辑的婴儿暴露于HIV中进行验证),因而如果受试者能够理解的话,他们很可能拒绝同意。这起事件说明,在涉及高风险的临床研究的知情同意过程中,至少需要注意以下两个因素:①在真正与受试者接触之前,需要专家判断研究目的、方法与知情同意书是否是有效的。②需要以客观标准验证受试者是否真的理解被告知的内容。在条件①已经达成的情况下,设置条件②可以防止受试者因缺乏足够的临床知识而做出的伤害自己的鲁莽决定。这意味着,就传统临床研究而言,在知情同意中设定“理解”条件,干预受试者的决定这一具有家长主义作风的行为有充分理由:避免受试者因鲁莽决定而受伤害[17]。
但是,生物样本数据库的研究与上述高风险的、侵入性的研究不同。生物样本数据库研究基于已经采集和保存的数据进行,理论上讲不会对样本提供者或数据主体的身体造成任何伤害与风险。排除了侵入性风险,生物样本数据库研究涉及的风险就急剧降低,一般来说只包括隐私风险等信息风险。我们以隐私保护作为切入点,说明即使参与者没有完全理解同意治理中生物样本数据库提供的隐私保护方案,其同意也不一定是鲁莽的。
目前的保护隐私的方式是“要么匿名,要么征求同意”,在匿名化无法实现的情况下,通过征求同意来实现对使用个人数据的豁免。生物样本数据库中存储的数据,例如基因组数据,在许多国家被认定为个人数据。使用这些数据开展“全基因组关联研究”(GWAS),研究方法要是有效的,样本量至少需要5万份,是名副其实的“大数据研究”。如果使用不断征求同意的方式,即采用动态同意方式,作为使用基因组数据开展研究的豁免,一方面会使研究无法顺利展开,另一方面也会面临文章一开始提到的参与者同意疲劳、没有理解问题。
为了解决上述问题,同意治理模式可以在同意书中披露如下隐私保护安排信息:①匿名化等技术性手段将被尽可能使用;②所有研究人员已签署协议不会试图重新识别您的身份;③每一次数据被访问和处理都会有记录,这些记录是公共可访问并受监督的;④一旦发现数据滥用,滥用数据者将被依法严惩。上述治理安排也可以有效地防止隐私泄露,并在同意书中明确,保护隐私的责任在于作为数据保管者的生物样本数据库。相反,通过不断征求同意作为隐私豁免的方案,无非是让参与者自行承担自己选择的后果,这并不是一种负责任的行为。
同时,由于大数据环境下不可避免的隐私风险,主张同意治理的学者们还提出应当注意事后补偿。可以通过建立一种类似医保的基于“团结”的数据治理模式,实现风险共担。在该模式下,所有人都参与到保障体系中来。并不是每一位参与者都一定会面临实际隐私伤害,但当一个人面临实际伤害时,整个体系就以风险共担的模式,从所有参与者提供的资金池中,提取资金对其进行保障与补偿。“团结”模式的支持者提倡在生物样本数据库治理中采取此种风险共担模式[18]。无论是基于“团结”的风险共担模式,还是要求监管机构担负起保护隐私责任的模式,都不是将评估隐私保护方案,并决定是否自愿承担风险的责任交给参与者,而是要构建以保护参与者权益为中心的一系列治理安排,使参与者即使在没有完全理解它的情况下依然能依靠它。一旦上述治理安排被建立,参与者即使没有完全理解而做出的参与决定,不会对其自由与自主造成损害,从而不能被认为是鲁莽决定。
从伦理上讲,每一位想参与研究的人,都能在完全理解同意书后自主同意,是最理想的情况。在实际操作中,为接近理想情况,需要尽可能排除如下两类错误:①不当招募没有完全理解的参与者入组(一类错误);②不当排除真正能够理解的参与者出组(二类错误)。在操作中如果要降低一类错误,其中一个方式就是测试潜在研究参与者的理解程度,尽可能排除那些并没有完全理解同意书中披露内容的潜在参与者。既然经验研究表明大概有三分之一的人不能完全理解同意书披露的内容,那么一项十万人的计划如果意图降低一类错误,就需要首先招募十五万人进行测试,排除大概五万人,留下的人绝大多数就是完全自主同意的。对于科研人员和科研资助者而言,这会为开展科学研究增加额外的成本。鉴于参与者招募的困难程度等因素,同意治理模式只需要在初次同意时,通过理解测试验证并排除未完全理解的参与者,其成本已经十分巨大,在动态同意或元同意中,由于要不断测试参与者是否理解了后续披露的科研进展的一系列内容,排除没有理解的参与者的成本就更大。是否有必要为了达到伦理目标而要求科研人员与科研资助者付出额外成本,需要仔细论证。在传统涉及高风险的侵入性的临床研究中,付出这样的成本是完全有必要的。高风险侵入性研究,或者对生殖有重大影响的研究,其风险一旦发生,如果事后被证明受试者不是在完全理解的情况下参与研究的,将会损害公众对科研机构以及研究资助者的信任。上一节中提到的基因编辑婴儿事件造成的社会谴责就是此类事件的典型。
但是,生物样本数据库研究与传统临床研究有显著区别。一方面,生物样本数据库研究基于已有样本或数据,不会对参与者产生侵入性的风险;另一方面,生物样本数据库研究往往涉及大量人群,动辄以十万人起步。这使得如果在此类研究中严格筛选具有足够理解能力的参与者、并排除不合格者的成本急剧上升,而在传统的只招募四十到五十人的临床研究中,排除受试者的成本是相当低的。传统的侵入性临床研究风险高,而排除不完全理解的受试者的成本低,生物样本数据库研究(尤其是人群研究)风险低,而排除不完全理解的参与者的成本高。这里面的不对称性必须得到考虑。如果一种伦理监管手段以为了排除较小的风险,而为科学研究增加了过重的负担,那么这样一种监管手段的合理性就会受到质疑。由于这些实用和利益层面的考量是在真实世界中做生物研究伦理工作必须考虑的因素,因而,要求所有参与者在初次参与研究时理解治理体系是没有必要的。
一类错误和二类错误是一个矛盾,在实践中同时排除二者的唯一方式是不开展任何研究。在开展研究的情况下,研究参与者筛选手段越严格,越容易排除一类错误,但越可能导致二类错误,相反,研究参与者筛选手段越宽松,在降低二类错误的同时,就越可能导致一类错误。在平衡二者之间的关系时,除了需要考虑不同研究的风险问题,还需要考虑如下因素。生物样本数据库研究相较于传统临床研究的另一个特点,是其持续时间比传统临床研究要长,甚至可能长到参与者死亡后还在开展。如此长的研究时间还会在如下层面上挑战基于传统临床研究的知情同意模式:随着技术的进步与个人认知的变化,个人如果要达到对不同研究目的的理解,需要在后续数年内不断地跟进。治理模式相较于科学的变化而言更为稳定,但治理模式也不是一成不变的,它可能在运作过程中出现问题,从而不断在公共监督之中改变自身。这意味着在科学与治理模式的动态的变化过程中,个人需要不断跟进才能不断理解。达到上述的动态的理解需要时间,即使在初次同意时进行理解测试达到了完全理解,也不能保证多年以后依然理解。
上述考虑体现出设置“理解测试”的一个根本性困难,即其认为“理解”是一种发生在当下的,而不是缓缓达成的状态。生物样本数据库跨越超长时间(相较于传统临床研究)的性质,使得研究参与者要真正理解,需要在后续中参与到治理安排所要求的公共讨论与接触中来,这降低了在初始同意时开展“理解测试”确认研究参与者是否理解的价值。有些参与者可能在一开始并不完全理解,但随后能够跟进理解,在过程中成为真正自愿参与研究的参与者,这使得在一开始开展“理解测试”可能会排除这部分真正自主的研究参与者,从而导致二类错误。如果上述讨论是合理的,那么从平衡一类错误与二类错误的角度出发考虑,也没有必要要求所有研究参与者在初次同意时,都完全理解“同意治理”中披露的关于治理体系方面的内容。
生物样本数据库以及生物医学大数据覆盖的人群广阔,在向大量人群征求同意时,不同的同意模式都会面临参与者理解程度低的问题,披露治理内容的同意治理被认为最有可能缓解理解难题,但即使可靠的治理已经被建立起来,只要签署同意书这样一种形式依然存在,就不可避免的会有人最终不能理解同意书中披露的内容。文章论证,由于以下三条理由,使用同意治理模式的生物样本数据库,没有必要强制要求每一位有意愿参与的参与者,在初次同意的过程中理解其治理安排:①治理模式的可靠性本身独立于个人的理解,个人可以在没有理解的情况下依靠可靠的治理模式;②个人在没有理解的情况下选择依靠可靠的模式的决定,并不是鲁莽决定;③从实用的层面考量,必须考虑运用严格筛选手段排除一类错误会给科研人员与资助机构添加的负担,以及可能的二类错误的上升。