健康医疗数据的科研共享应用思考*

2022-02-20 03:13祝丹娜谢杨晓虹
医学与哲学 2022年1期
关键词:伦理医疗研究

吉 萍 祝丹娜 谢杨晓虹 肖 平

1 健康医疗数据应用的规范

随着信息技术在医疗健康领域的快速应用,政府相关部门发布了一系列政策及管理规范,建立各种健康信息平台推进健康服务信息化、智慧化,促进健康信息的互联互通和共享利用。同时,这些平台已在日益增多的人工智能研发、真实世界研究、流行病学模型构建、人群风险评估、不良反应监测及评价等各种研究中显示出巨大优势。健康医疗数据共享能提升医学科研效率和质量已成为共识,这在促进发挥数据价值方面有重要伦理意义。健康医疗数据已作为国家战略资源备受重视,国家层面提出一系列健康医疗大数据发展规划,“要加强健康医疗大数据应用体系建设,推进基于区域人口健康信息平台的健康医疗大数据共享开放、深度挖掘和广泛应用”[1-3]。数据作为一种新型的、独立的保护对象,已经获得立法上的认可。基于科研目的进行健康医疗数据共享,必须要强调“合规性”,应以遵循科研伦理与数据治理相关法律法规为前提。国内数据处理活动的规定见于《民法典》《个人信息保护法》《数据安全法》《生物安全法》《人类遗传资源管理条例》等[4]。《信息安全技术—健康医疗数据安全指南》规定了健康医疗数据控制者在产生、使用各环节保护健康医疗数据时可采取的安全措施,并根据数据重要程度、风险级别等进行数据分级分类,数据开放形式划分为完全公开共享、受控公开共享、领地公开共享[5]。国际医学科学组织理事会发布的《涉及人的健康相关研究国际伦理准则(2016版)》指出:“涉及使用临床诊疗中获取的数据的研究,应建立全程预测、控制、监察和审查数据使用管制机制和制度,包括获取数据用于将来研究的情况、研究受益分配、数据采集、保藏、利用全过程的伦理监管、数据相关控制方和使用方的资质要求、数据质量控制措施、涉及可识别个人身份信息的保密操作与风险控制措施等等。”[6]

全球各地陆续出台了涉及数据的多项法律与规范,对探索负责任的数据共享伦理最佳实践具有重要意义。英国于2018年发布的《数据伦理框架》(DataEthicsFramework)对设计、数据收集、存储、分析和共享等全过程可能涉及的伦理问题提出规范要求,确保负责任地使用数据[7]。英国全民健康服务体系设置了专门的数据访问请求服务,明确列出了研究者在申请数据前应当考虑的问题,包括申请前的资格标准、安全保证、数据项和数据流程图、合法性、明确的使用目的、商业用途与资金证明等[8]。澳大利亚政府发布了《数据共享原则的最佳实践指南》(BestPracticeGuidetoApplyingDataSharingPrinciples),包括五个维度的评价原则:(1)项目:是否具有合理目的,是否从公共利益出发;(2)人员:是否设置合理的访问数据人员权限;(3)设施:是否使用尽量降低未经授权使用或披露风险的设施;(4)数据:是否对数据采取适当的保护措施;(5)发布:数据的提供是否恰当,并对用于研究目的的风险进行评估[9]。

面对密集出台的数据处理活动相关法规,国内外相关学者、机构也在数据及健康医疗数据作为科研数据资源整合与共享方面进行了积极探索与论述[10-18]。数据共享是指公开或在特定访问条件下,向其他个人或实体(机构或组织)提供原始数据和/或衍生的个人数据,包括数据用户之间的数据传输或数据交换[10]。本文所称健康医疗数据,是指在疾病防治、健康管理、医学相关研究等过程中产生的与健康相关的数据,包括个人健康数据与非个人健康数据。科研共享的数据活动,是指为实现特定研究开展的一个或多个数据处理行为。伦理审核是数据共享应用的管理内容之一,遵循个人和社会受益最大化、风险最小化的基本原则。虽然数据共享会引发诸多伦理问题,带来负面影响,但不能过分强调对个人权利的保护,导致监管的僵化,进而严重削弱利用数据的社会价值[12]。2020年,北京大学健康医疗大数据国家研究院发布《关于健康医疗大数据优良实践的伦理共识(第一版)》,旨在为相关方行为规范提供参考,包括个人健康医疗数据处理原则、数据主体权利、数据控制者和处理者的权利和义务等[13]。在健康相关数据挖掘中,数据带来的受益与风险共存。与数据有关的风险往往有两种类别:一类是数据隐私泄露,另一类是基于一位用户的数据做出不适当的决策。有学者提出了“隐私定义的两面性”,包含管理规范性和技术实现性。规范性定义突出不能泄露隐私信息、不能识别到个人的原则性目标和要求,技术上提出实现隐私保护的不可识别的保障标准[14]。

随着应用云计算、大数据、人工智能、区块链、物联网、5G等先进技术的科研机构与信息企业涌现,提供了具有支撑健康医疗数据从算法设计到开发利用的先进技术。我国各地纷纷加快推进医疗卫生信息化和现代化,已初步建成较为统一高效的信息基础设施支撑和资源共享体系,并出台相关的区域数据管理与共享开放的地方性法规与政策。本文通过梳理、调研健康医疗数据共享中责权不清晰、数据安全、数据质量、伦理责任意识等问题及相关风险,探讨基于问题的应对策略,以期望与同道交流,共同促进健康医疗数据的科研共享。

2 健康医疗数据用于科研共享的挑战

深圳市卫生健康委员会为了促进健康医疗数据共享开放,推进“医研企政”协同创新,让健康医疗数据为产业发展、政府决策和科学研究服务,组织调研访谈,旨在基于各方需求,制定指导实践的《深圳市卫生健康数据管理办法》以及《深圳市卫生健康科研数据共享实施细则(试行)》等。本调研采用定性访谈,运用半结构式的小组访谈,分别邀请在深圳从事健康医疗数据相关的政府机构、医疗卫生机构、科研机构、卫生企业以及研究者代表,了解医疗数据用于科研共享的现状、面临的主要挑战与原因。

2.1 责权不清晰,缺乏具体操作机制与制度

在实践层面,阻碍数据流动与共享的最主要因素是相关方责权不清晰,特别是数据的所有权,缺乏数据共享审批及流通的可操作制度。有受访者表示:“患者的医疗数据形成健康档案,这个健康档案是个人的还是医院的,还是卫健委的?谁来决定它的使用权以及使用范围?不明确就不敢给。”也有医院受访者表示:“科研合作时,并不是我都要给的,我不想给的就可以不给吧?”科研院所受访代表提出:“能否把法律和伦理规范做成可操作性强的规范与操作流程?”虽然信息经过泛化、随机化、数据合成等技术进行去标识化处理后可以二次利用和共享,但去标识化到何种程度、数据清洗个人信息的准则以及数据标注的规范格式等尚无统一标准及监管。另外,有受访者表示:“由于数据的生产、管理、使用单位都存在自身利益,建议提供有偿服务并提供标准化的收费制度。”还有受访者表示:“项目合作时,如何进行利益分配?”各方的利益分配机制不明确也导致医院不愿向外提供数据,限制了数据的共享。

2.2 数据安全保护不足、质量欠佳

随着生物医学技术与信息技术的发展,已不断加深医学数据挖掘的深度与广度,个人信息保密性和安全性问题被日益关注。受访者表示,医院缺乏对信息安全资源的投入及安全设计,医疗数据安全的保护不足,在数据采集及处理方面都存在安全隐患、数据泄露、被攻击或者盗取、病毒入侵等风险,医院仍然是信息安全洼地。另外,医疗数据使用过程中缺少监管、难溯源,有医院受访者表示,不仅存在“数据给了不该给的人或给了不该给的数据”的情形,也面临“我们提供数据,但是不知道这些数据是怎么用的”的担忧。

此外,各部门、各机构、各业务系统收集数据标准不统一,导致各类信息系统林立,医院数据存放格式不统一。有受访者表示:“临床医生不可能按照国际疾病诊断编码(第10次修订)(International Classification of Diseases,10th revision,ICD10)去写诊断,不符合临床习惯。ICD目前又同时存在多个版本,导致数据采集的标准不统一,造成后续数据无法使用。”大部分数据为非结构化数据,很难用查询语句直接访问。科研单位不知道医院能提供哪些数据,造成反复沟通与申请。另外,按临床诊疗收集的数据,并不是为科研项目采集,数据缺失常见,也不一定是研究需要的可用数据,数据质量参差不齐。

2.3 数据应用的伦理合规性风险大

由于数据自身的特点,以及共享复杂性及其使用的特殊性,数据应用会引发诸多伦理问题。虽然对健康医疗数据处理活动的伦理问题越来越被关注,但从事健康医疗数据处理活动的人员及机构伦理责任意识不强,自然人的隐私保护与知情同意、研究的有效伦理审查、遵循人类遗传资源管理规定尚未能充分落实。我国法律是以“同意规则”作为数据处理行为的合法性基础,知情同意也是所有涉及人体的生物医学研究最基本和最重要的伦理要求之一。然而,临床诊疗并没有签署研究知情同意书。日常海量健康医疗数据作为整合的群体信息被使用时,个人不知情且“被动”加入数据库的情形屡见不鲜。而且,从事数据处理的企业以及科研院所受访者表示:“使用日常诊疗数据开展研究没有风险,不会给研究对象造成伤害,伦理审查和知情同意是多余的。”机构管理人员及研究团队的伦理意识及伦理监管措施也相对薄弱,失范隐患和风险大。

3 促进健康医疗数据用于科研共享的思考

3.1 以法治和规范引领,提供制度保障

针对数据权责与流通机制不清晰的问题,以法治和规范引领,制定具体的操作指引及工作流程,明确数据监管方、数据提供者、数据使用者的职责,确保基于科研目的进行的健康医疗数据共享遵循医学科研伦理与数据治理相关法律法规、技术准则、伦理规范等要求。相关利益方划分为三个角色类别承担相应职责:(1)政府行业主管部门作为数据监管方,贯彻落实国家健康医疗数据管理政策,对区域健康医疗数据的科研共享进行顶层设计、统筹规划、协调推进数据共享的重大事项,按照有关标准规范,组建数据管理委员会,建立健全健康医疗数据的科研共享管理制度与流程。(2)数据汇聚中心作为数据共享的提供者需要做到以下几点:①建立安全、可信、可控、可追溯的数据使用环境,采取有效措施确保数据采集、分析、存储和使用各环节的安全保密;②定期公布健康医疗数据目录并及时更新;③建立通用数据模型,将数据进行统一的清理、编码转换和储存,形成便于安全使用和可访问的数据库或数据集;④受理基于科研目的的科研数据共享使用申请,并评估数据可及性、成本、可能的风险;以协议方式明确数据的使用范围、处理方式,确保合法合规提供数据及技术支撑(包括数据查询、数据准备和数据分析等),保障数据使用服务和维护的可用性、准确性和实效性。(3)申请使用健康医疗数据的有关医疗机构、科研院所、高等院校以及研究者团队等作为数据使用者,应该建立健全本单位申请使用健康医疗数据的相关管理制度,受理基于科研目的的数据使用申请,评估研究合理性、合法性、科学性和潜在风险等,并严格进行科学审查和伦理审查等;对科研项目进行过程管理和结题管理。研究团队按数据治理规范流程提出使用申请,获得数据使用批准并完成相关数据使用培训,签署协议后方可合法合规使用数据。

3.2 建立以应用为出发点的数据平台,加强数据治理

针对数据安全保护不足、质量欠佳以及监管薄弱等问题,建立以应用为出发点的统一数据平台。通过积极推进数据共享基础设施建设,在数据收集、储存和使用方面,采取措施加强平台的安全管理,完善信息系统和信息防护措施,保证数据安全和隐私。采用先进的区块链、分布式存储等数据安全防护技术,从技术手段和管理模式上提高信息安全管理级别,确保数据收集与保存、数据处理与加工、数据共享与使用全流程跟踪和安全管理。同时,收集异源多维的数据,并对数据进行再设计与标准化,以结构化、标准化的形式存储和链接,提高数据质量。

最终目标是利用数据解决医学问题。因此,建立以应用为出发点的数据全生命周期管理,在不同阶段采用不同的管理原则与策略,对数据使用活动进行规范。包括:立项管理(立项申请、伦理审查、数据使用审批、培训与协议签署等)、过程管理(数据准备、数据访问、数据使用及分析、成果审核等)、结题管理。具体流程见图1。

图1 数据使用全流程图

3.3 提高数据伦理责任意识,开展伦理研究

在现代,健康医疗数据呈指数级增长态势,数据共享本身有着重要的伦理价值和社会意义。数据伦理学的基本伦理问题研究在促进数据科技发展和应用的同时,又要确保对数据后面的人的尊严与人权的尊重[17]。因此,平衡实现数据社会价值与尊重个人权益是数据伦理的核心。

首先,需要提高相关方对健康医疗数据使用可能涉及的伦理责任问题的敏感性,加强培训与教育,减少并有效控制风险。研究团队开展数据活动,需要符合合法、正当、必要、安全的要求,建立数据平台以及国际合作期间的科研数据共享都要符合《人类遗传资源管理条例》的相关规定。伦理委员会要结合数据共享研究的特点开展伦理审查,特别关注:(1)数据来源及敏感性特征:要关注是否合法取得、提供、使用、共享数据。数据采集与保藏是否具备完善的知情同意和伦理批准。既有数据的来源可以大致分为基于研究目的和非研究目的两大类。除非研究需要,否则,不使用或尽可能少地使用可识别信息和/或敏感数据。(2)数据的收集和使用要遵循最小必要原则,研究目的清晰,方法、设计具有科学有效性。(3) 知情同意:是否可以豁免知情同意?是否可以采取泛知情同意?是否需要具体的研究知情同意?(4)数据平台管理:是否建立全程预测、控制、监察和审查数据使用管制机制和制度,包括数据采集、保藏、利用、受益分配全过程的监管。研究成员具备相应资质并完成伦理安全培训,特别是隐私保护的基本措施、风险预防办法等。(5)风险获益评估:是否存在与数据有关的风险,如数据隐私泄露,给信息提供者及其群体带来伤害、污名化或者痛苦。

其次,需要针对数据共享相关伦理困境问题进行更为深入的研究。例如,传统基于个体的医学研究的伦理审查以及知情同意书模式并不适应基于群体数据的健康数据二次使用。如何才是合理可行的知情同意?采取泛知情同意是一个选择,但知情同意困境包括知情的困难和同意的困难。知情的困难是由于未来的使用未知,列出所有未来使用领域在现实中似乎是不可行的。同意的困难是由于难以对高深的算法技术理解,如何充分有效同意[17]?现实中类似这样的复杂伦理问题与困境很多。因此,将实践中的问题作为研究的出发点,在解决这些问题中形成一些伦理原则、准则或指南,帮助科技专家和治理机构做出准确的决策。研究的终点不是发表文章,而是用研究的结果改进实践[17]。

4 结语

健康医疗数据共享面临包括数据价值、个人隐私、数据安全等技术、伦理与法律挑战。如何 “规范”和“负责任”地推动健康医疗数据用于科研共享,有效发挥数据价值?第一,需要不断完善制度,在遵循法律和伦理原则框架下,把法律和伦理规范做成可操作性强的规范与操作流程;第二,建立以应用为出发点的数据平台,保障数据质量,采用先进的数据安全防护技术与设施,确保数据能够安全、可靠且可及地共享;第三,政府、医院、科研机构、科研人员和信息企业等利益相关各方开展数据驱动的科学研究时,要提高数据伦理防范意识。数据共享所带来的各种伦理、法律、社会问题,最大挑战不在技术,需要更全面综合的伦理治理以及建立良好的生态系统,利益相关方合作解决,共建共享、责任共担的体系构建,促进健康医疗数据的流动与共享发展[15-16]。

猜你喜欢
伦理医疗研究
《心之死》的趣味与伦理焦虑
《现代仪器与医疗》2022年征订回执
《现代仪器与医疗》2022年征订回执
FMS与YBT相关性的实证研究
辽代千人邑研究述论
新型医疗废弃物焚化舱
《白噪音》中后现代声景的死亡伦理思考
伦理批评与文学伦理学
谁说小孩不能做研究?
对周期函数最小正周期判定法的研究与应用