张博妮 陈昱洁 毛 湛 邓川弘
(1.南京审计大学法学院,江苏 南京 211815;2.南京审计大学金融学院,江苏 南京 211815)
人工智能在医疗领域的研究关系到全人类的福祉,近年来也有了革命性的发展,中国工程院李兰娟院士也曾公开表示,人工智能和大数据此次疫情中对遏制疫情扩散、进行疫情研究判断发挥了非常重要的作用。具体来说,以大数据及人工智能、云计算等为代表的一系列先进技术在疫情监测分析、重点人群管理、辅助防控决策、医疗救治、资源调配等方面发挥了巨大作用。[1]
医疗AI主要借助于大数据、云计算、深度学习技术,来发挥提高医疗效率、降低医疗成本等重大效用。医疗数据和算法是医疗人工智能运行的两大核心要件,其中医疗大数据在整个医疗人工智能系统中具有根基地位,医疗人工智能的服务质量很大程度上取决于提供给它的医疗数据的数量与质量。只有在坚实的基础之上,医疗人工智能系统才能够高效精准地服务人类。除了对医疗数据自身的把控上,如何保护作为医疗数据的主体的患者的隐私利益,如何使提供的数据在安全前提下最大化,也是目前亟须探讨的问题。
医疗数据从收集阶段,再到利用及流通共享等后续阶段,其间都面临着各类复杂的风险。但不可否认,医疗数据在人工智能时代所面临的安全问题,是医疗人工智能真正落地前务必要切实解决的。本文试图根据现状,分析医疗数据在产生及流通过程中存在的主要问题,并对相应解决方案进行进一步探讨,平衡人工智能医疗数据利用最大化与个人隐私保护之间的关系。
在医疗人工智能领域,医疗数据的重要性不言而喻,人工智能医疗数据的应用本质就是通过人工智能技术对传统医疗数据的潜在价值进行深度挖掘。国务院于2016年发布了《关于促进和规范健康医疗大数据应用发展的指导意见》,将医疗大数据应用发展纳入国家大数据战略布局中。在此次新冠疫情的背景下,国家也正倡导大数据在医疗领域的充分应用。如今,医疗数据的来源主要是临床和实验,两部分的数据整合后形成一个庞大的医疗数据资源库。
目前,医疗人工智能的应用领域已经逐步扩大到了以下几个方面:医学影像、智能器械、健康管理和药物研发。以医学影像领域为例,首先,众所周知培养医务人员需要投入高额的成本。我国三甲医院对于医生的学历要求普遍为硕士及以上,医学生毕业后还需在医院进行几年的专科规培。国家方面的投入更是庞大:医药类院校建设拨款、教学科研成本发放等。其次,在医生阅读分析医学影像时,大多以历史经验与主观判断为主,这使得医学影像的分析过于主观化,容易致使误诊。即使一个医生从医多年,有着再丰富不过的经验,他所诊断过的医学影像毕竟还是有限的,总会遇到没有见过的病情。不同于人类,医疗人工智能一经研发,后期学习成本低且学习效率高,可以在短时间内通过多维度高效地学习,阅读收集存储各种医疗影像数据,例如X光片、B超影像、CT影像、核磁共振影像等,可以与自身数据库中海量的医疗影像数据进行快速比对,迅速分析,帮助医生准确定位病灶位置,极大程度上减少了误诊率,使诊断更加精准化。2020年新冠疫情防控中,部分一线医院便采用CT图像辅助诊断新型冠状病毒肺炎,极大地提高了临床诊疗效率,为往后突发性重大疫情的治理提供启发性思路。此外,医疗人工智能的语音识别、视频理解、智能问答等技术能够在辅助病历记录、临床护理、康复指导、自动导诊等诸多领域展开应用。[2]
由此可见,医疗数据的有效利用为医疗人工智能发挥重大作用奠定根基。目前,世界上有许多发达国家在医疗数据的处理方面做得比较完备,例如瑞典、丹麦等欧洲国家的电子医疗数据的国家覆盖率已经近于100%。相比而言,我国的医疗数据体系尚不完备,处于初步发展阶段,存在数据散落、结构标准不一等问题。
目前,虽然随着人工智能行业的发展,人工智能技术不断融入各行各业,其发展前景广阔,但是我们仍处于弱AI时代,为使医疗人工智能真正安然落地,还需突破一些限制因素。基于此,以前瞻性的视角,首先着眼于作为驱动医疗人工智能发挥效能的核心要素——医疗数据,不可否认医疗数据具有重大价值,但坚决不能忽视其背后的风险和问题。
现阶段人工智能对于医疗数据挖掘收集、分析利用和流通共享的流程大致如下:
1.医疗数据的挖掘和收集
鉴于个人医疗数据自身的社会性和公益性,其应当为社会所利用。医疗数据的来源主要是各级医院、基层卫生院、各级卫生计生行政管理机构、各类医疗科研实验中心对人们数据的采集,云平台再从海量数据中筛选出有效信息。
2.医疗数据的分析和利用
基于大数据技术,对多源异构的医疗数据进行汇集,通过云计算以及数据价值挖掘能力,进行存储、查询、预处理、关联性比对等操作,将医疗大数据最终应用于人工智能辅助或者指导医务人员进行决策。[3]
3.医疗数据的流通和共享
如今,医疗数据的流通和共享主要有两种模式。[4]其一,政府作为开放医疗数据的主体,公共卫生健康部门向国有医疗机构和私有医疗机构不同程度地开放可自由使用的医疗数据;其二,医疗机构作为开放医疗数据的主体,开放其掌握的医疗数据,此流通共享模式多有交易性、交互性色彩,且流通共享范围行业领域分化较细。
基于医疗数据在不同流通环节所面临的风险,我们展开进一步的分析探讨:
医疗AI如今已经发展到一定程度,医疗数据在上述过程中的流动是无法避免的,这不免会削弱医疗数据的人为管控。目前,我国尚未形成系统的医疗数据共享责任机制,数据合法使用者权利与义务界定模糊,而此环节恰是医疗数据泄露最易发生的。倘若对合法使用者的管控不严,或是内部监管人员监管力度不到位,容易引发非合法使用者的入侵,且事后取证难度较大。而且,我国对隐私及数据非法获取及泄露的惩处条例相对宽松,以行政、经济惩罚为主,与欧美国家相比较轻。一旦发生个人信息数据泄露,倘若没有健全的责任机制,则很难追溯至某一具体环节以及确定责任归属,现有法律已无法有效规制人工智能背后数据侵权的问题。为减少纠纷,促进医疗AI行业的发展,有关部门亟须出台一部专门且系统的法律去规制医疗数据相关的侵权问题。
医疗人工智能的运作需要海量的医疗数据作支撑,医疗数据在法律层面也可视作一种数据财产,而关于这类财产的归属与管理尚未明确,权利主体存在一定的模糊性。随着技术的不断发展,我国每天都在产生庞大的医疗数据,但各家医疗卫生机构由于要保护患者的隐私,正常来说是无法进行经法定授权的医疗数据的交易与共享,从而导致大部分医疗数据未被充分挖掘与利用。在医疗人工智能中,掌握医疗数据相当于有了较大的行业竞争优势,医疗机构、机构出资方以及医疗AI的研发方都希望对医疗数据拥有合法的所有权。但倘若完全归属某些单一的机构,患者则会担忧个人医疗数据的保护问题;倘若国家统一管理、授权,如何确保医疗数据能高效准确地汇总,针对不同属性的主体,又如何区别指令才能更好地平衡数据利用与保护。除了明确医疗数据的权属问题,有效的医疗数据开放框架也亟须构建。
医疗AI系统需要储备大量的医疗信息数据,其中大部分是患者的个人医疗信息,也经常涉及一些负面的敏感信息,比如现病史、遗传史、身体缺陷、治疗情况等,这些都属于患者极为介意的隐私,医疗敏感信息的价值性也远高于其他行业。
通常,含有诸多隐私的医疗数据会被储存于云端,由于较多的网络安全漏洞和人工智能的自动化决策,很可能使患者的隐私受到威胁。另外,云端储存的医疗数据,就算人工删除也可能从某些漏洞中将其恢复。倘若相关网络服务器受到黑客或网络病毒的攻击,患者的敏感信息被泄露,其隐私权则将遭到严重侵犯,极有可能会影响患者生活的方方面面,甚至牵连到家族成员。而且当前AI通过高级算法能将更多的个人信息数据推导出来,其隐性影响更是无法估量。随着技术的发展,获取个人信息数据的手段更加高效,一旦发生个人信息数据泄露事件,患者的医疗信息被不法分子用于非法途径,相比传统的信息泄露,其波及面更广,社会危害也更严重。2016年,全国275例艾滋病患者收到能准确说出个人信息及确诊时间,佯装发放疾病补助的诈骗电话,要求患者在领取补助前支付几百至几千元不等的手续费,造成重大经济损失及社会危害。当前我国有关医疗信息安全的法律,部分内容偏向导向性和原则性,缺乏一定的现实操作性,在人工智能获取数据技术方面的规定也尚未明确。
《网络安全法》中规定,个人信息收集的过程中须遵守告知同意原则。但在发达的信息时代,众多平台在提供信息技术服务的同时,为获取更多的经济利益,变相地强制使用者授予其读取信息的权利,有违告知同意权设置的初衷。在医疗人工智能的发展过程中,我们可以期待患者在自己不受伤害,或者收益与伤害成比例的情况下,配合医务人员提供个人医疗数据,促进医疗AI的开发与利用,但这只是道德义务而非法律义务,不可强求患者提供医疗数据。为更好地维护患者的告知同意权,在收集信息的过程中有必要告知他们实情,当然也有必要让他们了解医疗数据共享的价值从而取得他们的同意,但以何种形式来实现众多素质参差不一的就诊患者的告知同意权,在措辞方面如何规避授权协议冗长晦涩,患者授权范围是否包括医疗数据的二次流转等都是需要考虑的问题。
由于如今信息获取迅速且渠道广泛,一旦出现医疗数据盗取、篡改、泄露问题,在医疗数据的存储、抽取、整合等众多环节中,难以快速追溯问题所在。最为切实有效的方法就是通过立法的手段对当前数据合法使用者权利与义务作出清晰界定,对医疗数据一系列操作作出明确的规范性指引,构建系统的责任机制与处罚机制,但不可否认由于医疗人工智能的超前性及法律制度程序的严格性,无法快速解决当下问题。除了法律这一保障手段外,或许数据管控技术的创新能从源头帮助管控问题的解决,例如区块链与云技术的融合,既有利于解决区块链的存储与性能瓶颈,也能够有效防止医疗数据被随意伪造篡改。
医疗数据除了满足医疗机构自身管理和患者就诊需要外,还具有巨大的再开发和二次或多次利用价值。比如在此次新冠肺炎疫情期间,医疗机构与网络平台联动,实时更新公布确诊病例和疑似病例,为疫情取得胜利提供了巨大帮助。可见在大数据环境下,数据的价值绝对不会限定于某一目的,出现用于二次利用乃至重复利用、数据集合重组等形式也是十分常见的,而且其潜在价值更是不可忽略,如何提高数据的使用价值和经济价值则更加凸显出其重要性和必要性。但是“由谁归属,相应主体的权利与义务、归属后不当处理的后果”等等问题,无论是法律层面还是行政规章方面都未作出详细规定和说明。当下大数据环境中,个人医疗数据的利益逐步让位于公共利益,理应由更多公权力机关出面介入,以保障数据主体的信息安全。国际上有些许国家采用了建立相关独立的数据监督监察机关以监管个人数据信息安全。如欧盟设立有“数据保护委员会”,还有“日本个人数据委员会、韩国个人信息纠纷调解委员会”等[5]。我国在2018年所发布的《国家健康医疗大数据标准、安全和服务管理办法(试行)》中规定,健康医疗大数据的监督管理部门为卫生健康委员会,其监管职责主要是对“各类医疗卫生机构和相关企事业单位”进行检查指导、监测评估,以及对违规者进行追责,但并未有详细划分监管的具体做法以及有关数据的后续相关处理,同时也与网信部门负责网络空间的个人信息监管工作,形成重合管理地带,导致被侵犯个人信息数据者难以寻求救济的难题。因此笔者认为我国建立相关的独立数据监督监察机关以监管个人数据信息安全是十分迫切的。
同时这也正因为数据的特殊性,不能够将其划分为物,如果运用一般法律意义上的“所有权”的归属原则,则是无法合理解释的。因此笔者认为可以赋予其无财产属性,定位其为一种“人格权”。因为如果认为个人信息权是一种财产性权利,那么则意味着允许数据主体与控制者之间自由买卖交易,这将不利于对数据主体自身的相关权利保护,而定位为“人格权”则是强化个人信息数据与个体的紧密性和归属性。当然值得注意的是,这与医疗机构对于患者的医疗数据信息进行二次、多次或者组合处理后,又会产生的“副产品”是不相同的,医疗机构在合理合法化地获取患者相关数据后,将数据真正变成了资源,让医疗人工智能技术与应用以数据驱动,去服务于下一次医疗诊断,它们理所应当是数据主体和控制者。
我们应该鼓励医疗机构和医学研究者对于患者个人医疗数据进行信息处理以提升整体医疗技术,造福人类,因为医疗数据是具有公益属性的。但是将个人医疗数据当作公共资源,这是不恰当的。因此,在利用医疗数据的同时必须保护个人的隐私权。首先,国家应当保障医疗数据的安全,通过技术层面的创新加密医疗数据,出台相应的规范性文件构建严密的医疗数据保护机制和访问授权机制。其次,在面对个人医疗数据被侵犯时,个人应有权维护自己的合法权利不受侵犯,国家也应该能够保障公民能够得到合理的救济。当前国际上以美国和欧盟对个人信息的法律保护为主要代表,存在着两种模式:基于人权意义上的、以隐私权为主的保护模式和将保护个人信息数据从隐私保护中抽离、以个人信息权为主的保护模式,但二者的规定却不足以构成个人对于数据信息拥有绝对的控制和决定的权利,而更偏向于一种防御性权利。
我国《网络安全法》第四十二条中,对于个人信息数据是否可以被他人使用,采取了知情同意规则,因此个人信息数据的使用,只存在于主体知悉和同意范围之内。但在现实情况中,知情同意规则更多流于形式,过于泛化、强制化,这样的交换意味着数据主体与数据控制者之间地位的严重不对等。笔者认为,知情同意权可以因时而变,当需要特定某个患者的个人数据信息时需征得个人同意,当不需要时,进行匿名化处理,不将分析结果与个人关联。这样既有利于保护患者的个人信息数据,又可以最大化使用数据信息,便于医学医药的进一步研究。
新兴的科技文化正在循序渐进中走入人们的日常生活,随着人工智能在医疗领域也在逐步深入,医疗人工智能在实践的各类环节中衍生出了不少问题。其中,对于整个医疗人工智能系统,有重大资源价值的医疗数据值得我们重点关注,但是无论是在医疗数据收集阶段,还是在后期数据处理阶段都存在一定的疑问与困境。对于医疗人工智能的规制不同于其他一般的领域,这是在一个现有并将持续发展的领域内选择一个新兴出现的事物进行融合发展,这样一来,法律要想规范规制这一领域就得联合两方面并且寻找出其中潜在的缺点问题进行相关合理规定。此外,法律也决不能只停留于实践发展阶段的漏洞,前期准备阶段将会存在的问题同样不得忽视,也只有对于其制定严密的规定才能够尽可能避免后期可能存在的麻烦,打牢了地基才能够保障后续程序的正常操作。
不可否认,在如今这个飞速发展的时代,我们无法全面预测在医疗人工智能领域未来将会面临什么样的问题。医疗人工智能未来发展的不确定性,更大程度上要求我们在法律规范方面要保持着开放性与持续关注性,这不仅是对相关主体合法权益的一份保障,同时也是在促进着科技更顺畅无阻地向前发展。