张雷
摘要:在医疗行业中,医院信息系统基本完成了医院内部的流程管理、数据积累等工作,现在正面临着海量数据的挑战,进入了大数据时代。近年来,随着机器学习技术和人工智能的发展,大数据和医疗的结合更是被推向纵深。从图像识别、图像检索到复杂疾病的诊断,人工智能无一不正发挥着重要作用。随着技术领域的快速进步,挑战也随之而来,其中最大的一个挑战就是隐私保护的问题。基于此,本文就对大数据医疗时代的人工智能与隐私保护进行了简单的探讨,以供相关人员参考。
关键词:医疗大数据;人工智能;隐私保护
1、目前我国的大数据医疗发展现状
“十二五”期间,我国初步建立了覆盖13.7亿人口信息的电子健康档案,基本实现了对常住人口和流动人口的服务、监测、管理,以及基层医疗卫生机构信息化,完善了包含医疗机构、医生、护士在内的人员机构信息数据库,同时也逐步建立传染病疫情网络直报系统;建立覆盖多达27个省市的全民健康信息平台,并且初步实现了与国家平台的连通;基本建立了中医药服务新农合跨省结算、实验性疾病的监测系统、国家药品供应保证综合管理系统等,同时建立了电子健康档案、电子病历和全员人口个案数据库。
大数据在医疗方面的作用初见成效,但目前核心问题主要是“数据孤岛”,无法做到资源的充分统筹和整合利用,业务协同能力和数据共享能力亟待提高,相关政策法规和标准滞后于快速发展的业务,专业机构不健全,人才总量不足,尤其是高端人才、复合型人才尤为稀缺。目前行业现状是医疗大数据普遍观望多,动手少,雷声大,雨点小,大部分医院建设重点主要是HIS、LIS、PACS、RIS、EMR等医疗信息系统,不会将重点迁移到大数据应用分析上,短时间内也不会寻求和相关公司的合作。
2、大数据医疗时代的人工智能概况
目前国内诊断病人CT图像还普遍采用两个医生同时查看的形式,当两个医生对该图像得出相同的判断时容易认定,但当两个医生得到的结论不同时则需要讨论。这种方法是为了提高诊断的准确率,但是耗费人力。卷积神经网络(Convolutional neural networks,CNN)是一种典型的深度学习算法,已经在医学图像领域拥有广泛的应用。CNN可以接受各种医学图像的训练,包括放射科、病理科、皮肤科和眼科等。CNN获取输入图像,并使用简单的操作(如卷积、汇集和完全的连接层)将其顺序转换为扁平向量,输出向量的元素表示疾病存在的概率,因此可以辅助医生进行诊断,在很大程度上缓解医生的工作量。
在真实的应用场景中,人工智能辅助医疗要通过大量的数据积累,包括疾病诊断记录、病人用药效果、基因数据、家庭病史等。在国内,要实现上述数据积累,最重要的壁垒是打通各个医院和社区间的数据交换共享渠道。美国基于此考虑建设了一个电子健康记录系统,十年内积累了1000万名病人的记录。EHR的潜在应用价值是巨大的,如果好好加以利用,这相当于积累了20万年医生的智慧和1亿年的疾病情况。
3、医疗数据隐私面临的安全性问题
3.1数据泄露
信息技术的快速发展给人们的生活带来了质的飞跃。医疗信息的存储从纸质病历过渡到了电子病历到使用完整的医疗信息系统(HIS),医院逐渐使用电子病历系统进行病历的统计,将复杂多样的数据存储在数据库中。电子病历的泄露方式主要有两种,一种是非交互式泄露,主要是医院信息系统内部的泄露,或者内部人员的泄露,比如数据库操作者被盈利机构高价购买数据,另一种是交互式泄露,也就是医疗数据发布以及在不同机构之间共享时造成的信息泄露,特别是大数据时代数据共享变得普及,交互式泄露问题更加严重。
3.2数据挖掘的挑战
大数据时代提高了医疗数据的透明度,医疗行业对电子健康记录、临床数据大规模的应用以及医疗数据的外包都会造成医疗隐私泄露的风险。首先,数据的监测,使得隐私无处躲藏。通信技术的定位和监测使得每个人变得透明,何时何地都有可能正在受到他人的监视,个人隐私急需得到保护。其次,数据共享使得隐私被滥用。大数据时代电子病历系统数据的共享可以有效促进医学的研究和发展,但同时人们的医疗信息也可能成为商品被出售。联网营销人员根据患者信息可以为个人量身定制医疗广告;医疗保险推销人员可能查到病人的病历资料和电话号码,从而推销某种疾病保险。
3.3数据存储的挑战
随着云计算技术的广泛应用,大量数据不再全部放在本地数据库中,而是放在云平台中存储。云的存储与计算大大提高了处理数据的速度,但云平台虚拟化的服务模式也随之带来了一系列的安全问题。首先,数据和应用会分布到多个数据中心,增加了隐私保护的复杂度。其次,数据存储机构不同于传统方式。数据是以碎片化的模式存储在云环境下,而且是多租户共享资源,很难准确知道敏感数据存储的物理位置,一些基于物理机的数据保护机制与手段都不再起作用了,而且用户在使用虚拟资源时多个用户可能指向的是同一个物理资源,如果虚拟软件在云平台上存在安全漏洞,则用户的数据安全会受到威胁,同时直接造成数据的操作权限混乱问题。
4、隐私保护的技术措施和应用实施
4.1数据生成阶段
医疗信息采集时可对数据进行一定的脱敏处理。比如针对医护人员在诊疗过程中不可避免地接触到的敏感信息,按照《个人隐私数据使用规则》对患者的隐私信息进行脱敏处理,患者姓名、出生日期、电话号码、单位、地址、身份證号码、生物特征等敏感信息被匿名保护,同时,通过数据使用协议约定医疗信息使用目的、期限和范围等。
4.2数据存储阶段
医疗大数据平台中个人医疗健康数据的采集渠道不断增多,建立数据隐私处理程序,分辨隐私数据和可共享利用的数据,在不影响信息准确性的前提下,运用数据脱敏、去标签化等手段对数据进行处理,尽可能保护数据隐私。
4.3数据处理和分析阶段
建立政府监管、社会多方主体参与的管理机制,重点解决数据标准不统一的问题。例如正在细化的山东省智慧医院评估方法中,采用定量评分、整体分级,综合评估医院智慧服务系统具备的功能、应用范围、技术环境等,并具体分局部评估和整体评估,更全面的统一数据标准。
4.4数据应用阶段
在重点考虑数据集相互关联的情况下,最大化被匿名处理之后的数据效用,实现数据跨系统的共享与利用。同时,医疗应用系统应具备完整的用户授权功能,在提供访问或共享患者医疗数据前,明确是否允许或限制这些医疗数据的公开;及时开发有效避免越权的措施,配合授权审批管理流程,实现操作过程可追溯。
参考文献:
[1]李杰.大数据时代医疗信息化趋势探讨[J].信息与电脑(理论版),2019(12):147-148+151.
[2]唐岫.大数据时代成都智慧养老医疗保障机制研究[J].智库时代,2018(38):7-8+12.
(作者单位:日照心脏病医院)