Marcello Ienca,等 著,刘 晖,黎 莉 编译
普适计算和医疗信息学的兴起使大规模收集、共享、汇总和分析前所未有的大数据量成为可能,这种现象被称为“大数据”。本文回顾了关于痴呆症大数据研究的现有文献,以及该领域的商业可用移动应用程序。分析表明,痴呆症研究和护理的大数据方法有望改进目前的防治和预测模型,揭示病因,实现早期诊断,优化资源分配,并为具有特定疾病进程的患者提供更多量身定制的治疗方案。但是,这种承诺的前景尚未完全实现,并引发了一些技术、科学、伦理和监管方面的挑战。本文对这些挑战进行了评估,并为研究、伦理和政策的未来发展规划了路线。
未来几十年,痴呆患病率可能会增加三倍,医疗系统和护理人员将承受难以控制的压力。因此,人们对痴呆症的防治及早期认知衰退检测工具的研发有迫切渴望。阿尔茨海默病(AD)生物标志物的鉴定对于早期防治十分重要。综合多生物标志物和病因学路径的多维模型比基于单因素假设的还原学方法更有前途。最近,全球对大数据研究兴趣激增,蔓延到包括痴呆症在内的许多医学和健康领域。
基因组数据、电子健康记录(HER)、装有传感器的移动设备及可穿戴装置、手机应用程序、信用卡等多种手段使得预测医疗将成为因大数据将产生变革的领域之一。生物医学研究产生大量数据,通过各种数据库和生物库存储和共享及二次使用,合成能够提供一个人的健康状态的多维信息,即我们的“数字表型”,随之引入“数字健康”的概念。前所未有的大量数据产生使得医疗领域可能形成新的突破。
利用大数据的收集、汇总和预测分析可以重启痴呆症的防治和护理研究。大数据具有为病因学带来新亮点的潜力,可实现更及时的诊断和预防,并可能克服当前的治疗局限性。通过实现EHR,分子生物标志物,神经影像生物标志物和移动健康(mHealth)数据的整合,这一潜力更有可能实现。
2017年10月,以“大数据”和“痴呆症”为关键词搜索PubMed,获得了九篇同行评审文章和一篇会议论文。这些文献的数据来源包括EHRs、互联网搜索和基因数据,不包括移动健康数据。对Google Play和iTunes的平行搜索表明,目前有35款移动应用帮助卫生专业人员筛选AD和认知能力下降。进一步的筛选表明,大数据方法对痴呆症的研究进行分析。例如,AD的DREAM处理:①预测认知评分在初始评估后2年的变化;②理解对淀粉样蛋白病理学的适应力的生物学基础;和③使用神经影像将个体分类为诊断组。这些成果利用了大数据集,如阿尔茨海默病神经成像倡议组织的数据库,并利用包括遗传学、神经影像学、认知评估和人口统计学信息在内的多种数据来源。
另外,在2013年至2015年期间,经济合作与发展组织发布了五本政策文件,阐述痴呆护理和研究中大数据趋势带来的承诺和挑战。
大数据可能在未来有助于揭开AD的病理难题,揭示AD的病因。大数据可以跨越不同类型和尺度,实现多模式(具有来自综合数据源的不同数据采集模式)和多标量(从分子到行为和人口规模)的统计数据关联,这可能会解决目前不同数据整合缺失的问题,有助于“瞥见大局”。研究人员利用了多种数据源,包括神经影像学、手势跟踪和视网膜扫描,开发了智能算法来检测在症状发作之前的结构(例如脑结构的变化)或功能性异常,其中一些研究显示预后和预测潜力。与此同时,一些手机应用声称能够通过游戏行为或心理检查来发现认知能力下降的早期迹象。正如经合组织的一份报告所述,从不同规模尺度(从分子到整个人群)和信息类型(从神经生理到行为)的数据整合可能有助于开发精准药物解决方案。
大数据和移动应用程序以简化认知衰退早期迹象的检测。这些工具的普遍性和易用性帮助自我检测的同时也导致假阳性诊断的数量增加。过度诊断和医疗对卫生系统和患者都有影响。后者面临保险和就业歧视、污名化和心理伤害的风险,而卫生体系可能应对不必要的经济和组织成本。
移动健康应用程序在痴呆症中的这些下游效应说明专门的法规监管十分必要,美国食品和药物管理局、英国医药和保健品监管机构等监管机构已经着手参与。同时,我们观察到一些应用程序没有其产品有效性的足够信息,或者他们处理客户个人数据的方式。消费者需要有效的激励和惩罚措施来确保其利益。大数据研究建立大规模的个人数据库,导致数据管理、保护、汇总、交互性、隐私以及收集、使用和共享此类数据的知情同意方面的监管面临挑战。这些问题目前正在伦理和监管部门进行辩论。
除此之外,由于部分临床试验中涉及的电子病历、移动设备数据和经济数据等的使用和获得也是一个紧要问题。在像痴呆这样的耻辱化情况下,利用多重数据而发现认知功能下降的早期迹象,给患者带来了特殊的伦理挑战,至少应该让患者(或其法定代理人)了解此类活动并给予选择退出的选项。
为了克服上述结构性挑战并确保痴呆症大数据研究的成功,在研究方法、数字基础设施和融资以及伦理和监管方面都需要综合方法。
在科学层面上,需要明确划分大数据驱动研究的阐释力。通过分析工具进行大规模数据收集和进一步挖掘,从而在异质数据源之间建立可靠的统计关联。专家呼吁将大数据方法与基础神经科学相结合,将大数据分析建模和模拟相结合可能会克服单独分析生物标记物的还原主义生物学方法的不足,解决目前痴呆症研究的局限性。
痴呆症研究和护理的数字基础设施需要升级。数据存储,处理和访问的安全基础设施需要维持并加强,并保证不同数据库的互用性(例如遗传生物库、神经影像库和电子卫生保健数据平台)。政府和企业之间的积极合作是一种可行策略。然而,大型ICT公司占用卫生数据可能会引起公众不安。
目前,对于收集和共享个人健康数据的稳健伦理指导方针将有助于大数据研究,同时保持公众信任并保护数据主体。但现有的监督机制(如伦理审查)和传统的知情同意模式似乎不适合大规模数据收集。就涉及结构化和非结构化数据的大规模储存库的研究而言,新型数据分析工具来评估研究协议的临时标准十分必要。此外,目前形式的知情同意不利于数据主体(或其代理人)充分控制关于其认知状态的个人信息。这是人们将数据提供给研究人员的首要障碍。人们正在探索新的机制,使客户能够进行更细化的数据控制,例如通过实施数据可移植性权利,或引入电子同意管理机制和参与式数据治理。然而,由于大数据和真实性研究的纵向性质,从认知功能可能随时间减弱的受试者那里获得的初始同意是否一直有效存在疑问。因此,需要特别的监督机制(例如前瞻性的指导),在保护这些患者的权利和受益的同时促进科学进步。
就隐私和数据安全而言,研究人员和监管机构需要承认,即使深度表型数据的匿名化也不足以保护隐私权。考虑到关于认知数据的敏感性及频发的大量的数据泄露,加强有效监管和技术手段来支撑数据安全至关重要。隐私保护技术(如加密和块链)需要纳入当前数据传输的数字基础设施,以促进和维持个人在数据收集和共享方面的信任。