范达英,邓仁丽,缪睿,彭燕,陈伟,李彩,黄浩
近年来,人类生存环境和生活方式发生了重大转变,脑血管疾病危险因素不断增多,脑卒中在中国甚至全世界范围内的发病率逐年上升。脑卒中具有高发病率、高复发率、高致残率、高死亡率及高经济负担等特点,严重威胁着人类健康[1]。全球疾病负担研究显示,全球有超过8 000万例脑卒中患者[2],2019年我国40岁以上人群中现患及曾患脑卒中人数超过1 700万例[3]。大数据指从各种资源中获取、以高速度创建和处理的海量数据[4],其应用、分析、集成和管理在医疗领域受到重视,且分析大数据可预测疾病的发展趋势,有助于进行早期干预以改善医疗事件结局,从而产生深刻、长远的社会意义[5]。本文旨在综述大数据在脑卒中领域的应用现状,以期为医务人员的临床研究提供参考。
1.1 数据储存便利 电子病历取代传统纸质病历后,保留电子病历的技术从基于云存储技术构建信息共享平台到基于联盟区块链技术的电子病历共享系统,不仅实现了成本低、数据传输速度快、易于获取信息、存储容量大,而且保证了传输过程中电子病历的完整性和安全性[6]。电子病历以及信息化时代带来的各种便利,使得医疗技术与临床护理水平飞速发展,为脑卒中的研究提供了有价值的信息。
1.2 减少医疗支出 脑卒中是导致居民全球死亡的第二大疾病,是导致患者长期残疾的首要原因,且脑卒中后治疗和护理方面的经济负担不断增加[7]。《中国卫生健康统计年鉴2019》显示,2018年缺血性脑卒中和出血性脑卒中患者人均住院费用相比2008年分别增长56%和125%[3]。MANE等[8]回顾了5年的数据,并构建了诊断性能仪表板来监控诊断质量,其利用大数据跟踪诊断错误情况及其危害,从而减少误诊的发生。LIBERMAN等[9]使用一种名为“Symptom-Disease Pair Analysis of Diagnostic Error”(诊断误差的症状-疾病配对分析)的工具,并通过患者现有症状结合大数据判断和监测诊断错误情况。在临床上,大数据可以有效降低脑卒中的误诊率,减少医疗支出,满足社会需要和公共卫生需求。
大数据在脑卒中领域的应用可以分为两类:基于实践的分析方法、应用人工智能(artificial intelligence,AI)和机器学习的新兴方法[10]。其中基于实践的分析方法涉及临床治疗和护理,而AI和机器学习的新兴方法将脑卒中引领到全新的研究方向和领域。
2.1 基于实践的分析方法 在临床治疗和护理中收集、评估和分析大量数据,可实现脑卒中的精准医疗[11]。将遗传学与大数据结合,能提高脑卒中病因识别的准确性,这对寻找干预靶点和改善患者预后具有重要意义[12]。将遗传学与精准医学整合,在大数据的基础上进行多组学数据整合,发现并干预与脑卒中复发和预后相关的遗传因素[13]。基于大数据进行流行病学调查,可指导公共卫生服务策略的制定。GATTELLARI等[14]计算了新南威尔士州9年间脑卒中患者的入院率和死亡率,总结出该州在脑卒中亚急性期管理、出院后护理和二级预防方面缺乏重视。UNG等[15]使用河南省焦作市的以疾病诊断相关分组(Diagnosis Related Groups,DRG)为基础的支付系统分析医疗支出大数据探索脑卒中患者治疗费用的影响因素。
疾病管理是提高脑卒中患者生活质量的基本手段,张书凡等[16]依托医院信息服务平台,利用大数据和云计算创新性地建立了脑卒中区域性管理的新模式,满足了患者多学科联合护理的需求,促进了脑卒中单病种质量管理的发展。侯玉梅等[17]为了探究脑卒中的发病规律,利用数据挖掘与Logistic回归模型构建了预测模型,该预测模型可以让患者自我监测脑卒中发生风险,使脑卒中预防具有便利性。基于大数据和智慧医疗构建新的疾病管理模式,可能是疾病管理的发展趋势,其有望在提高患者依从性的同时减少人力资源消耗,更好地提升临床管理效能。
2.2 应用AI和机器学习的新兴方法 AI是研究和开发用于模拟、延伸和扩展人类逻辑思维的技术科学,其可通过复杂的算法而优化、提取大数据的价值[18]。使用AI分析大数据可辅助医生做出临床决策,进而改变当前的临床护理模式。GUAN等[19]使用机器学习从颅脑CT图像中提取并学习脑卒中的影像学特征,这证实了通过颅脑CT图像识别脑卒中的可行性。为减少脑卒中并发症的发生,有研究者利用AI分析大数据并建立了脑卒中并发症风险预测模型,其相较于传统的风险预测模型有更好的预测效果[20-21]。
机器学习是AI的分支,可通过识别变量之间的交互模式而解决大数据的复杂问题[22]。其在识别影像学特征方面有更好的灵敏度和特异度,是神经系统疾病影像学诊断的重要辅助手段[23]。LEE等[24]应用自动图像处理方法分析脑卒中患者的影像学特征,并开发了3个机器学习模型以预测脑卒中的发病时间,提高了静脉溶栓治疗率。MIN等[25]将脑卒中患者的临床数据和影像学特征融入机器学习,进而能准确预测患者的预后情况,从而有助于临床医生制定更好的治疗和护理方案。WU等[26]运用卷积神经网络(convolutional neural networks,CNN)自动分割算法,在多中心弥散加权成像数据集中对缺血性脑卒中的影像学特征进行识别及分割,结果显示,其对脑卒中分型具有重要作用。
3.1 脑卒中人群数据库 中国国家卫生健康委员会和科技部在2007年创建了中国国家卒中登记中心(China National Stroke Registry,CNSR)数据库,第三次中国国家卒中登记中心(the Third China National Stroke Registry,CNSR-Ⅲ)[27]纳入了15 474例脑卒中患者,CNSR-Ⅲ前瞻性地分析了脑卒中的病因、影像学特征和生物标志物,其结果提供了大量决定脑卒中患者预后的因素。2015年中国卒中学会为建立基于国家三级医院的脑卒中护理平台,发起了中国脑卒中中心联盟(China Stroke Center Alliance,CSCA)(https://csca.chinastroke.net),其数据可提供给研究人员进行脑卒中护理研究,以期改善脑卒中患者的生存质量和预后。
国外数据库有澳大利亚卒中临床注册中心(Australian Stroke Clinical Registry,AuSCR),其收集脑卒中或短暂性脑缺血发作(transient ischemic attack,TIA)患者的护理及康复情况。DALLI等[28]回顾了AuSCR登记的17 980例脑卒中/TIA患者的资料,评估患者出院后1年药物治疗依从性与3年生存率之间的关系。此外,美国国家神经系统疾病和脑卒中研究所及美国国立卫生研究院开发的StrokeNet,涵盖了美国27个区域中心,涉及约500家医院,为脑卒中患者提供了新的潜在治疗方法[29]。总之,国家大型卒中中心的建立和应用,可对国家脑卒中群体进行总体评价,为国家卫生保健政策的制定提供循证证据,为临床实践提供指导。
3.2 全国人口数据库 美国医疗保健成本和利用项目(Healthcare Cost and Utilization Project,HCUP)是美国最大的行政、纵向医疗保健和住院护理数据库,集合了1988年至今所有入院患者的付款信息[30]。有研究利用HCUP计算脑卒中危险因素的患病率,发现2004—2014年美国脑卒中患者传统危险因素的患病率不断增加[31]。英国SEMINOG等[32]分析了全国因脑卒中死亡的795 869例患者的临床信息,推断出急性脑卒中死亡率下降的相关因素。以色列最大的健康维护组织(Health Maintenance Organization,HMO)数据库覆盖了该国一半以上的人口,SALIBA等[33]分析HMO数据库中超过43 000例心房颤动患者的临床资料发现,导管消融术可明显降低心房颤动患者脑卒中发生风险和死亡率。LEE等[34]对韩国国家健康信息数据库(Korea National Health Information Database,NHID)中80多万女性进行为期10年的随访,证实血红蛋白水平变化可影响年轻女性脑卒中发病率及其全因死亡率。此外LEE等[35]利用NHID开展全国性纵向随访研究,确定了血清抗体阳性的类风湿性关节炎与缺血性脑卒中存在相关性。总之,全国人口数据库覆盖范围更广、信息更全面,可以利用其进行更有深度的全国性脑卒中研究,从而改善脑卒中治疗现状和提高脑卒中护理质量。
总之,大数据在脑卒中领域的应用从医院数据的探索到国家大型数据库的成熟运作,从基于传统统计学分析的实践应用到灵活使用AI和机器学习,医务人员在信息化背景下不断挖掘临床积累的医疗数据,使得脑卒中的临床治疗技术和护理质量不断提升及优化。大型数据库实现了数据集成、储存、共享,研究人员可以基于国家相关大型数据库发掘脑卒中的疾病特征,形成全国性和区域性的循证证据和脑卒中指南,早日实现全面精准医学、全民参与防治。未来,国家数据库更应加强与地方医院的交互,以帮助地方医院形成更具有针对性的治疗和护理模式。在目前的大数据研究中,影像学的应用逐渐成为脑卒中研究的新趋势,而影像学资料比较复杂,故更加需要借助AI和机器学习来寻找特异性、敏感性的影像学特征。建议临床医护人员基于脑卒中影像组学及其他组学资料开展全面研究。同时,医疗专家需与计算机专家合作,形成多学科交叉互补,充分发挥大数据的潜在作用。
作者贡献:范达英进行文章的构思与设计,论文撰写及修订;缪睿负责研究的实施与可行性分析;范达英、李彩进行文献检索及筛选;邓仁丽、彭燕、陈伟进行文献整理和分析;黄浩负责文章的质量控制及审校,对文章整体负责、监督管理。
本文无利益冲突。