许基连,麦兰仙,文宏,曾志羽
近年来,心血管病(CVD)已成为威胁我国居民健康的首要疾病,对我国居民的疾病经济负担和死亡风险产生深刻的不利影响。据《<中国心血管病报告2018>概要》报道[1],预测我国CVD现有患病人数2.9亿,CVD患者死亡人数占居民疾病死亡人数的40%以上,CVD患者的住院总费用年均增速远高于我国GNP的增速。
在对CVD愈加关注的同时,精准医学领域亦在发生重大变化。一方面,随着基因测序、基因组学和表观遗传学的发展,学者对基因研究领域的兴致愈发浓厚;另一方面,云计算和计算生物学的新技术的开发、电子病历的广泛出现及生物医学信息学领域的蓬勃发展,极大提高了疾病信息大数据的获取和分析能力。此外,智能手机和移动健康设备的推广使用为量化自我运动和实时获取连续生理数据成为可能[2]。生物技术的快速发展和精准医学时代的到来激发了学界的兴趣,科研人员不断推进CVD遗传因素的研究,从多组学、暴露组学和表型组学等方面对CVD易感基因进行不懈探索,并逐步探索精准健康管理模式在CVD危险因素干预中的应用。本文将就精准健康管理模式应用于CVD健康干预中的现状进行综述。
精准健康管理是以医学大数据和生物医学大数据为对象,采用机器学习、生物信息挖掘进行人群的精准健康风险建模、评估和预测,并通过人工智能技术,为个人全生命周期提供精准的健康服务[3]。在慢性病健康管理中,精准健康管理模式具有广泛适用性,可在研究对象招募、数据收集与匹配整理、评估疾病危险因素、整合健康与生活方式资料以探讨关联性等方面发挥重要作用。当前,精准疾病诊断、精准风险评估、精准健康档案建立、精准健康干预和精准干预绩效评价等是精准健康模式在慢性病健康管理中的具体体现。
冠心病、脑卒中等主要CVD疾病均是一类在基因和环境因素共同作用而形成的、具有共同遗传背景的多基因疾病,CVD患者的临床特征和预后存在异质性。因此,基于个体的基因特征和家族史采取个性化的干预措施,利用实时、连续的健康信息评估健康干预效果并调整健康干预方案是实现CVD危险因素有效干预的重要条件。当前,精准健康管理模式在CVD中的应用主要包括信息采集精准化、风险评估精准化和健康干预精准化。
2.1 健康大数据收集及挖掘在健康管理过程中,精确、客观、动态、全面的健康数据是医生准确评估患者健康状况、采取个体化的健康管理方案和实现有效健康管理的关键。问卷调查、体格检查等方法所获得的健康数据是静态的横断面数据,而CVD的发生、发展与转归过程是多种危险因素持续作用于生命历程的结果,因此,医疗健康大数据在CVD健康管理中扮演着重要的角色。健康医疗大数据依托于云平台,以个人身份信息为索引,沿个体生命历程,实时汇集和整合个人电子病历、电子健康档案、疾病监测数据、基因组学数据、死因数据、基本公共卫生数据和健康保险数据等,构建医疗健康大数据库[4]。
2004年,山东省启动“大型多中心健康管理纵向观察队列”项目。该项目将健康体检、居民健康档案及基本公共卫生、临床诊疗、医疗保险、健康/疾病监测、全死因监测6个领域的健康数据及空气质量与气象监测数据联接到大数据库中,构建了集个体暴露、群体暴露和全结局随访为一体的大型观察性纵向全结局随访队列大数据库,实现了跨领域数据库的联接融合[5]。通过构建纵向观察队列,健康管理实现了贯穿健康信息采集、健康现状评估、预测疾病发展进程、健康促进与干预全过程的可能性,为研究者探索各种危险因素与疾病间的关系、构建疾病的风险评估预测模型提供了重要资源[6]。
2015年,美国宣布启动“精准医学计划”,开展百万人群队列研究,对个体的疾病与健康状况实行长期、持续追踪,收集病案、遗传与代谢图谱及环境与生活方式等一系列信息,进而为疾病的发病风险预测提供数据基础和研究平台[7]。2016年,我国启动精准医学研究重点专项,以常见高发、危害重大的疾病及一系列高流行率的罕见病为切入点,基于我国环境的多样性和我国居民独特的遗传背景,开展大规模人群队列研究和生命组学技术研发,推进精准医学大数据的资源整合、存储、利用与共享平台建设,开展精准化疾病防诊治方案研究,探索建设精准医学集成应用示范体系[8]。
2.2 风险评估精准化健康风险评估是指对个人或群体的健康状况及未来患病和(或)死亡危险性的量化评估,涵盖对危险因素的评估和可能发生疾病的评估两个范畴[9]。通过健康风险评估,居民可直观地了解到自身的实际健康风险,为改变或修正其自身不健康行为提供依据。国内常见的CVD风险评估模型包括国家‘十五’攻关课题组研发的分性别ICVD事件10年发病危险预测模型和预测ASCVD发病风险的China-PAR模型。2011年《中国心血管病预防指南》总结我国当前ICVD风险评估方案和方法,提出了我国成人ICVD十年发病危险评估方案和3种工具,即评分表法、直接计算法和发病风险彩图法[10]。
多基因风险评分(PRS)是目前常用的综合多基因多位点信息的疾病风险评估工具,其通过量化多个基因或位点的累积效应从而将庞大的基因组变异信息转换成衡量个体疾病易感性的分值[11]。Khera等[12]通过一个纳入了184 305例参与者的全基因组关联研究(GWAS)数据库构建冠心病全基因组多基因评分(GPS),并以英国Biobank中的数据为依据验证冠心病GPS。研究显示,该GPS模型有效识别出8.0%的被调查者具有遗传易感性,其发生冠心病的风险是不具备遗传易感性者的3倍,且采用该GPS评估疾病发病风险的效果等同于单基因突变疾病筛查。由于Khera等构建的GPS是基于欧洲人群的疾病谱,并不适用于东方人的冠心病风险评估,顾东风的研究团队基于26 262个国人GWAS构建遗传风险评分(GRS),评估22个与血压相关的单核苷酸多态性(SNP)的累积效应。研究发现,在调整年龄、性别和BMI后,GRS每增加1个标准差,收缩压增加0.12 mmHg/y,舒张压增加0.07 mmHg/y,高血压发病率增加19%[13]。
人工智能(AI)技术的发展也推动了精准CVD风险评估的发展。AI技术具有梳理和分析医疗大数据的能力,可突破传统统计模型准确性和应用范围的局限,从而实现真实世界风险预测模型的灵活实时建立和校正[14]。林耀望团队开发了基于XGBoost模型的机器学习算法来评估冠心病和心肌梗死的风险程度,结果显示,冠心病风险预测模型的灵敏度、特异度、AUC等7项预测参数均>90%,心肌梗死风险预测模型的灵敏度、AUC等5项预测参数均>80%,该机器学习模型能准确地预测冠心病和心肌梗塞风险[15]。尽管AI技术在CVD风险预测中的应用取得了较大的突破,但如何通过纳入更多健康信息进行建模以提高预测模型的精度和泛化能力,进一步提高AI技术在疾病预测方面的精度和广度,仍是学界需要探讨的问题。
2.3 健康干预精准化CVD危险因素种类繁多,涉及个人生活方式、家族遗传史、心理及社会环境等因素,且多因素间存在交互作用。因此,CVD危险因素防控应采取综合性的干预策略,以干预个体生活方式为基础,采取个性化药物干预和心理干预措施。
2.3.1 生活方式干预精准化不合理饮食和肥胖均与遗传因素具有交互作用,尽管国内外的众多膳食指南均提出了量化的膳食建议,但不同个体因遗传、代谢、健康状况因素影响而对营养需求存在一定差异。在人类基因组测序和基因技术进步的推动下,“营养基因组学”和“营养遗传学”出现并逐渐兴起。
饮食与肥胖相关风险基因间存在显著的交互作用,且这些交互作用在调节个人对不同饮食干预的减肥反应中起着关键作用。Locke等的一项Meta分析确定了97个与BMI相关的基因座,这97个位点解释了2.7%的BMI变异,其共同变异解释了20%的BMI变异[16]。一项研究显示,TFAP2B-rs987237与蛋白质摄入量在维持体重方面存在交互作用,相较于非肥胖风险等位基因携带者,采取高脂肪/低碳水化合物饮食的肥胖风险等位基因携带者体重下降幅度更大,而非肥胖风险等位基因携带者在低脂肪/高碳水化合物饮食中的体重减轻幅度更大[17]。
戒烟行为受心理、社会和遗传等多因素综合影响,药效学方面的基因[多巴胺通路相关基因、血清素(5-羟色胺)通路基因]和药代学方面基因(尼古丁代谢有关基因)均影响不同个体的戒烟效果。在众多参与尼古丁代谢的酶中,具有高度遗传多态性的CYP2A6酶被认为是影响尼古丁代谢速率的关键酶,其编码基因CYP2A6影响着戒烟结果,CYP2A6酶的活性和尼古丁代谢速率在吸烟者中存在极大的个体差异[18]。一项Meta分析结果显示,相较于其他CYP2A6基因型而言,携带CYP2A6*4者开始吸烟的风险更低,吸烟持续时间更短,戒烟成功率更高,尼古丁代谢速度更慢,提示CYP2A6*4多态性位点有助于吸烟者提高戒烟成功率[19]。
餐后血糖反应(PPGR)存在高度的个体差异性,不同个体对同一食物的反应具有很大的变异。David Zeevi等利用机器学习算法,整合血液参数、体力活动、自我报告的生活方式行为及肠道微生物区系的组成和功能等数据,构建了餐后血糖预测模型并能准确预测不同个体的PPGR,随后研究亦发现基于该算法进行个体化饮食干预可有效改善观察者的PPGR[20]。
2.3.2 药物干预精准化药物不良反应是临床用药中常见的现象,导致药物不良反应的因素众多,其中遗传差异是重要的因素之一。依据个体基因型选择合适的药物、规避药物不良反应风险是CVD疾病药物精准干预的重要体现。
受CYP2C19基因多态性的影响,氯吡格雷的疗效具有一系列个体间变异性,其中CYP2C19*2、CYP2C19*3等位基因是降低酶活性的突变基因,其缺失与药物反应性差有关,而CYP2C19*17等位基因是增强酶活性的突变基因[21]。在一项纳入了2331例冠心病患者的Meta分析中,1066例发生了氯吡格雷抵抗,合并分析显示CYP2C19*2基因多态性与氯吡格雷抵抗在共显性遗传模式和显性遗传模式下存在相关性,且GA和AA基因型与氯吡格雷耐药风险增加有关[22]。一项关于CYP450基因遗传谱分析和处方相关药物的研究结果显示,使用药物遗传谱可有效减少急诊就诊次数和60 d住院次数[23]。
2.3.3 心理干预精准化“生物-心理-社会”医学模式下,CVD患者“双心健康”被广泛关注,即关注患者的躯体疾病和心理健康状况并充分尊重患者的个体感受,因慢性心理社会应激与心血管疾病增加息息相关。一方面,压力刺激使促肾上腺皮质激素释放激素从下丘脑神经元释放,引发促肾上腺皮质激素分泌,导致皮质醇和儿茶酚胺分泌,使得循环中血糖、血压升高,心率加快;另一方面,焦虑抑郁情绪长期作用于下丘脑-垂体-肾上腺轴(HPA)导致HPA功能障碍,促炎细胞因子水平提高,导致炎症反应加重及内皮功能损害,长期慢性炎症反应可能是动脉粥样硬化的发生机制之一,而炎症反应也可能是抑郁发生的重要机制[24,25]。
SLC6A4甲基化水平的变化会影响应激反应,不同的5-HTTLPR基因型个体SLC6A4甲基化状态不同,其压力敏感性和疾病易感性也不同,具体地说,基因SLC6A4启动子区域43bp缺失或插入多态性(5-HTTLPR),即S等位基因或L等位基因[26]。一项Meta分析结果显示[27],LL基因型是冠心病合并抑郁症的保护因子,LL基因型的人群在脑组织能转录出更多的5-HTT的mRNA,从而表达出更多的功能蛋白;同时,LL基因型的人群脑内5-HT的回吸收率较高,脑内5-HT浓度增加,减少抑郁症发生。另一项Meta分析显示[28],携带S等位基因的个体对急性心理应激有更大的下丘脑-垂体-肾上腺轴激活,并且观察到更强的心血管反应性。
精准医学是现代医学科学发展的必然结果,而精准健康管理是大数据、人工智能和生物技术发展背景下健康管理领域的新发展。作为一种典型的慢性病,CVD具有复杂的发展机制和漫长的发病过程,其致病因素多样且彼此间交互影响,因此疾病的发展与转归具有个体差异性。在CVD健康干预过程中,必须依托大数据挖掘和基因检测技术,全面收集并分析患者的个体信息,在基于客观数据的基础上采取个体化干预措施,实现精准健康管理。CVD精准健康干预在我国尚处于起步阶段,如何精准信息采集,全面、深入挖掘不同来源的个体信息数据,汇集融合多来源多结构的健康数据,构建健康数据管理网络;如何实现CVD健康风险精准评估,提高重要指标筛选检验效能和疾病风险预测准确性;如何针对可控的疾病危险因素制定科学的CVD健康干预方案;如何实现精准监测健康干预方案日常执行情况;如何实现干预效果的精准监测和定期评估,是未来CVD精准健康干预的主要着力点。