郭紫薇, 武庆娟, 叶永安, 陈兰羽, 吕文良
1 中国中医科学院广安门医院感染疾病科, 北京 100053
2 北京中医药大学东直门医院脾胃科, 北京 100700
非酒精性脂肪性肝病(NAFLD)是指除外酒精和其他明确肝损伤因素所致的以肝细胞内脂肪过度沉积为主要特征的临床病理综合征[1-3]。近期发表的一项纳入120余万人的系统评价和荟萃分析报告[4]指出,NAFLD正影响着全球约30%的人群,且影响范围仍有扩大趋势。2023年,欧洲肝病学会(EASL)提出将NAFLD更名为代谢功能障碍相关脂肪性肝病(metabolic dysfunctionassociated steatotic liver disease,MASLD)[5]。NAFLD的发病机制是一个复杂的过程,涉及多种因素的相互作用,如胰岛素抵抗、氧化应激、炎症因子、肠道菌群失调等,而遗传因素也被证明影响NAFLD的疾病进展,这种影响被认为是遗传变异和环境因素之间相互作用的结果[6]。
近年来,基于全基因组关联研究(genome-wide association study,GWAS)的大样本的孟德尔随机化(mendelian randomization,MR)研究方法越来越广泛地应用于多种疾病的高危因素探索中,其采用单核苷酸多态性(single nucleotide polymorphisms,SNP),也就是遗传变异作为工具变量(instrumental variables,IV),对风险因素和疾病之间进行因果推断[7-8]。随着肝病领域多项大规模GWAS的公开发布,使得利用MR方法进行相关慢性肝病危险因素的评估成为可能,且探索NAFLD的病因和高危因素具有重要临床意义。本文将围绕目前MR方法及其在NAFLD的病因探索中的应用进行综述,从而为NAFLD的病因学研究和预防策略提供依据。
随机对照研究(RCT)在循证医学中证据级别最高[9],其核心在于随机分组,可最大程度地避免临床试验设计及实施中可能出现的各种偏倚,平衡混杂因素,提高统计学检验的有效性等优势[10]。然而,由于其受到伦理学、受试者依从性、研究期限等因素的制约,理想的设计和实施存在一定差距。另外,RCT中纳入排除标准的限制可能导致研究样本与真实世界的人群出现异质性,致使研究结论的外推性也有待验证[11]。传统观察性研究的方法原则为非干预性、非随机化,因受大量混杂和反向因果干扰,结论无法推断因果[12]。为克服上述问题,MR引入计量经济学中IV法的思想,其基于全基因组测序数据,以遗传变异作为IV,用于揭露结局与暴露之间的因果关系。该研究方法以孟德尔遗传定律为基础,在减数分裂过程中,遗传变异随机分配到子代中,并且在此后保持不变,这使得其相比于传统的观察性研究,更少受到混杂与偏倚因素的干扰[13]。1986年,Katan[14]提出不同等位基因决定了不同载脂蛋白E亚型,进而通过调控胆固醇水平的高低影响人群中癌症发病率的差异,是MR概念的雏形。2004年,Thomas和Conti[15]提出使用遗传信息作为IV来进行流行病学的因果推断的模型有效性。IV的选择需要满足3个基本条件:(1)关联性假设,即IV和暴露因素相关;(2)独立性假设,即IV与暴露因素和结局之间的混杂因素无关;(3)排他性假设,即IV只能通过暴露因素影响结局。利用遗传变异作为IV的主要优势在于:遗传变异的形成独立于社会环境、生活习性和其他性状,这一特性保证了各个混杂因素在遗传变异的不同亚组间的均衡性,理论上避免了混杂因素的影响;另一方面,遗传变异的形成先于环境暴露、混杂及疾病结局的发生及水平变化,由遗传变异作为暴露的IV所解释的暴露变异亦先于结局,由此排除了逆向因果问题[10,16]。
早期的MR研究通常在小样本人群中的观察性研究中进行,且仅使用了少量的遗传变异,这使得MR研究的效力较低。然而,随着生物学界发现了大量与特定性状紧密相关的遗传变异,以及数十万个暴露和疾病与遗传变异相关的GWAS汇总数据的公开发布,使这一领域发生了一场革命。近十年来,MR分析已成为医学领域尤其是流行病学病因探索研究的热门统计学技术,不仅为多种复杂疾病的病因及治疗提供科学依据,还为新药研发、公共卫生决策的制定提供了参考与指导[17]。
2.1 验证疾病或病理状况与NAFLD发生风险的因果关系 既往流行病学研究[18-19]提示,NAFLD可显著增加心血管疾病、慢性肾病、肝外肿瘤等常见慢性病的发病风险。NAFLD是这些疾病的“病因”之一,还是仅为此类疾病发病过程中的一个伴随状态,目前仍不清楚。MR在NAFLD病因的探索中,一定程度上确定和排除了一些疾病或病理状况与NAFLD发生风险的因果关系。如关于NAFLD在冠状动脉疾病(CAD)的发病机制中是积极的贡献者还是无辜的旁观者,一直存在争议。陈兴栋团队[20]利用GWAS汇总数据,构建出一套MR分析框架,系统分析NAFLD与34种常见肝外疾病的因果关联。为了筛选合格的IV,研究人员共进行3轮MR分析,并发现NAFLD与2型糖尿病、高血压、心肌梗死、老年痴呆等9种疾病存在显著且稳健的因果关联。Ren等[21]通过双样本MR分析,以评估遗传预测的NAFLD与CAD风险之间的关系,该研究结果显示,在排除与极低密度脂蛋白(VLDL)分泌受损相关的遗传变异后,遗传预测的NAFLD和CAD之间存在强相关。此外,吕国悦等[22]首次采用英国生物银行约30多万人的数据,通过MR法评估肌减少症相关指标(肌肉量和握力)和NAFLD的关系。该研究结果发现,肌肉量和握力的下降和NAFLD的严重程度密切相关,并提示运动能力的改善可有效缓解NAFLD的严重程度。然而,该研究提示的只是一种相关关系,而非因果关系,在一定程度上表明MR研究的暴露水平是由遗传变异决定的,并不等价于传统的暴露,因此MR研究可能容易获得阴性结果。近期还有研究发现NAFLD与多囊卵巢综合征(PCOS)之间存在关联,但这种关联的因果性质仍不确定。Liu等[23]基于“肝-卵巢轴”,采用双向MR分析,检验NAFLD和PCOS之间的因果关系。该研究表明,遗传预测的NAFLD与患PCOS的高风险有关,其中,空腹胰岛素和性激素可能介导NAFLD和PCOS之间的联系,但反之证据较少。有研究[24]试图在大型队列中使用双样本MR分析方法探索NAFLD是否会增加患重症新型冠状病毒感染(COVID-19)的风险。该研究中单变量分析表明NAFLD与重症COVID-19之间存在显著关联[比值比(OR)=3.06,P=1.07×10-6]。然而,在调整了人口统计学和合并症因素后,这种关联消失了(OR=1.57,P=0.09)。笔者认为,虽然在人群水平上,NAFLD可能与严重的COVID-19发病风险相关,但这种关联很可能受到NAFLD合并症后的其他代谢紊乱的干扰。因此,目前尚无确切证据支持NAFLD是重症COVID-19的致病危险因素。其他相关MR研究还探索了中风[25]、2型糖尿病[26]、甲状腺功能减退症[27]、银屑病[28]、炎症性肠病[28]、幽门螺旋杆菌感染[29]、胰腺癌[30]等疾病或病理状况与NAFLD发生风险的因果关联,亦联合诸如美国国家健康与营养调查(National Health And Nutrition Examination Survey,NHANES)等数据库,评估NAFLD患者中某一疾病与NAFLD进展风险之间的关系[31],进一步强调了预防和管理NAFLD在临床与公共卫生实践中的重要性。
2.2 确认和揭示生活方式、代谢相关指标、血清参数对NAFLD的潜在影响 生活方式的改变可能会对公众健康产生重大影响,诸多流行病学证据表明,咖啡摄入、糖摄入、久坐等生活方式均是NAFLD发生的危险因素,但这些生活方式是否与NAFLD之间有明确的因果关系以及改变这些因素是否会降低NAFLD的患病风险尚不清楚[32]。此外,循环脂质等代谢相关指标、血清参数与NAFLD之间的关系也一直是研究的热点。然而,上述相关研究均是风险因素或生物标志物的“相关性”研究,而鲜有大队列研究聚焦因果关联,全面、系统地评估NAFLD和危险因素的“因果性”仍具挑战。Xie等[33]基于单变量和多变量MR分析,发现饮酒频率、血清肝功能相关酶升高、身体状况不佳、肥胖、2型糖尿病、高血压可增加NAFLD的发病风险,而高学历和高密度脂蛋白胆固醇与NAFLD风险降低相关。此外,轻度体育锻炼与NAFLD呈弱相关,而吸烟、咖啡、睡眠、剧烈运动等均无显著相关性。既往观察性研究显示,NAFLD与血清尿酸(SUA)水平高度相关,但由于反向因果关系,这些研究存在固有的偏倚风险。Li等[34]通过双向MR分析支持NAFLD导致SUA水平升高的因果关系,但该研究并未证实SUA水平与NAFLD风险之间的潜在因果关联,且仍需更深入的研究来解释相关机制。尽管在一些临床试验中观察到维生素D具有改善肝脏对胰岛素的反应以及减轻肝脏炎症和改善肝功能等治疗效果,但其与NAFLD之间的因果关系尚未阐明。Yuan等[35]的一项MR研究通过大样本数据证实,维生素D水平的增加在欧洲人群的NAFLD预防中发挥作用。Chen等[36]采用9个与全基因组血浆磷脂花生四烯酸(AA)显著相关的SNP作为IV,旨在通过MR分析确定AA与NAFLD之间的因果关系。研究表明,AA水平每增加一个标准差,NAFLD的发生风险随之增加(OR=1.06,95%CI:1.02~1.11,P=0.008),即高水平的AA与NAFLD风险存在潜在因果关联。既往研究亦发现,在NAFLD发生发展过程中,补体系统被激活,且补体水平与肝脏损伤程度呈平行关系,关于补体系统与NAFLD因果关系的研究证据目前尚不充分。Li等[37]基于广西防城港男性健康队列,在横断面和纵向研究设计基础上,结合双向MR分析方法,探讨了血清补体C3和C4与NAFLD发生发展的因果关系。该研究结果证实,NAFLD是导致人体血清补体C3水平升高的原因,但血清补体C3水平升高并不是导致NAFLD发生风险升高的原因。该研究为遗传因素决定的补体C3、C4与NAFLD之间的因果关系提供了新的证据,血清补体C3水平的变化可考虑作为NAFLD患者临床治疗中判断疾病进展程度的辅助观察指标。此外,一些研究也采用MR法分析了其他因素如习惯性咖啡摄入量[38]、睡眠特征[39]、大麻的摄入[40]、486种血液代谢物[41]、同型半胱氨酸及叶酸[42]、循环半乳糖凝集素[43]等生活方式、代谢相关指标或血清参数与NAFLD发病风险的潜在关联。基于以上相关研究,笔者认为,在解释MR结果时尚需考虑其局限性,如连锁不平衡(LD)、样本重叠、弱IV偏倚的存在、统计能力不足以及难以通过结果解释潜在作用机制等,以最大限度地减少研究结果因水平多效性而可能产生的偏倚。
2.3 探索社会经济因素及社会环境与疾病的关联 目前,探索社会经济因素及社会环境与疾病相关联的研究相对有限。Kong等[44]旨在探索低出生体质量与NAFLD的因果关联,并确定潜在的代谢介质及其与该关联的中介作用。该研究显示出生体质量每降低1个标准差,未来NAFLD的风险增加45%,并且在调整儿童肥胖、成年人肥胖特征以后,这种关联仍然存在。同时,通过两步MR法确定了其中潜在的中介变量,包括空腹胰岛素、亮氨酸、异亮氨酸、缬氨酸、丙氨酸和单不饱和脂肪酸等,而空腹血糖、糖化血红蛋白、高密度脂蛋白等被证明不在其中发挥中介作用。此外,抑郁症与胃肠道疾病之间关联的因果关系尚未确定,有研究者通过MR分析,系统地探索了抑郁症与包括NAFLD在内的24种胃肠道疾病的关联。该研究在全基因组显著性水平上选择与抑郁症相关的独立遗传变异作为IV,同时采用多变量MR分析探讨体质量指数(BMI)、吸烟和2型糖尿病的中介作用。经过多次测试校正后,结果显示抑郁症的遗传易感性与NAFLD风险增加有关(OR=1.46,95%CI:1.15~1.85,P=0.002),且二者之间的关联在很大程度上由BMI介导[45]。过去的观察性研究中一直将高等教育等社会经济因素与疾病风险的降低联系起来,如冠心病[46]、COVID-19[47]等。因此,从社会经济角度评估诸如教育年限、母亲在怀孕期间吸烟、儿童认知能力、精神分裂症等与NAFLD的关联,对于探索NAFLD的早期干预具有重要意义。
此外,除上述MR在NAFLD病因探索中具有广泛应用外,MR也被越来越多地运用于寻找NAFLD治疗的新药物作用靶点。如观察性研究发现,血脂异常是NAFLD的危险因素,他汀可能会降低NAFLD的发生风险。吴永健团队的一项MR研究[48]结果显示,他汀、贝特类药物、依折麦布、PCSK9抑制剂、胆汁酸螯合剂、血管生成素样3(ANGPTL3)抑制剂、靶向载脂蛋白C-Ⅲ(APOC3)mRNA的反义寡核苷酸等降脂药物均无助于降低脂肪肝风险。同时,各血脂指标对NAFLD风险均无明显影响,且在9个降脂药物靶点(HMGCR、NPC1L1、PCSK9、ABCG5/ABCG8、APOB、LDLR、ANGPTL3、APOC3、LPL)中,脂蛋白脂肪酶(LPL)是唯一可显著降低NAFLD风险的药物靶点。LPL在NAFLD中的作用机制可能是通过调节胰岛素水平而非通过降脂发挥作用。因此,笔者认为,MR作为药物靶点发现的一个有效工具,涉及受体、酶、离子通道、转运体、免疫系统、基因等,将其越来越多地运用于NAFLD相关药物的探索中,对于识别和筛选NAFLD潜在的药物靶点、致病因子和生物标志物具有重要的临床意义。
MR遵循“亲代等位基因随机分配给子代”的遗传定律,推断暴露与结局是否存在因果关联,能有效避免遗传变异受到后天混杂因素的影响,为流行病学研究中因果关联的推断提供了新的视角。此外,笔者认为MR研究通过构建“遗传变异-风险因素-疾病结局”的模型,探索各种因素如疾病、环境、社会、行为、心理等与疾病之间潜在因果关联等设想与中医整体和辩证论治观念不谋而合,对于某一危险因素与疾病间存在相关性但先后顺序不明的情况,可将中医临床与双向MR研究进行结合,从而检验两者间的因果效应及效应的方向。然而,MR研究应用于中医药领域面临诸多挑战,如中医药相关的GWAS可用数据库相对局限,且暂无传统医学诊断及证型分类数据。因此,MR在中医药领域的研究将处于长期探索阶段。
随着GWAS数据生成成本的降低以及MR模型应用规范的制订,MR将进一步丰富NAFLD疾病关联网络,成为研究NAFLD等疾病中因果关系的有力工具之一,越来越多地被用于探索该病的危险因素、中间机制和与其他复杂疾病间的双向因果关系,这些研究将更兼顾科学性与可行性的统一,有望成为因果证据链中连接传统观察性研究和RCT的重要纽带。未来研究者应当注意避免该研究方法本身存在的局限性,遵循相关指南和共识规范,发现更多与NAFLD发病风险相关的遗传变异,为干预和治疗NAFLD提供可靠的指导性意见,从而更好地为临床服务。
利益冲突声明:本文不存在任何利益冲突。
作者贡献声明:郭紫薇参与选题,撰写论文;武庆娟参与检索文献,数据提取,修改论文;叶永安、陈兰羽、吕文良负责拟定写作思路,指导撰写文章并最后定稿。