李凌巍, 秦俊杰, 贾云龙, 吕 浩
吉林大学第一医院乐群院区 a. 消化内科, b. 急救医学科, 长春 130021
原发性肝癌是全球常见的恶性肿瘤之一,据全球最新癌症负担数据(Globocan 2020)显示,其发病率居恶性肿瘤发病第6 位,2020 年全球肝癌新增人数为90.6 万,年龄标化发病率约9.5/10 万;该病预后差,位列全球常见恶性肿瘤死因第3 位,2020 年全球肝癌死亡人数为83.0 万,年龄标化死亡率为8.7/10 万[1]。尽管当前诊疗技术迅速发展,但因肝癌起病隐匿、进展迅速,绝大部分患者确诊时已进展至肝癌晚期[2]。近些年通过针对肝炎病毒、黄曲霉素食品污染等因素的有效控制,我国肝癌发病率和死亡率呈下降趋势,但肝癌患者5 年生存率仍仅为12.1%[3-5]。同时,我国肝癌所致的伤残寿命年仍占比全球肝癌负担的近50%[6]。通过探究其与其他因素间的因果关系对揭示肝癌的深层病理机制、采取有效临床干预措施和制订公共卫生政策具有重要意义[7-9]。
针对疾病因果推断,随机对照试验(RCT)是流行病学研究中最为可靠的方法,但因其本身存在研究周期长、人力物力消耗大、涉及医学伦理等问题,很难实现科学性与可行性的统一。随着统计学与基因技术的更新迭代,基于全基因组关联研究(genome-wide association study,GWAS)大数据样本的孟德尔随机化应运而生,其是以与风险因素相关的遗传变异作为工具变量,推测风险因素与疾病之间的因果关联,能够有效规避RCT 的束缚及因果推断中的干扰问题。
肿瘤性疾病的防治迄今仍是困扰医学界的难题之一,其错综复杂的调控网络使人们对其发病机制及病因学研究仍十分受限。近年来,孟德尔随机化因其特有的优势被越来越多地应用于肿瘤性疾病的病因研究,如探索身体质量指数与肺癌[10]、乙醇摄入与食管癌[11]、睡眠特征与乳腺癌[12]等的因果效应。本文主要介绍孟德尔随机化并探讨其在肝癌研究中的应用进展,旨在为肝癌的因果关联研究提供新思路。
孟德尔随机化最初是由Katan[13]于1986 年首次提出,是一种以遗传变异作为工具变量的统计模型,利用工具变量替代暴露因素构建“工具变量-暴露-结局”的因果路径,通过“工具变量-结局”效应模拟“暴露-结局”的因果关联。孟德尔随机化以孟德尔分离定律为理论基础,即“影响亲本性状的等位基因在形成配子时,随减数分裂随机分配给子代”,因此工具变量不会受到出生后环境暴露、社会经济地位、行为因素等传统混杂因素影响;且出生后保持不变,与结局间具有时间顺序合理性,因此具有规避反向因果的独特优势。
常用孟德尔随机化包括独立样本孟德尔随机化、两样本孟德尔随机化、多变量孟德尔随机化、双向孟德尔随机化和网络孟德尔随机化等[14],其模型中工具变量的选择必须满足3 个核心假设[15-16]。(1)关联性假设:工具变量与暴露间必须是稳健的强相关关系;(2)独立性假设:工具变量不能与影响“暴露-结局”的混杂因素有关联;(3)排他性假设:工具变量只能通过暴露对结局产生效应。若不符合关联性假设,就会导致工具变量对暴露因素的解释强度不足引起弱工具变量问题;倘若违背独立性/排他性出现多效性效应将会导致无效工具变量的产生。在实际应用中,可采用孟德尔随机化-Egger[17]、漏斗图、Q检验等敏感性分析以及等位基因加权评分、众数评分法等加权法的应用来排除内生性误差导致的干扰,亦即“偏倚矫正”[18]。
孟德尔随机化研究虽能有效避免观察性研究(混杂因素、反向因果关系以及回归稀释偏倚等)和RCT(代表性和可行性问题)在进行因果推断时的限制,但当下仍存在不足:(1)核心假设的合理性是孟德尔随机化因果关联研究的前提,而弱工具变量、遗传变异多效性、连锁不平衡、人群分层等易导致核心假设的违背,如弱工具变量偏倚会导致单样本孟德尔随机化研究中暴露-结局关联被高估,而遗传多效性可能导致独立性假设或排他性假设不成立。此外,假设亦受Beavis 效应、发育代偿机制等影响[19-20]。(2)考虑到生物学复杂性的存在,复杂疾病涉及基因组、转录组、代谢组等不同层次生物学过程,孟德尔随机化只能初步判断暴露-结局间的因果关联,针对其关联机制尚未完全阐明,导致全面检验假设并获得真实的因果效应值还难以实现。(3)成果转化及应用方面存在困难。目前,孟德尔随机化研究仅能提供危险因素的终身暴露对结局的影响,难以揭示疾病不同发展阶段的因果效应,仍需更多高质量RCT 证据的补充与支持。
目前,孟德尔随机化已经在肝癌研究领域有了一定范围的应用,主要包括肠道菌群、循环代谢物、特定疾病、生活行为方式及炎症标志物与肝癌的因果关系,以下就每个领域分别进行阐述。
2.1 肠道菌群与肝癌 肠道菌群作为体内微生物的重要部分,被称为“人类的第二基因组”[21-22],其组成与结构变化与人类健康及疾病发生息息相关。近年来研究[23-25]发现肝癌宿主存在肠道菌群结构与数量的改变。Ren等[24]通过对早期肝癌、肝硬化患者肠道菌群特征分析,发现肝癌组和肝硬化组的肠道菌群多样性对比健康对照组发生明显改变,尤以肝癌组改变最为明显,如产脂多糖菌属显著增加,而丁酸盐产生菌显著减少。这种特异改变提示可以通过菌群特异性分析作为早期肝癌的非侵入性诊断工具。为了进一步验证肠道菌群与肝癌发生发展的因果关系,Ma 等[26]通过利用肠道微生物组和肝癌的GWAS 汇总数据进行两样本孟德尔随机化研究,共筛选出14~21 个单核苷酸多态性(single nucleotide polymorphism,SNP)(包括2 个科和2 个属的肠道微生物组)用于孟德尔随机化分析,研究发现瘤胃菌科(OR=0.46,95%CI:0.26~0.82,P=0.009)和紫单胞菌属(OR=0.59,95%CI:0.42~0.83,P=0.003)与肝癌具有保护性因果关系,以及紫单胞菌科(OR=0.36,95%CI:0.14~0.94,P=0.036)和拟杆菌属(OR=0.55,95%CI:0.34~0.90,P=0.017)与肝癌具有保护性因果关系,并使用临床病例对照测序数据验证了这一因果关系,得出瘤胃菌科、紫单胞菌科及拟杆菌属相对丰度增加可以降低肝癌发生风险,提示该类菌群可能是预防和治疗肝癌的潜在手段,对预防和控制肝癌发生具有重要意义。但由于生物学机制复杂性,肠道菌群与肝癌之间的双向因果关系仍需更多证据论证。
2.2 甲状腺功能减退与肝癌 甲状腺激素的主要生理作用是促进机体新陈代谢,维持机体的正常生长发育,而肝脏是其主要代谢场所,在其合成、转化及灭活中发挥重要作用。目前临床研究发现甲状腺激素/甲状腺激素受体参与多种癌症进展,包括卵巢癌、前列腺癌、乳腺癌、肝癌、肺癌及结直肠癌等[27-31]。Pinter 等[32]研究发现促甲状腺激素(thyroid stimulating hormone,TSH)和游离甲状腺素(free thyroxine,FT4)水平与肿瘤大小高度相关,且高浓度FT4 与不良预后独立相关。Sahin 等[33]通过对比研究肝硬化后肝癌患者,发现肝癌组血清游离三碘甲状腺原氨酸水平显著高于肝硬化组,提示其与肝癌的发生发展有密切关系。Chu 等[34]研究发现较高水平TSH和FT4与良好的肿瘤无进展期及总体生存率独立相关,但这种相关性在针对接受索拉非尼治疗以及全身化疗的晚期肝癌患者中截然相反。Hassan 等[35]和Reddy等[36]通过病例对照研究发现,持续时间超过3 年的甲状腺功能减退患者发生肝癌风险显著增加,女性患者尤甚,提示甲状腺功能减退可能是肝癌的独立危险因素。Bruck 等[37]和Oren 等[38]通过药理学诱导大鼠甲状腺功能减退发现其可改善大鼠肝纤维化,而甲状腺功能亢进加剧肝硬化进展。以上观察性研究均表明,异常的甲状腺激素水平与肝病发展密切相关。Yuan 等[39]通过孟德尔随机化研究并没有发现甲状腺激素与肝癌之间存在因果关联(OR=0.82,95%CI:0.55~1.23,P=0.336),而Lu等[40]通过扩大研究人群样本量(337 159名欧洲裔)后发现甲状腺功能减退与肝癌之间存在负相关(OR=0.997,95%CI:0.995~0.999,P=0.016),同时发现TSH 水平和FT4 水平与肝癌风险没有直接的因果关系,说明甲状腺功能减退对肝癌的保护作用可能不是通过甲状腺激素实现的,具体机制还有待进一步研究。值得指出的是,该研究中TSH 和FT4 相关暴露样本量较少(72 167 个),未来仍需进一步扩大样本量明确其与肝癌之间的因果关系。
2.3 生活方式因素与肝癌 观察性研究显示许多生活方式因素与肝癌风险相关,但这些生活方式与肝癌之间是否存在明确的因果关联以及通过改变这些因素是否能降低肝癌的患病风险尚不清楚。肥胖被认为是促进肿瘤发生的一个因素,吴燕梅[41]在中国人群中首次利用孟德尔随机化方法探讨肥胖与肝癌发生的因果关联,发现肥胖可能为肝癌发生的危险因素。而Zhang等[42]通过临床试验和孟德尔随机化研究发现肥胖在女性肝癌患病中起保护作用,通过生物信息学分析确定钴胺素相关A 代谢基因(metabolism of cobalamin-associated A,MMAA)为肥胖差异基因及肝癌的预后指标,并证明了MMAA 是雌激素受体1 的下游作用靶点,雌激素受体1 通过调控MMAA在肝癌中的过表达抑制癌细胞的增殖、迁移和侵袭,增加细胞凋亡率,并维持了线粒体功能障碍所致的氧化还原平衡,进一步阐明了肥胖可能是女性肝癌患者的保护因素。
目前,众多研究显示饮酒是肝癌的危险因素之一[43],尽管大量饮酒与患肝癌的风险有较好的相关性,但低至中度饮酒是否与肝癌患病风险成反比仍存在争议。Liu等[44]通过前瞻性队列研究和非线性孟德尔随机化分析发现,饮酒(仅指葡萄酒)与肝癌患病低风险亚组(如女性、年龄<60 岁,以及ALT 水平正常和无风险基因变异的人群)呈J型相关,这也证实了先前的研究结果[45-46]:低至中度饮酒与肝癌患病风险呈负相关。同时该研究指出针对肝癌患病的高风险亚组(包括男性、年龄≥60 岁、ALT异常以及携带PNPLA3 rs738409 和TM6SF2 rs58542926风险等位基因)人群,其饮酒与肝癌风险之间存在线性关系,应完全戒酒。同样,很多学者[47-50]针对饮食习惯与肝癌的孟德尔随机化研究发现曾经/从未饮酒和饮酒量与肝癌风险呈正相关(不饮酒者患肝癌的风险增加41%),而咖啡、茶、奶制品等的摄入与肝癌患病风险成反比。
2.4 循环代谢物与肝癌 目前,维生素D因其抗肿瘤效应在肿瘤病因学研究中备受瞩目,但结论不一。多项观察性流行病学研究[51-52]表示维生素D 水平与多种癌症风险呈显著负相关,尤其对肝癌患病风险影响最大。Lange等[53]通过孟德尔随机化探索维生素D 与肝癌关系的研究却表明,维生素D 水平降低可能与丙型肝炎患者进展为肝癌的风险有关,但未发现维生素D 与经抗病毒治疗后的HCV感染相关肝癌存在因果关联,提示维生素D 对丙型肝炎相关肝癌发生有特定的影响。Liu 等[54]应用两样本孟德尔随机化研究发现血液高水平25(OH)D(≥20 ng/mL 与肝癌患病风险相关(OR=5.48,95%CI:2.91~10.30,P<0.001),且通过循环中25(OH)D 水平与其相关rs12785878基因的交互作用可以显著延长肝癌患者的总生存期和无瘤生存期,但并没有发现25(OH)D浓度相关的基因变异与肝癌复发和死亡率之间有关联。需指出的是该研究仅筛选出6 个SNP,同时缺少对混杂变量(如户外活动时间等)的调整。而钟旋[55]针对我国南方人群使用孟德尔随机化方法探讨维生素D 水平/缺乏与肝癌发病风险,利用遗传变异构建遗传风险评分,代替单一变异作为工具变量,解决了常见变异的弱工具变量问题以及受基因多效性影响等弊端,提高了工具变量的效率,并在此基础上进行敏感性分析,并未发现维生素D水平/缺乏对肝癌的发生风险有影响。未来仍需纳入更多遗传变异、更大规模的孟德尔随机化研究进一步去验证。此外,多项RCT的Meta分析显示补充维生素D有助于降低癌症死亡率,而不是癌症发病率[56-57],后续研究或可进一步探讨维生素D 与肝癌预后进展或死亡之间的关系。
观察性研究[58-61]显示癌症患者的循环TGF-β1 浓度明显高于健康对照组,Lu 等[62]通过选择TGF-β1 基因C-509T多态性作为工具变量,检验血清TGF-β1与肝癌的因果关系,发现C-509T多态性与肝癌没有关联,但其与循环TGF-β1的关联具有统计学意义,进一步孟德尔随机化分析表明,在同种基因型和显性模式下,循环TGF-β1 每增加一单位,肝癌风险各增加38%(95%CI:1.03~4.65)和49%(95%CI:1.01~6.06),从而确定了血清TGF-β1升高与肝癌患病风险增加有因果关联。
Yuan 等[63]利用两样本孟德尔随机化研究铁状态与癌症风险,发现铁状态与肝癌患病风险呈正相关,但其只筛选到3个SNP作为工具变量,存在弱工具变量问题。而Tian 等[8]进一步利用单变量和多变量孟德尔随机化分析并没有发现铁状态(血清铁、铁蛋白、转铁蛋白)与肝癌风险之间的因果关系,但该项GWAS 数据病例规模较小且病例对照比不平衡,存在统计效能偏差,未来仍需更加完善的GWAS数据进一步验证。
2.5 炎症标志物与肝癌 炎症细胞浸润与肿瘤的发生、发展及临床疗效密切相关,有学者[64]发现白细胞端粒长度与肝癌之间存在U 型因果联系,即端粒长度的增加或减少均会导致肝癌患病风险的增加。Pan 等[65]首次利用多变量孟德尔随机化探究白细胞亚型计数与肝细胞癌风险之间的因果关系,发现在欧洲裔人群中,基因预测的低嗜碱性粒细胞总数与肝细胞癌患病风险存在因果关联,这一发现为临床医生诊疗肝细胞癌提供了新思路,但仍需在不同人群中进一步验证。
孟德尔随机化作为一种非常强大的流行病学研究方法,随着GWAS 数据不断开发及孟德尔随机化模型的不断规范,被越来越多地应用于探索疾病的危险因素、疾病的中间机制和复杂疾病间的双向因果关联等。然而,由于基因的复杂性,其潜在相关生物学机制仍无法充分阐明,但这无法掩盖其为疾病间的因果关联探索提供的宝贵思路,相信随着遗传流行病学的不断发展及统计学算法的不断完善,孟德尔随机化有望成为传统观察性研究与RCT之间因果证据链的重要纽带。
利益冲突声明:本文不存在任何利益冲突。
作者贡献声明:李凌巍负责课题设计,撰写论文;李凌巍、秦俊杰、贾云龙参与文献搜集,修改论文并最后定稿;吕浩负责拟定写作思路,指导撰写文章。