朱晶晶 余勇夫 许慧琳 秦国友,4
1 复旦大学公共卫生学院生物统计学教研室,200032 上海; 2 上海市闵行区疾病预防控制中心,201100 上海;3 复旦大学公共卫生学院闵行分院, 201101 上海; 4 复旦大学公共卫生安全教育部重点实验室,200032 上海
高血压作为心血管疾病和死亡的主要风险因素,造成了严重的疾病负担,全球每年有760万人死于高血压[1-2]。同时,癌症的发病率和死亡率也已成为一个世界性的公共卫生问题,在2017年有2 450万新病例和960万人死亡[3]。随着人口老龄化的发展,肿瘤合并高血压的患者大幅增加,越来越多的研究关注高血压和肿瘤的内在关系,引出了“肿瘤-高血压”这一概念。研究显示,血压升高会增加癌症的发病风险和死亡风险[4-6]。此外,肥胖作为高血压和肿瘤共同的危险因素,影响高血压和肿瘤的发生发展[7]。大量流行病学数据表明,体质量指数(BMI)升高与常见和较少见的恶性肿瘤风险增加相关[8]。国际上推荐将控制肥胖和降低体质量作为预防和控制高血压和癌症的手段。然而,关于高血压人群中BMI和癌症之间关系的研究相对有限。1项包含363 992名瑞典男性的队列研究发现,随着舒张压和BMI的增加,患肾细胞癌的风险持续上升[9]。 此外,先前的研究都使用Cox比例风险模型来评估BMI对癌症发病影响,基于BMI的效应不会随时间改变这一等比例风险假设。如果将违反PH假设的时变因素作为与时间无关的变量纳入模型,将会获得有偏估计,而传统Cox模型也有可能忽略感兴趣的变量仅在特定随访时间内对结局的影响。因此,检测和考虑时变效应在建模过程中至关重要,有助于提供更有价值的随时间变化的效应信息。但是,目前还没有研究探索在高血压患者中BMI对癌症发生的时变效应。在中国,高血压患者数量正在逐年增加。因此,本研究进行了1项大样本量的回顾性队列研究,收集了上海市闵行区电子健康信息系统(EHR)的数据,采用变系数Cox 回归模型研究高血压人群中的基线BMI与癌症发病风险之间的关联,为高血压患者的体质量管理提供建议,以期降低癌症发病风险、提高生存质量。
从上海市闵行区EHR中选取2007—2015年记录的成年高血压患者作为研究对象。排除标准:①人口统计数据缺失;②非上海永久登记居民;③基线年龄<20岁或≥85岁;④随访时间少于3个月;⑤身高/体质量数据缺失或BMI极端的数据(≥40.0 kg/m2);⑥其他风险因素数据缺失。
采用回顾性队列研究,开始随访时间为首次记录患者的时间,观察截止时间为2018年12月31日。观察结局为癌症发生,截尾删失情况包括失访、癌症发病前死亡及观察结束时未发生癌症的患者。EHR记录了患者的基线信息和随访状态,包括性别、年龄、自我报告的身高和体质量、主要慢性病家族史、糖尿病综合征以及吸烟、饮酒和体育锻炼情况。
根据世界卫生组织(WHO)指南,高血压定义为收缩压≥18.67 kPa(140 mmHg)和/或舒张压≥12.00 kPa(90 mmHg)。糖尿病综合征定义为空腹血糖≥7.0 mmol/L (126 mg/dL)或2 h血糖≥11.1 mmol/L (200 mg/dL)。BMI的计算使用登记之日记录的自报身高和体质量。根据世界卫生组织对亚洲人口的BMI的分类建议,将患者分为低体质量(<18.5 kg/m2),正常体质量(18.5~22.9 kg/m2),超体质量(23~24.9 kg/m2),一级肥胖(25~29.9 kg/m2),二级肥胖(≥30 kg/m2)5组[10]。癌症发病参照国际疾病分类ICD-10(编码C00-D49)标准。所有疾病均由医生进行确诊。吸烟定义为每天吸烟至少持续1年,包括戒烟。规律饮酒定义为每周至少2次饮酒持续1年。规律锻炼定义为每周至少进行150 min的中等强度运动或75 min的高强度运动。
使用SAS 9.4软件进行统计分析。双侧检验,检验水准α=0.05。偏态分布的定量资料采用中位数(M)和四分位数(P25,P75)进行描述,定性资料采用例数(n)和构成比(%)进行描述。Pearson卡方检验和Kruskal-Wallis检验用于评估不同BMI组患者的基线特征及不同患者的癌症发病率。使用有向无环图描述变量之间的关系以识别潜在的混杂因素,二分类变量直接纳入模型,多分类变量设置为哑变量纳入模型。使用Cox比例风险模型评估高血压患者中基线BMI对癌症发病的风险比(HR)及95%置信区间(CI)。
1.4.1 变系数Cox回归模型
基线BMI以正常体质量为参照组,通过拟合BMI与时间的限制性立方样条(restricted cubic splines,RCS)函数来评估其是否满足等比例风险(proportional hazards,PH)假设[11]。公式如下:
h(t)=h0(t)exp{β1BMI+β2BMIt+β3BMIS(t)+βX},
式中,h(t)是在危险因素X的影响下,t时刻的风险函数;h0(t)是所有自变量为0时;t时刻的基准风险函数;X表示混杂因素;t表示随访时间;S(t)表示立方样条时间函数的非线性部分;ti(i=1,2,3) 表示3个节点所在的时间,节点放置在第10、50和90百分位数。在此过程中进行了3次统计检验,分别对应于3个零假设和P值。1)H0:β1=β2=β3=0,P<0.05代表BMI与癌症发生存在相关性。2)H0:β2=β3=0,P<0.05代表BMI违反了PH假设,需要与时间进行交互作用。3)H0:β3=0,P<0.05代表BMI的效应随时间呈非线性变化;反之,效应呈线性变化,公式为:
h(t)=h0(t)exp{β1BMI+β2BMIt+βX}。
1.4.2 敏感性分析
根据性别和年龄进行分层分析。在敏感性分析中,为了防止新发和长期高血压患者对死亡结局的不同影响,本研究将分析限制在随访超过2年的患者中。其次,排除随访2年内发生癌症的患者进一步分析以减少可能存在的因果倒置影响。此外,将研究限制在未患有糖尿病综合征的患者中,因为高血压在许多方面与糖尿病共享病理生理机制[12]。最后,由于高血压的患病率在不同年龄阶段显著不同,研究排除年龄小于40岁的患者以控制年龄的不均衡分布[13]。
该研究纳入212 394名高血压患者,其中男性99 038名和女性113 356名,平均年龄62.6(P25,P75:55.3,72.1)岁,小于60岁占40.7%(86 407/212 394),大于等于60岁占59.3%(125 987/212 394)。患者中正常体质量、超体质量和肥胖者,分别占33.0%、28.5%和32.3%,低体质量患者占2.4%,二级肥胖患者占3.8%。与体质量正常,超体质量或肥胖的患者相比,低体质量的高血压患者有较低的糖尿病合并症、慢性病家族史、吸烟和饮酒者比例。值得注意的是,体质量过轻的高血压患者平均年龄更大。见表1。
表1 高血压患者中基线BMI水平的特征描述
表1 (续)
在9.5(P25,P75:6.2,10.6)年的随访时间中,患者癌症发病率为10.4%(22 141/212 394)。相比于正常体质量、超体质量、一级肥胖和二级肥胖,低体质量患者具有相对较高的癌症发病率,为13.9%。男性相比于女性也有更高的癌症发病率,分别为11.1%和9.8%。老年人(≥60岁)的癌症发病率为13.0%,要明显高于中青年患者(6.7%)。见表2。
表2 不同基线信息高血压患者的癌症发病情况
2.3.1 单因素分析
相比于正常体质量,超体质量、一级肥胖和二级肥胖都对高血压患者的癌症发病风险具有时变的保护效应,一级肥胖的HR在10年随访中相对稳定,而超体质量和二级肥胖的HR随着时间逐渐增加。反之,低体质量患者与较高的癌症发病风险相关,HR在随访期间逐渐降低,在第10年时危险效应不具有统计学意义。见表3。
表3 高血压患者中基线BMI对癌症发生的时变效应(n=212 394)
2.3.2 多因素Cox回归分析
(1)基线BMI对癌症发病的时变效应
通过有向无环图识别潜在的混杂因素,最终纳入模型的混杂变量包括性别、年龄、心血管家族史、糖尿病家族史、卒中家族史、高血压家族史、吸烟、锻炼和饮酒。多因素回归分析发现不同BMI类别对癌症发病的影响会随着随访时间发生变化。低体质量与随访期间较高的癌症发病风险相关,HR从随访1年的1.65(95%CI:1.42~1.91)降至随访5年的1.30(95%CI:1.19~1.41),在随访10年时其危险效应不具有统计学意义。相比之下,超体质量和一级肥胖的癌症发病风险相比于正常体质量更低,超体质量的保护作用在随访期间逐渐减弱,随访1年和10年的HR为0.86(0.80~0.93),1.04(0.99~1.08);而一级肥胖具有较为稳定的保护效应,随访1年和10年的HR为0.86(0.82~0.90),0.87(0.83~0.90)。此外,二级肥胖对癌症发病的影响与正常体质量区别没有统计学意义。见表3。
(2)不同性别和年龄层中基线BMI对癌症发病的时变效应
在按性别和年龄组(<60岁或≥60岁)进行的分层分析中,不同BMI类别的这些时变模式与全人群相似。无论是男性还是女性、中青年还是老年患者,都可以在随访前5年观察到低体质量对癌症发病的危险效应。一级肥胖随时间相对稳定的保护效应也可以在各亚组观察到。见表4。
表4 不同性别和年龄层中基线BMI对癌症发生的时变效应
2.3.3 敏感性分析
高血压患者的基线BMI对癌症发病的时变影响的敏感性分析结果见图1。在敏感性分析中剔除登记后2年内发生癌症的患者,排除随访时间小于2年的患者,控制年龄大于等于40岁及未患有糖尿病综合征的患者,体质量指数和癌症发病之间关系的变化呈现相似的结果,即低体质量高血压患者有更高的癌症发病风险,但其风险呈下降趋势;同时也可以观察到超体质量和一级肥胖的HR随着时间缓慢上升。
随着高血压患病率在我国逐渐增加,高血压疾病的健康管理越来越引起重视。本研究利用上海市闵行区EHR数据,采用变系数Cox模型研究在高血压患者中基线BMI和癌症发病风险之间的关联,为高血压患者的体质量管理提供建议,降低癌症发病率。
本研究发现在高血压患者中低体质量与较高的癌症发病风险相关,这与以往的研究结果一致[14-15]。1项包含137 366名参与者的队列研究显示,与正常体质量相比,男性低体质量者胃癌(HR=3.82,95%CI:1.97~7.38)和肝癌(HR=3.00,95%CI:1.36~6.65)的发病风险增加[14]。体质量过轻的患者更有可能出现低脂肪组织和瘦肉率,导致机体免疫力降低,出现不良结局[16]。同时,也有研究表明,已存在的严重慢性疾病(糖尿病、慢性心力衰竭等)或癌前病变(胃癌的癌前病变)以及伴随的不健康生活方式(过度吸烟和饮酒)可能会导致体质量降低,影响BMI和癌症发病的关联[17]。因此,我们在进一步分析中调整了吸烟、饮酒、运动,分别排除患有糖尿病合并症和2年内死亡的患者,观察到的相似结果表明存在反向因果效应的可能性较小。值得注意的是,低体质量的不良影响仅在随访5年中观察到,后续随访期间内体质量的改变可能会影响其与癌症发生的关系。上述队列研究也表明,在某些特定的癌症类型中,低体质量与高癌症发病风险之间没有显著的关联。因此,我们需要进行更深入的研究,纳入动态BMI的变化来探索低体质量和不同类型癌症之间的关联。
A:排除2年内发生癌症的高血压患者;B:排除随访时间<2年的高血压患者;C:没有糖尿病合并症的高血压患者;D:排除年龄<40岁的高血压患者
本研究还观察到相比于正常体质量,超体质量和一级肥胖有更低的癌症发病风险。而二级肥胖对癌症发病的影响与正常体质量没有显著区别。1项包含31项研究的meta分析表示,对于肺癌、鳞状细胞癌和腺癌,BMI≥25 kg/m2与它们的发病风险呈负相关[18]。有研究表明,体脂和肥胖相关基因的等位基因可降低癌症发病风险,而其与BMI增加存在相关性,这似乎可以为解释超体质量或肥胖降低男性肺癌发病风险提供依据[19]。此外,较高体质量的高血压患者伴随着更高的代谢储备和更好的心肺健康水平,可能导致较低的相关癌症发病率[20]。
目前有关肥胖与恶性肿瘤相关的生物学机制仍存在争议。但是,在高血压患者中,越来越多的研究表明较高的BMI与患者更好的预后相关,即存在“肥胖悖论”[21]。本研究提示高血压患者中BMI与癌症之间存在一定的关联,超体质量和一级肥胖的患者有更低的癌症发病风险。在高血压患者中进行进一步的随访、内暴露指标的测量及病因学的探索将有助于更加精准地探讨 BMI与恶性肿瘤发病风险的相关性及其机制的研究。
本研究基于全面高质量的数据收集系统,拥有大样本量人群和长期随访时间(中位随访时间9.5年)。此外,由于亚洲人和西方人群在体脂比和慢病发病率上存在差异,研究选择了更加适合亚洲人口的BMI分类标准。当然,本研究也存在一定的局限性。首先,由于本研究为回顾性研究,可能存在选择偏倚,肥胖患者更有可能自觉地寻求治疗并在EHR系统中注册。其次,BMI是身体成分的粗略指标。体质量指数相似的个体可能具有不同程度的脂肪或代谢状况,从而导致不同的健康结局。本次研究仅收集了BMI的基线信息,随访期间BMI的变化可能会影响与癌症发病风险之间的关联。第三,不同肿瘤间BMI与其发病风险的相关性存在差异,而本研究没有对癌症进行分类。第四,高血压患者的低BMI可能由癌症前期导致或是健康状况较差的指标,因此与高癌症发病风险相关。但是,敏感性分析排除入组2年内发生癌症的患者后显示出与原人群相似的结果,表明观察到的低BMI与癌症发病的关联受到反向因果关系的影响较小。
总之,根据目前变系数Cox模型的结果显示,低体质量的高血压患者与更高的癌症发病风险相关,而超体质量和一级肥胖则与较低的癌症发生风险相关。对于高血压患者的体质量管理,应尽量控制体质量在合理范围内,且更加关注低体质量患者。但在未来尚需进一步的研究以探索在高血压患者中BMI与不同类型癌症的关联和潜在的生理机制。