杜 瑾,申郁冰,杨翠红,陈雅丽,姜晶梅
(中国医学科学院基础医学研究所 北京协和医学院基础学院 流行病与卫生统计学系, 北京 100005)
高血压是中国居民主要慢性病之一[1]。中国哈萨克族人口180万以上,是新疆第二大少数民族[2],且高血压患病率高,位列中国各民族高血压患病率前5位[3]。新疆医疗卫生资源相对落后,疾病预防有重要意义。既往研究,肥胖与高血压相关,但是腰围和体质指数(body mass index, BMI)与高血压相关程度在不同人群研究结果不一致,有些研究显示腰围(向心性肥胖)与高血压相关程度大于BMI(总体肥胖)与高血压相关程度,有些研究则相反[4-6]。随着中国城市化进程,人们更多暴露于不健康的生活方式[7]。传统统计模型对自变量限制较多,且难以处理变量间高阶交互作用。随机森林(Random forest)是一种机器学习方法,不受共线性影响且可以处理非线性数据[8]。本研究目的是采用随机森林方法探讨新疆哈萨克族不同职业人群(市民、农民、牧民)高血压相关因素及其重要程度,以便开展有针对性高血压防治工作,并对比不同职业人群高血压相关因素异同,为城市化进程高血压相关因素变化做参考。
本研究为横断面研究(Cross-sectional study),现场位于新疆伊犁哈萨克自治州阿勒泰市红墩镇,调查时间为2012年至2013年。根据哈萨克族牧民、农民、市民人口比例,采用随机整群抽样方法,抽取牧业行政村2个、农业行政村3个以及镇直属机关1个。研究对象纳入标准:≥30岁哈萨克族常住人口且3代内无异族通婚史。排除标准:孕妇、高龄卧床、重病、残疾。每位调查对象都签署了参与本研究的知情同意书,该同意书得到了中国医学科学院基础医学研究所伦理委员会批准(批准号024-2012)。共1 668人完成此次调查,样本应答率为92.7%。
由培训合格的调查人员对调查对象进行面对面问卷调查,内容包括性别、年龄、教育程度、家庭年收入、对收入是否满意、看病是否方便、吸烟、饮酒、蔬菜摄入量及水果摄入量。其中蔬菜摄入量为一年内有绿色蔬菜摄入的月数,水果摄入量为一年内有水果摄入的月数。利用标准方法测量身高、体质量、腰围、收缩压(systolic blood pressure, SBP)及舒张压(diastolic blood pressure, DBP)。BMI计算为体质量(kg)/身高(m)2。研究者采集空腹静脉血以及晨起后第2次尿液。使用Beckman Coulter AU2700临床生化分析仪(美国加利佛尼亚州)检测空腹血糖(fasting plasma glucose, FPG)、总胆固醇(total cholesterol, TC)、三酰甘油(triglyceride, TG)、低密度脂蛋白胆固醇(low-density lipoprotein cholesterol, LDL-C)及高密度脂蛋白胆固醇(high-density lipoprotein cholesterol, HDL-C)。使用Caretium XI-921CT电解质分析仪(中国深圳)检测尿钠和尿肌酐。根据日本高血压学会推荐,通过体质量、身高、年龄、尿钠、尿肌酐计算24 h尿钠排泄量[9-10],1 mmol钠≈0.06 g食盐,从而计算24 h食盐摄入量。
根据2018年中国高血压防治指南[11],本研究高血压定义为SBP≥140 mmHg或DBP≥90 mmHg或最近两周内服用降压药(1 mmHg=0.133 kPa)。
本研究最终纳入1 646人,缺失值比例为1.3%,其中市民193人,农民825人,牧民628人。市民较年轻,年龄中位数为39岁(P<0.05/2)。相比于市民,农民和牧民教育程度、收入、对收入满意率及有绿色蔬菜摄入月数较低,HDL-C较高(P<0.05/2)。牧民看病方便满意率最低,为46.0%。3种职业人群每年有水果摄入月数均很低。农民和牧民食盐摄入量中位数分别为16.4 g和16.0 g,均高于市民食盐摄入量12.9 g(P<0.05/2)。市民、农民、牧民高血压患病率分别为31.6%、44.2%、50.1%(表1)。
表1 研究对象基本特征Table 1 Baseline characteristics
分别对市民、农民、牧民进行高血压相关因素单因素分析,共18个因素纳入分析。市民高血压相关因素有9个:年龄、性别、吸烟、腰围、BMI、TC、TG、LDL-C及FPG。农民高血压相关因素有11个:年龄、教育程度、饮酒、食盐摄入量、腰围、BMI、TC、TG、LDL-C及FPG。牧民高血压相关因素有13个:年龄、收入满意率、看病方便满意率、饮酒、食盐摄入、腰围、BMI、TC、TG、HDL-C、LDL-C及FPG。以上均为(P<0.05)(表2)。
采用随机森林方法分别对市民、农民、牧民建立高血压预测模型,纳入单因素分析结果 的变量。选择重要性评分大于0.05的变量,按照评分从大到小排序,市民依次为腰围、TG、LDL-C、BMI、年龄及TC,农民依次为年龄、LDL-C、TC、TG、腰围及FPG,牧民依次为年龄、BMI、腰围、TC、LDL-C及FPG。市民、农民、牧民随机森林模型预测准确率分别为0.82、0.69、0.76,灵敏度分别为0.73、0.66、0.80,特异度分别为0.86、0.71、0.72(表3)。
表2 不同人群高血压患者与非高血压患者一般情况比较
表3 随机森林特征重要性评分及模型准确率
本研究利用随机森林方法分别对新疆哈萨克族社会经济地位不同的3种职业人群探讨高血压相关因素及其重要程度。研究发现不同职业人群,肥胖和血脂与高血压相关程度不同。
本研究肥胖、血脂、血糖及食盐摄入与高血压相关,与既往研究结果一致[2-3]。未发现蔬菜摄入和水果摄入与高血压相关,可能因为本研究蔬菜水果摄入量只调查了每年摄入月数而没有调查每天摄入克数。本研究新发现:(1)在市民中腰围与高血压相关程度大于BMI与高血压相关程度,牧民则相反;(2)对于血脂,市民中TG与高血压相关程度较大,农民和牧民中TC和LDL-C与高血压相关程度较大。可能由于本研究市民为镇直属机关工作人员,身体活动减少久坐时间增多,与腰围增加有关[12],腰围增加与内脏脂肪增加有关[13],内脏肥胖与高血压以及TG升高有关[13-14],因此市民中腰围和TG与高血压相关程度较大。牧民摄入动物脂肪较多,动物性食物含脂肪及胆固醇较多,因此牧民中TC与高血压相关程度较大。在农民中肥胖与高血压相关程度小于血脂与高血压相关程度,可能由于农民倾向于代谢健康型肥胖,也可能由于模型准确率较低。因此,对于高血压防控,在控制肥胖的基础上,哈萨克族市民要更加注意控制向心性肥胖和TG,比如增加体育锻炼。牧民要注意控制总体肥胖。农民和牧民要注意控制TC和LDL-C,比如减少动物性食物摄入。本研究结果提示,随着城市化进程人们生活方式改变,城镇居民高血压防控要注意控制向心性肥胖。
本研究发现,随着教育程度和收入提高,市民食盐摄入量低于农民和牧民,但是仍显著高于中国人日均摄入量9.2 g[15]。因此要加强对哈萨克族健康知识宣教。牧民看病方便满意率最低,政府应根据牧区人民生活方式建设具有牧区特色的医疗卫生设施及医疗卫生服务,从而提高牧民看病方便程度。
综上所述,新疆哈萨克族不同职业人群高血压相关因素重要程度不同,应根据不同职业人群特点制定量体裁衣式高血压预防策略,加强对哈萨克族人健康知识宣教。随着城市化进程,城镇居民高血压预防要注意控制向心性肥胖,由于本研究样本量较小且为哈萨克族人,未来还需要在中国更广大人群中验证。