广西壮族自治区疾病预防控制中心(530028)
陈玉柱 方志峰 唐振柱 陆武韬 韦利玲 刘展华 李忠友 周为文 李晓鹏
基于主成分回归分析的尿酸与相关影响因素研究*
广西壮族自治区疾病预防控制中心(530028)
陈玉柱 方志峰 唐振柱 陆武韬 韦利玲 刘展华 李忠友 周为文 李晓鹏
目的利用主成分回归分析法探讨尿酸水平与体检和血生化指标的相关性。方法采用分层整群随机抽样方法,被调查者均接受问卷调查,测量身高、体重、血压、腰围(WC),检测尿酸(UA)、空腹血糖(FPG),血红蛋白(Hb)、甘油三脂(TC)、总胆固醇(TG)、高密度脂蛋白胆固醇(HDL-c),低密度脂蛋白胆固醇(LDL-c)。结果高尿酸组与尿酸正常组比较,各项指标差异有统计学意义(P<0.01);主成分回归分析年龄、血红蛋白、空腹血糖、甘油三脂、BM I、腰围、收缩压与血尿酸值成正相关,HDL与血尿酸值成负相关。结论主成分回归分析能较好解决尿酸相关指标的多重共线性,尿酸与糖尿病、肥胖、高血压、血脂异常密切相关。
尿酸 主成分回归分析 相关性
在医学多变量资料分析中,各变量常常不是独立存在的,而是存在一定程度的线性依存关系,这一现象称为多重共线性。多重共线性关系增大估计参数的标准误,从而降低模型的稳定性,有时还出现与实际情况相反的结论。这种分析结果的不合理性可以通过主成分回归分析来校正。尿酸是人体黄嘌呤氧化酶或脱氢酶降解核酸和其他嘌呤类化合物以及食物中的嘌呤形成的代谢终产物。其生成增加和排泄减慢会使血尿酸水平显著升高,发生高尿酸血症。近期许多研究表明,血尿酸与年龄、肥胖、高血压等密切相关,以往研究在进行尿酸与血生化和体检相关分析时,多用多元回归分析,但这些指标相互相关性较高,可能存在共线性,本文参考相关文献[1-6],在 SPSS中利用主成分回归分析探讨尿酸与血生化和体检指标的相关关系,对于正确利用类似资料具有实际意义。
1.调查对象 根据中国居民营养与健康调查2011-2012调查方案,于2011-2012年在广西北海市、凌云、兴安、宾阳4市、县采用分层整群抽样的方法,在每个市/县抽取6个社区或自然村,再随机抽取75户,选取18岁及以上常住居民3090人作为研究对象。
2.调查方法与内容 (1)询问调查:采用入户调查的方法,在签署知情同意书后,对调查家庭的经济收入、人口进行调查,对个体调查对象的基本情况、一般健康状况、运动、膳食等进行询问调查。(2)体格检查:采用校正的体重、身高测量仪进行身高和体重测量,站立平稳呼吸时腰围,血压用水银血压计连续测量三次,取平均值作为血压值。(3)血液指标:采集调查对象空腹静脉血,血红蛋白采用氰化高铁法,血糖采用葡萄糖氧化酶化用721分光光度计测定,TG,TC,HDL-c,LDL-c,UL采用日立7600-020型全自动生化仪测定,试剂为德赛诊断系统(上海)有限公司试剂。
3.诊断标准 高尿酸血症诊断标准依据全国临床检验操作规范[7],男性大于428μmol/L,女性大于357μmol/L为高尿酸血症。
4.质量控制
(1)人员培训 以调查市或县为单位,对调查员和检验员进行统一严格的培训。
(2)调查过程的质量控制 成立省级质量控制工作组,市或县调查点安排专人负责质量控制工作,按项目质量控制工作规范及方法,负责调查全过程的质量控制。
5.统计分析 数据统计分析采用SPSS19.0对数据进行整理分析。两组比较采用t检验或非参数检验,多因素分析采用主成分回归分析。
高尿酸组与尿酸正常组各项指标差异均有统计学意义(P<0.01)。见表1。
表1 两组体检及生化指标比较(¯x±s)
由表2可见,年龄、血红蛋白、空腹血糖、TG、HDL、BM I、腰围、收缩压8个变量对尿酸值的作用均有显著性(P<0.001或0.05),其中空腹血糖、BM I的偏回归系数为负值,与表1实际情况不符,其可能是由于自变量共线性引起的。从表3中可以看出,从5到9维特征值非常小,小于0.05;从第6维开始条件数大于15,一般认为条件指数大于15表示可能存在共线性,大于30表示高度共线性。同一维行中自变量方差比较大者表示其共线性较重。
表2 回归系数和共线性诊断
表3 共线性诊断指标
依据累积贡献率大于等于70%的原则提取4个主成分,并输出评分变量和原始数据的均数和标准差。结果见表 4,5。
表4 解释的总方差
表5 成份矩阵
在计算新变量 C1、C2、C3、C4后,以标化的尿酸作为因变量,以C1、C2、C3、C4做自变量,进行逐步回归分析,结果见表6。主成分C1和C4纳入方程,得到标化主回归方程Zy=0.241C1+0.132C4。再依据表5成份1,4,得标化线性回归方程:Zy=0.0155Zage+0.1521ZHb+0.0674ZFPG+0.0806ZTG-0.0320ZHDL-c+0.1191ZBMI+0.1342ZWC+0.0891ZSBP。
表6 回归系数
计算变量的离均差平方和,一般方程偏回归系数及常数,得一般线性回归方程Y=43.87+0.0990Xage+0.827XHb+5.035XFPG+5.381XTG-6.984XHDL-c+3.387XBMI+0.43XWC+0.436XSBP,结果表明,年龄、血红蛋白、空腹血糖、甘油三酯、BM I、腰围、收缩压与血尿酸值成正相关,HDL与血尿酸值成负相关,符合实际情况。
医学血生化和体检指标部分往往存在较大的相关性,比如BM I和腰围,收缩压与舒张压,由于这种共线性的存在,在进行多元回归分析时,往往会导致与实际不相符的情况出现。本文共线性诊断发现,多个维数的特征值小于0.05,有2个维数的条件数大于30,表明存在高度的共线性,导致多元回归分析血糖、BM I与尿酸成负相关,与高尿酸组和尿酸正常组比较时反映的实际情况不一致。通过主成分回归分析解决了这种不合理的情况,使得血糖、BM I因变量得到了合理解释。
从最后线性回归方程可以看出,年龄、血红蛋白、空腹血糖、甘油三酯、BM I、腰围、收缩压与血尿酸值成正相关,HDL-c与血尿酸值成负相关。国内外的研究表明,尿酸水平与甘油三酯正相关,与高密度脂蛋白负相关[8-11],随访前瞻队列研究发现其为未来高尿酸血症的独立预测因素[12],Concalves等[13]研究证实与血尿酸水平联系最为紧密的是甘油三酯。腰围是评价中心性肥胖的指标,已有研究通过logistic回归分析认为腰围是男性高尿酸的独立危险因素[14]。Ryu等[15]研究发现BM I是高尿酸血症的危险因素,但与LDL-c无显著相关。本研究进一步证实BM I、腰围与尿酸值相关。腰围和BM I是两个密切相关的指标,但是也存在腰围大于正常值而BM I正常的情况,因此需对肥胖的不同类型进一步区分来明确其与尿酸的关系,这有待下一步探讨。目前血糖与尿酸水平的认识不一致,于健等[8]研究未发现空腹血糖与尿酸水平有关,日本研究显示高尿酸血症与糖尿病显著相关[16]。本研究显示尿酸水平与收缩压正相关,与已有研究报道的尿酸水平与收缩压、舒张压正相关略有不同[8];也有不同报道,杨松等[17]报道排除服用降压药影响并校正混杂因子后,尿酸水平与血压变化及高血压之间无关。尿酸与血红蛋白成正相关还未见相关报道,这可能与高尿酸人群摄入较多肉类[18],而肉类含有丰富的铁有关。
总之,通过主成分回归分析,尿酸水平与年龄、血脂异常、肥胖、糖尿病、血压密切相关,需针对不同的人群开展相应的措施,高尿酸水平的人群需加强相应体检和血生化指标的监测和控制。
[1]陈峰.主成分回归分析.中国卫生统计,1991,8(1):20-22.
[2]郭呈全,陈希镇.主成分回归的SPSS实现.统计与决策,2011,5.157-159.
[3]刘润幸,萧灿培,宫齐,等.利用SPSS进行主成分回归分析.数理医药学杂志 2001,14(2):103-105.
[4]罗文海,万巧云,高永,等.主成分回归分析与多元线性回归的对比研究.数理医药学杂志,2003,16(2):140-143.
[5]孙振球.医学统计学第二版.北京.人民卫生出版社.2006,415-438.
[6]李玲,饶克勤,王启俊.肿瘤危险因素的筛选与多重共线性的诊断和处理.中国卫生统计,1999,16(3):136-138.
[7]中国医师协会心血管内科医师分会,中国医师协会循证医学专业委员会.无症状高尿酸血症合并心血管疾病诊治建议中国专家共识.中国全科医学,2010,13(11):1145-1149.
[8]于健,周玲,刘春雨,等.桂林市部分男性血尿酸水平与代谢综合征相关性研究.现代预防医学,2012,39(18):4903-4905.
[9]王东升,郑虹,米树华,等.代谢综合郑患者的尿酸与血脂脂蛋白相关性研究.中国综合临床,2006,22(8):710-711.
[10]苗志敏,赵世华,王颜刚.山东沿海居民高尿酸血症及痛风的流行病学调查.中华内分泌代谢杂志,2006,22(5):421-425.
[11]Lippi G,Monragnana M,Luca Salvagno G,et al.Epedemiological association between uric acid concentration in plasma,lipoprotein(a),and the traditional lipid profile.Clin Cardiol,2010,33(2):76-80.
[12]Nakanishi N,Tatara K,Nakamura K,et al.Risk factor for the incidence of hyperuricem ia:a 6-year longitudinal study of middle aged Japanesemen.Int JEpedemiol,1999,8(25):888-893.
[13]Gonçalves JP,Oliveira A,Severo M,et al.Cross-sectional and longitudinal associations between serum uric acid and metabolicsyndrome.Endocrine,2012,41(3):450-457.
[14]马文峰,陈锦华,王万山,等.广州市某体检人群高尿酸血症患病率及相关危险因素分析.南方医科大学学报,2012,32(12):1812-1815.
[15]Ryu S,Chang Y,Zhang Y,et al.A cohort study of hyperuricemia in middle-aged South Korean men.Am J Epidemiol,2012,175(2):133-143.
[16]Bicel C,Rupprecht HJ,Blankenberg S,et al.Serum uric acid as an independent predictor of mortality in patients with angiographially proven coronary artery disease.Am JCardiol,2002,89(8):12-17.
[17]杨松,赵彦平,赵祥海,等.农村人群尿酸与血液变化及高血压关系的流行病学分析.中华疾病控制杂志,2012,16(7):564-566.
[18]袁智敏,张丽崧,杨丽芳.广州地区人群高尿酸血症的调查分析.营养学报,2004,26(3):201-203.
Research on Uric Acid and Related Factors Based on Principal Component Regression Analysis
Chen Yuzhu,Fang Zhifeng,Tang Zhenzhu,et al(Guangxi Autonomous Regional Center for Disease Control and Prevention,(530028)Nanning)
ObjectiveExplore correlation between uric acid level,examination and blood biochemical indexes based on principal component regression analysis.MethodsA random stratified cluster sampling was conducted,and 3090 inhabitants were investigated in Guangxi,,the measure of height,weight,blood pressure,waist circumference(W),the detection of uric acid(UA),fasting plasma glucose(FPG),hemoglobin(Hb),triglycerides(TC),total cholesterol(TG),high density lipoprotein cholesterol(HDL-c),low-density lipoprotein cholesterol(LDL-c).ResultsLevels of all indicators in high uric acid group were statistically significantly different with the normal group,(P<0.01).The age,hemoglobin,fasting blood glucose,TG,BM I waist circumference,systolic blood pressure was positively correlated with uric acid,HDL and uric acid into a negative based on principal component regression analysis.ConclusionPrincipal component regression analysis can better solve the multicollinearity of uric acid-related indicators,uric acid and diabetes,obesity,hypertension,dyslipidemia are closely related.
Uric acid;Principal component regression analysis;Relevance
广西壮族自治区疾病预防控制中心青年基金资助项目(201306)
(责任编辑:郭海强)