区域环境因素对健康成年人中性粒细胞与淋巴细胞比值参考值的响应

2022-03-24 04:32:30李佳鑫裴泽华杨文婕何进伟王聪霞
西安交通大学学报(医学版) 2022年2期
关键词:参考值成年人空间

李佳鑫,葛 淼,张 雷,裴泽华,杨文婕,何进伟,王聪霞

(1.陕西师范大学地理科学与旅游学院健康地理研究所,陕西西安 710061;2.延安大学医学院,陕西延安 716099;3.西安交通大学第二附属医院,陕西西安 710054)

新型冠状病毒(coronavirus disease 2019,COVID-19)是一种单股正链RNA包膜病毒[1],通过表面的刺突蛋白与靶细胞表面的血管紧张素转换酶Ⅱ(angiotensin-converting enzymeⅡ,ACEⅡ)受体相结合[2],入侵肺部引发急性肺损伤[3]。中性粒细胞和淋巴细胞比值(neutrophil-to-lymphocyte ratio,NLR)是一种常用于反映炎症和免疫状态的循环生物标志物[4]。在用于评估重症/危重型新冠肺炎患者预后的单项指标中,以NLR准确性最高,且NLR易测量、可快速获得、费用低廉,可推广应用于检测新冠肺炎患者的病情进展,并指导后续治疗方案的选择[5]。NLR是新型冠状病毒的独立危险评估因素,可以作为预后因子对患者进行分级管理[6-14]。目前国内对于NLR参考值的地区性分布差异常集中在以市(县)为单位的参考区间的差异性区分[15]。微观研究区层面,居住环境可能成为NLR相关参数参考值的影响因素[16-17]。

居住环境是指与人们居住生活密切相关的空间环境,包括空气质量、景观绿化、交通、室内外空间布局、声光热等[18]。健康与居住环境的关系,主要从物理环境(自然环境、室内外住宅物理环境、基础设施和空间适用等)和精神环境(社会、人文、心理等)两个层面进行评估[19]。已有大量研究通过区域对比、病例对照等方法对照研究健康和疾病与自然和社会环境因素的关系[16-17,20]。其中,自然环境对于各项医疗指标的参考值影响较为显著[21-22]。

因此,本文从自然环境角度出发,构建指标体系,对可能影响全国健康成年人NLR参考值空间分异的影响因子进行筛选,将得到的显著性指标进行共线性诊断后,通过构建随机森林模型预测全国健康成年人的NLR参考值,最终运用地统计分析方法探究在全国范围内NLR参考值的变化趋势。

1 资料与方法

1.1 资料来源

1.1.1 NLR参考值获取通过检索中国知网(CNKI)、万方数据库、维普网、超星数字图书馆及中国重要会议数据库等数据库,收集2016至2020年共65个市(县)级医院、相关研究单位和高等院校所测定的健康人的NLR参考值数据共162 681例。研究对象为健康人,其纳入标准为:研究对象无明显感染症状和贫血表现,WBC计数3.5~9.5×109/L,CRP<10 mg/L。NLR参考值在男性和女性的参考区间无较大差别,因此不考虑区分性别对参考值的影响[15,21]。所有受测者均采用检测方法为:禁食12 h,次日清晨抽取肘静脉血5 mL,4℃条件下12 000 r/min离心15 min吸取上层清液置于EP管内,-80℃超低温冰箱内保存,应用血液细胞分析仪检测受试者血常规,得到外周血的中性粒细胞和淋巴细胞个数,根据其数值进一步计算NLR的值。

1.1.2 指标体系构建本文从自然环境的角度出发,构建地势、气候和土壤3个一级指标,再细分出25个二级指标体系(表1),来探索自然地理因素与NLR参考值的相关性。其中,地势指标来源于国家测绘数据中心共享资料,气象指标来源于中国气象数据共享服务网,土壤指标来源于联合国粮农组织(FAO)和维也纳国际应用系统(IIASA)建立的世界土壤数据库。

表1 影响因素指标体系Tab.1 Index system of the influencing factors

1.2 研究方法

1.2.1 相关性分析自相关分析在研究不同事物在空间位置属性上的相关关系上应用广泛。空间自相关分析有全局自相关和局部自相关两种方法。本文选取全局自相关的分析方法,通过MoranI指数分析要素与邻近单元要素间的空间联系,其公式为:

其中,n是指空间单元总个数,X i和Xj分别表示第i个空间单元和第j个空间单元的属性值,X为所有空间单元属性值的均值,W ij为空间权重值。I值值域为[-1,1],I<0呈负相关关系,I>0呈正相关关系,I=0时则不相关。

Spearman等级相关,是通过Spearman秩相关系数来度量两个变量之间联系的强弱。其计算公式如下。

若存在相同的秩次,则相关系数ρs可由下式计算:

其中,n表示数据的数量,d i表示两个数据次序的差值。

若不存在相同的秩次,则采用如下公式计算:

共线性诊断及模型拟合,在计算Spearman相关系数后进行回归分析。通过SPSS检测影响因子是否存在共线性问题[23],VIF>10则认为因子存在共线性[24],模型拟合度R 2>0.8则认为拟合程度较好[25]。

1.2.2 模型构建随机森林模型。随机森林模型(random forest,RF)是LED BREIMAN[26]和CUTLERA[27]共同提出的一种利用多棵树训练样本后再作出预测的分类器。RF模型利用bootstrap方法选择样本,其次数由ntree表示,mtry则表示每次重建决策树模型时的节点分裂数。其表达式为:

其中:h(x)为预测值,θi是独立分布的随机向量,决定决策树的生长,(X,θi)为第i课回归树的输出结果,k表示回归树的数量。

地统计分析,地统计学是一种用于研究空间上的随机性与结构性、空间相关性和依赖性的自然现象科学。其最基本的核心是克里金(Kriging)空间插值法,是一种对估点值进行的线性无偏最优估计。本研究在根据正态性检验后得出的结果,选择析取克里金法,对RF模型得出的NLR参考值进行空间分析。

2 结果

2.1 中性粒细胞参考值的地理影响因素

2.1.1 空间自相关分析通过Arcgis10.2对162 681例健康人的NLR参考值进行莫兰指数分析(图1)。在空间自相关分析的过程中,Moran’sI值的范围在[-1,1]之间,Moran’sI>0则呈空间正相关,且值越靠近1则正相关性越明显,Moran’sI<0则呈空间负相关,且值越靠近-1则空间异质性越强。本次研究指出,Moran’sI指数为0.195 21,则NLR参考值具有较明显的空间差异,P=0.000 476<0.05通过95%的置信度检验,Z=3.493 745超过临界值1.65则通过显著性检验。因此,NLR的标准值是具有空间分异规律的,本文从自然环境的角度出发评价空间差异,采用相关性分析的方法进一步探讨不同自然环境指标对NLR标准值的影响情况。

图1 莫兰指数分析结果Fig.1 Moran index analysis results

2.1.2 相关性分析通过SPSS软件进行Spearman相关性分析,用25个二级自然环境指标作为自变量,NLR参考值作为因变量,通过r、P值判断地理因子与NLR参考值的相关关系。

25项二级指标中海拔(X3)、年日照时数(X4)、年平均气温(X5)、年平均相对湿度(X6)、气温年较差(X8)、年平均风速(X9)、表土有机质含量(X16)、表土(粘土)阳离子交换量(X18)、土壤CaSO4总量(X23)与各地区的健康成年人的NLR正常值存在相关关系,其中海拔(X3)、年日照时数(X4)、年平均风速(X9)、表土有机质含量(X16)、表土(粘土)阳离子交换量(X18)与NLR参考值呈现高度相关(表2)。

表2 健康成年人NLR参考值的地理影响因素分析Tab.2 Analysis of geographical factors influencing NLR reference values in healthy adults

2.1.3 共线性诊断对于线性相关关系进行多重共线性诊断和模型拟合的过程中可以发现,方差膨胀系数VIF>7.5,代表存在局部共线性(表3)。模型拟合度调整后的r2=0.182存在欠拟合问题。为解决这一问题,下文采用RF模型的方法构建NLR参考值的空间响应趋势。

表3 相关因子的共线性诊断Tab.3 Collinearity diagnosis of the related factors

2.2 健康成年人NLR参考值的空间响应

2.2.1 全国健康成年人NLR参考值预测通过训练现有的样本,运用Matlab其中的RandomForest软件包构建随机森林模型,选用海拔、年日照时数、年平均气温、年平均相对湿度、气温年较差、年平均风速、表土有机质含量、表土(粘土)阳离子交换总量、土壤CaSO4总量这几个相关性指标,对全国健康成年人NLR参考值进行预测(图2)。其中,通过机器学习,发现当mtry为15,ntree为50时,R2=0.859 2故可以判断RF拟合效果最好,模型稳定度最高。

图2 RF模型预测结果Fig.2 Prediction results of RF model

2.2.2 NLR参考值预测的空间分布

2.2.2.1 正态性检验 利用Arcgis地统计分析模块进行数据挖掘,检验RF模型预测数据的正态性。根据绘制好的直方图(图3)可以看出,RF模型预测的全国健康成年人NLR参考值呈现弱偏态变化趋势,为负偏分布,其峰度值为3.849 4,呈现高峰态,因此数据不符合正态分布要求,NLR参考值的预测数据并不呈现正态分布。

图3 RF模型预测结果直方图Fig.3 Histogram of RF model prediction results

2.2.2.2 NLR空间变化趋势分析 通过Arcgis的趋势分析工具,构建NLR参考值预测值的空间变化趋势三维图(图4)。可以看出全国健康成年人NLR参考值预测值在Y轴(南北方向)较之X轴(东西方向)的变化幅度较大,且均呈现二维变化趋势。因此,在进行数据点插值之前要进行二阶或三阶的变化处理。

图4 全国健康成年人NLR参考值趋势分布图Fig.4 Trend distribution of NLR reference values for healthy adults in China

将全国健康成年人的NLR参考值预测数据导入Arcgis中,运用地统计分析模块拟合空间响应。由于正态性检验过程中发现其不符合正态分布,因此采用析取克里金插值法,选用半变异函数进行差值。东南沿海地区的NLR参考值是相对较高的,如海口、深圳、福州、台湾等;中部地区相对较低,如重庆、成都、合肥、武汉;而西北地区则更甚,数据整体呈现沿海高、内陆低,东南高、西北低的变化态势。

3 讨 论

本次研究通过探究健康成年人NLR参考值与地理因素的相关关系,为不同地区使用NLR参考值作为新型冠状病毒肺炎预后因子制定参考标准时提供依据,为后续进一步研究不同影响因子对NLR指标参考值的作用机制奠定基础。

3.1 地势因素

高海拔地区与低海拔地区的血浆质量存在一定差异[28],海拔因子从自然环境(居民饮用水质、植被多样性等)、人文环境(景观格局、生态服务价值)两方面直接或间接地对血浆质量存在显著影响[29],进一步对其中的血液指标产生作用。海拔升高必然伴随着空气中氧含量降低、温度降低、气压降低的自然环境[30];同时高海拔地区人群饮食习惯倾向于高脂、高热、高蛋白、低维生素;海拔升高导致不同地区生态多样性,景观格局发生变化,生态服务价值也随之变化,这些都直接或间接的影响着人体内的血液循环系统[31-33]。

3.2 气候因素

气候条件不同直接导致温度增加、降水量变化、极端天气事件、海平面上升等,通过一定的暴露途径影响人的健康结果;间接地,气候变化还会引起环境和制度背景的差异(土地利用变化、生态系统改变、基础设施条件、地貌地形、农业生产和牲畜利用等)、社会和行为背景的差异(性别和年龄、种族特点、贫困、住房、教育、歧视、医疗健康条件的获得性等)从而影响人体健康[34]。对于NLR起显著影响作用的主要是年平均气温与年平均相对湿度。温度可以改变人生理上对有毒有害污染物的反应,引起生理压力,极端天气造成的社会经济影响(如极端气候引起电力短缺导致卫生设施、能源、交通和水资源基础设施等)也会间接影响到当地居民对于环境的适应能力,影响人体内相关指标的标准值[35-36]。

相对湿度会引起大气气溶胶的粒径、化学成分和化学过程等物化性质的变化,是温度、辐射、风和湿度之间相互作用的结果。年平均相对湿度的差异,一方面会影响空气传播疾病的传播以及空气中细菌、真菌、尘螨的传播;另一方面,影响气体交换率、机体最大摄氧量等,改变血流速度[37]。

3.3 土壤因素

土壤因素与社会生活息息相关,通过饮食、呼吸等方面间接影响人体内NLR的含量。表土有机质的含量与径流流向、地形因素相关,土壤作为天然碳库,直接影响着动植物生长,间接影响当地人类体制机制。表土有机质含量对土壤生产力存在影响作用,进而通过饮食循环影响人体体质[38-41]。表土有机质含量、表土(粘土)阳离子交换量和土壤CaSO4总量是与健康成年人NLR参考值的空间分布存在较高的相关关系。其中表土有机质含量呈现负相关关系、表土(粘土)阳离子交换量、土壤CaSO4总量是与NLR呈现正相关关系。

3.4 不足之处

一、样本量不足。由于数据的获取方式尚未优化,故而收集到的健康成年人数据存在小样本情况,对于相关关系分析可能存在一定的影响,考虑通过日后与相关机构合作等方式,扩充样本数据库。二、仅分析了自然地理因素,没有考虑到建成环境、社会经济因素对NLR参考值的影响。在后期的指标体系构建中,可以通过加入相关建成环境因子、社会经济因子进一步衡量居住环境变化对健康成年NLR参考值可能存在的影响。

猜你喜欢
参考值成年人空间
成年人的告别
空间是什么?
成年人爆笑日常
意林(2020年16期)2020-08-28 11:11:24
中国健康成年人甘油三酯参考值的空间变异特征
创享空间
妊娠妇女甲状腺功能血清指标参考值的建立
医学新知(2019年4期)2020-01-02 11:03:54
成年人的辛苦
上海地区胃蛋白酶原参考值的建立及临床应用
兰州地区健康人群tPSA、fPSA以及fPSA/tPSA参考值范围的建立
西部中医药(2014年6期)2014-03-11 16:07:41
QQ空间那点事
学与玩(2009年6期)2009-07-03 09:15:02