基于岭回归分析游离脂肪酸与地理关系

2022-10-14 12:16杨文婕何进伟
甘肃科学学报 2022年5期
关键词:参考值插值游离

王 晶 ,葛 淼,张 雷,杨文婕,何进伟

(1.陕西师范大学地理科学与旅游学院健康地理研究所,陕西 西安 710119;2.延安大学医学院,陕西 延安 716000)

游离脂肪酸(FFA,free fatty acid)是经过血脂代谢后形成的一类脂肪酸,同甘油三脂、高低密度脂蛋白相比,由于其活跃度高且灵敏,被广泛应用于血脂代谢检测[1-2]。有研究表明,游离脂肪酸可以影响心机细胞的供能,引发冠心病,同时还参与高血压、糖尿病等基础疾病的发生发展[3]。正常人体血液中的游离脂肪酸含量极低,当人体血浆中游离脂肪酸含量升高,身体会随之表现出病理变化,因此通过检测其含量可以初步判定人体血脂代谢是否紊乱[4]。

目前大多数研究基于医学角度探讨游离脂肪酸含量变化及影响因素[5-15],也有研究发现随着地理位置不同,评估得出的脂代谢会有所不同[16]。我国幅员辽阔,地貌多样,对人体健康有着潜移默化的影响[17],从地理视角探讨全国健康人群游离脂肪酸的影响因素和空间分布尚无人涉及。通过研究地理环境对游离脂肪酸的相关性及游离脂肪酸空间分布特征,并建立相应的预测模型,分析了地理因子对FFA参考值的影响,并预测全国FFA参考值范围,以期为此类疾病的预防提供一定科学依据。

1 材料与方法

1.1 材料

(1) 游离脂肪酸参考值 利用万方、临床医学资源(Cliniweb)、中国知网(CNKI)、中国生物医学文献等数据库,收集了从2011—2021年中国79个城市30 324例正常成年人的游离脂肪酸参考值,其中男女比例为1.7∶1.3,年龄35~65岁,该样本数据点分布范围为西北资料少、东南地区资料多。正常成年人没有涉及到以下疾病:心肌功能减弱,心力不足,心肌血管硬化以及其他心血管疾病;血压值长期高于正常值;内分泌失调,葡萄糖代谢升高;肝脏疾病、肾功能不全。所有正常人清晨空腹抽血通过酶联免疫吸附法检测游离脂肪酸,单位mmol/L。

(2) 地理因素 基于《中国市县大辞典》选取城市的经度、纬度、海拔地势指标;基于中国气象数据网(http://data.cma.cn)选取城市的年降水量、年日照时数、年平均风速3项气象指标;基于世界土壤数据库(HWSD)选取表土pH值、表土基本饱和度、T-CaCO3、表土总可交换量、表土粉粒百分率、表土砂砾百分率6项土壤指标。总计12项地理因素指标。

1.2 相关分析

相关分析是一种常被用来分析两个变量间线性方向和强度的统计分析方法。相关分析包含两类:Pearson相关和Spearman相关,前者适用于数据呈现正态分布,后者适用Spearman相关进行分析[18]。通过SPSS软件,分析入选的12项地理因素指标与游离脂肪酸的关系,以P<0.05为显著性检验标准[19]。

1.3 模型建立与优选

(1) 主成分分析 主成分分析是用一组新的不相关指标来代替原来多个相关的指标,达到简化分析过程并综合原来大部分信息的方法[20]。进行主成分分析前要对数据进行适用性检验,一般概率P<0.05表明数据适用于主成分分析[21]。主成分分析步骤如下:通过SPSS软件将与游离脂肪酸存在相关性的地理因子导入,得到从低到高的特征值,以及每个主成分对应的贡献率。依特征值大于1,或K个主成分累计贡献率大于70%以上,作为选取主成分个数的依据,并将新的主成分代替原变量进行多重线性回归,获得应变量和标准变量之间的回归模型,然后用原始变量代换标准变量,最终得到因变量和自变量的回归模型[22]。

(2) 岭回归分析 岭回归是一种有效解决多重共线性,提高解释变量效率,增强模型预测能力的多元线性回归方式[23]。岭回归估计参数为纵坐标轴,岭估计K值为横坐标轴,绘制解释地理因子关于岭参数的岭迹图,选取各条曲线趋于稳定的K值,得到相应的回归方程[24]。运用SAS软件,将游离脂肪酸的参考值作为预测值、相关的8项地理环境指标为解释变量,进行预测值的岭回归分析,并得到预测值与解释变量之间的方程。

(3) 模型优选 采用均方误差值(MSE)小的模型。误差越小,即预测值与实测值越接近,表示模型越佳,应选为最优模型。均方误差值计算公式为

1.4 空间分布图绘制

为了更直观描述中国健康成年人游离脂肪酸在空间上的分布,通过ArcGIS软件绘制分布图。以全国2 317个城市为基础,以与游离脂肪酸相关的地理指标为自变量,通过主成分模型计算得出2 317个城市的游离脂肪酸预测值,用克里金插值方法进行绘图。克里金插值是一种线性最优化、无偏估计插值方法,通过具有区域变化的原数据,以及结构性的变异函数对未知采样区预测插值[26]。常见有普通克里格插值、析取克里格插值等。普通克里格需要插值数据增长趋势平缓,但已知数据不聚集会造成较大的误差;析取克里金插值适用于呈现正态分布的数据,可以估计待测点的函数值[27]。

2 结果

2.1 FFA 参考值与地理因素指标的相关分析

对采集数据进行正态分布检验,结果显示P值为0.009,小于检验值0.05,表明数据符合正态分布,因此在SPSS中采用Pearson相关分析。具体相关判别标准以游离脂肪酸参考值和选取的地理指标的相关系数(r)和显著性概率(P)来判定,其中α=0.05为显著性检验标准(见表1)。结果显示游离脂肪酸与研究地理指标中的8项地理有相关性。健康中年人FFA与经度(X1)、年平均风速(X5)、表土粉粒百分率(X11)、表土pH值(X7)、表土总可交换量(X10)、T-CaCO3(X9)呈正相关分布,其中与游离脂肪酸特别相关的地理指标有X5、X10;FFA与海拔(X3)、表土砂砾百分率(X12)呈现负相关,其中与游离脂肪酸特别负相关的地理指标为X3,表明海拔越高,游离脂肪酸参考值越小。

2.2 模型建立与优选

(1) 主成分分析 经巴特利特球形度检验显著性值为0,小于0.05,表明数据适用于主成分分析。通过SPSS软件将游离脂肪酸和相关分析筛选得到的经度(X1)、年平均风速(X5)、表土粉粒百分率(X11)、表土pH值(X7)、表土总可交换量(X10)、T-CaCO3(X9)、海拔(X3) 、表土砂砾百分率(X12)8项地理因子进行主成分分析,得到彼此独立且可以用这8项地理因子线性组合的新变量,即主成分。从主成分统计信息表(见表2)得知回归分析后主成分的个数有8个,第一成分表示8项相关地理因子线性组合的新变量,仅能反映45.469%的相关地理信息;第二成分表示8项相关地理因子线性组合的新变量,仅能反映25.444%的相关地理信息;第三成分表示8项相关地理因子线性组合的新变量,仅能反映12.333%的相关地理信息;其他成分依可以反映地理信息的特征值方差百分比类推。第一成分和第二成分特征值均大于1,且第一成分特征值方差百分比加上第二成分的特征值方差百分比的累计值达到70.91%,大于70%。上述均表明选取第一成分和第二成分可以代表相关分析筛选得到8个相关地理变量的信息,同时实现减少变量个数,即自变量由8个相关变量简化为2个新变量(主成分),有利于更快捷进行回归分析。

表3 成分得分系数矩阵与描述统计量

Z1=0.075stdX1-0.06stdX3+0.112stdX5-

0.196stdX12+0.232stdX11+0.225stdX7+

0.241stdX10+0.228stdX9,

Z2=0.423stdX1-0.390stdX3+0.346stdX5+

0.130stdX12-0.079stdX11-0.039stdX7-

0.095stdX10-0.081stdX9,

0.006 805X7+0.000 815 0X10+0.001 192X9。

主成分回归方程F=9.922,P=0<0.05,表明因变量受各个解释变量影响显著,方程有意义。

(2) 岭回归分析 经SAS软件,分析解释变量的8项地理因子与健康成年人游离脂肪酸的关系,绘制相应的岭迹图(见图1)。K=0.3时各项地理因子回归线趋于稳定,此时

图1 相关地理指标岭迹

0.001 08X10+0.002 97X9±0.113。

F=3.70,P=0.000 6<0.05,表明方程有意义,岭回归方程中这8个相关的地理因子可以解释游离脂肪酸的变化。

(3) 最优模型选取 计算主成分模型和岭回归模型的MSE,分别为0.013 35和0.011 9。岭回归的均方误差比主成分小,表明岭回归模型预测数据较准确,因此选取MSE小的岭回归模型作为预测最佳模型,并进行后续的空间分布插值出图。

2.3 空间分析

由2 317个城市的健康成年人游离脂肪酸得到游离脂肪酸的空间分布图(见图2)。图2中色块一致表明该区域人体的游离脂肪酸含量相近;红色表示游离脂肪酸高值区,蓝色为低值区。由图2可见,我国正常人的游离脂肪酸低值主要集中在青藏地区,其他地区为高值区。我国成年人游离脂肪酸值在0.19~0.47mmol/L,整体趋势为由西向东逐渐递增,增长趋势明显,南北方向游离脂肪酸参考值没有较大的差异,趋势平滑。

图2 FFA参考值空间分布

3 讨论

马克思曾说人类拥有两个身体,一个是自身的有机体,另一个是自然界的无机身体,其中有机身体以自然界为基础,并受到自然界的潜移影响[28]。世界卫生组织(WHO)曾指出全球每年因环境引发的生病率、死亡率达到21%[29]。

我国国土辽阔,不同的地理位置、气候类型、土壤条件等养育着地域人群。青藏地区海拔均值不低于4 000m,气压值低于正常值,空气稀薄,温度较低,对人体健康有着不同程度的影响。此次研究中发现青藏地区的健康人的游离脂肪酸低于我国其他地区的居民,且随着海拔的升高人体内的游离脂肪酸含量有下降的趋势,可能与人体能量代谢有关,游离脂肪酸通过脂肪的分解,成为机体能量代谢的一种方式,日常生活中人体依靠糖类化合物、脂肪、蛋白质来功能,其中糖类化合物可以分解为葡糖,迅速给机体功能,蛋白质用来维持更新机体建设,脂肪是良好的储能物质,彼此相互协作同时又互相牵制,但因机体可以迅速利用糖类化合物,且糖类代谢产物为CO2和水,使机体代谢负担减轻,糖类化合物成为优先供能物质,可能使脂肪分解缓慢,从而游离脂肪酸含量降低[30-31]。游离脂肪酸也为心肌供能,此过程需要消耗更多的氧气,在相同氧含量下,葡萄糖产生的能量高于游离脂肪酸,且有研究表明只有肌细胞用完肝醣时,才会借助脂肪的分解,得到游离脂肪酸,为肌细胞供能[32-34]。除此之外,高原低压、冰山积雪造就了独特的高寒环境,会减慢血流速度,为保持与人体感温度适应,使人体热量动态平衡,人体供能减少,脂肪内的甘油三酯降解为游离脂肪酸的速度变缓[35-37]。另外长期食用高脂肪、高蛋白物,会使机体代谢受到影响,有研究表明饲喂大鼠高蛋白食物,大鼠出现体重减少的趋势,内部脂肪组织的质量下降,游离脂肪酸的生成速度减缓[38]。

4 结论

运用相关分析方法研究发现中年人游离脂肪酸参考值与地理环境存在依存的关系,游离脂肪酸参考值与海拔、表土砂砾百分率呈负相关;与经度、年均风速、表土粉粒百分率、表土pH值、表土总可交换量、T-CaCO3呈正相关。岭回归分析进一步确定了游离脂肪酸参考值与相关的地理指标函数关系为

0.000 41X12+0.000 3X11-0.006 2X7+

0.001 08X10+0.002 97X9±0.113。

通过FFA岭回归方程预测全国2 317个城市健康中年人的游离脂肪酸值,发现中年人游离脂肪酸参考值全国分布趋势是西低东高,南北方向无明显变化。

此外,本次研究的健康中年人游离脂肪酸医学参考值的样本容量较少,数据大部分来源于医学文献,文献摘取数据表现是东部数据量高于西部,一方面是因为黑河腾冲线将我国人口划分为东西两部分,西部人口比东部稀疏;另一方面是受经济文化等因素影响,西部地区较东部地区医疗条件稍微落后,体检研究资料未能及时更新。今后需要进一步扩大样本容量和外环境因子(如空气质量、水文条件等),验证研究游离脂肪酸与地理环境的关系。

猜你喜欢
参考值插值游离
游离股前外侧穿支皮瓣修复足踝部软组织缺损
莫须有、蜿蜒、夜游离
中国健康成年人甘油三酯参考值的空间变异特征
妊娠妇女甲状腺功能血清指标参考值的建立
构造给定极点的有理插值新方法
基于Sinc插值与相关谱的纵横波速度比扫描方法
一种改进FFT多谱线插值谐波分析方法
基于四项最低旁瓣Nuttall窗的插值FFT谐波分析
亚高原地区大、小鼠血液指标正常参考值实验研究
游离血红蛋白室内质控物的制备及应用