彭思意,魏 涛,李旭英,李金花,陈 勇
中南大学湘雅医学院附属肿瘤医院/湖南省肿瘤医院,湖南 410013
目前,维生素D 缺乏的全球现患病率高达40%~90%[1-3],已经成为全球性的公共卫生问题,在各年龄段人群中均可发生[4]。维持足够的维生素D 水平对于预防佝偻病、骨软化症、骨质疏松症和骨折非常重要[5],而维生素D 缺乏也与糖尿病、癌症、心血管疾病、自身免疫性疾病、感染和认知功能低下密切相关[6-10]。血清中25-羟维生素D[25(OH)D]的浓度是临床公认的衡量维生素D 水平的最佳指标,然而目前对维生素D缺乏的诊断标准仍存在一定的争议,有学者认为人体25(OH)D 最佳水平需达到75 nmol/L,而有学者认为25(OH)D 达到50 nmol/L 水平对于大多数人来说已经足够,<50 nmol/L 为维生素D 不足,<25 nmol/L 表明维生素D 严重缺乏,将会引起严重后果,需立即进行临床干预[11-12]。随着人们健康意识的提高,近年来,澳大利亚维生素D 血液检测的数量增加了100 倍,每年花费澳大利亚医疗保险约9 600 万美元[13],欧美国家也出现了相似的情况[14-15]。为了减少医疗资源不必要的消耗以及病人的经济负担,各国指南推荐维生素D 缺乏的管理以预防为主,血液检测应针对有风险的人群进行[16-17]。维生素D 缺乏的风险预测模型作为评估和筛查维生素D 缺乏高风险人群的工具,可为临床医护人员提供快速确定一个人的维生素D 水平简便的方法,也为促进临床维生素D 规范性补充提供重要参考。
此前,国内外多项研究已确定了多种与维生素D缺乏相关的危险因素,这些因素可为开发维生素D 缺乏或不足的预测模型提供参考。①人口统计学因素:包括年龄、体质指数(BMI)与种族。老年人以及BMI较高的人群维生素D 缺乏的风险较高[18-19];有色人种如黑人因皮肤色素沉着,导致维生素D 的合成减少,从而增加维生素D 缺乏风险[20]。②居住环境:包括纬度、城市、季节,长时间居住在纬度较高的地区、居住在城市以及春冬季节等都可能因日光照射不足而导致维生素D 缺乏风险增加[21-23]。③生活方式:包括饮食、活动、吸烟、饮酒、日晒,坚持食用维生素D 含量较高食物如鱼、蛋黄、鱼肝油、牛奶等的人群,25(OH)D 水平显著高于未食用人群[24-26];长期处于室内或缺少室外活动而日照时长不足的人群均会造成维生素D 缺乏风险增加[18];吸烟及过量饮酒被证明是维生素D 缺乏的危险因素之一[27-28];使用防晒霜阻挡了紫外线,导致维生素D 合成水平下降,经常使用防晒产品的人群维生素D缺乏的风险相应增加[29]。④药物因素:抗惊厥药和糖皮质激素等可能影响骨转换,导致骨密度下降,从而增加维生素D 缺乏的风险[18]。⑤心理因素:维生素D 与抑郁情绪存在相关性,两者互为因果[30]。
2.1 简单的维生素D 缺乏风险预测模型 Tran 等[31]在双盲随机对照D-Health 临床试验项目中前瞻性收集了澳大利亚东部644 例60~84 岁老年人的相关资料,以25(OH)D<25 nmol/L 和<50 nmol/L 作为维生素D 缺乏的截断值,采用单因素及多因素Logistic回归分析筛选出7 个危险因素,分别为年龄增长、BMI升高、环境紫外线辐射水平降低、缺乏体力活动、户外活动时间减少、维生素D 摄入量减少以及自我报告健康状况不佳。该研究通过受试者工作特征曲线(ROC)分 析,<25 nmol/L 组ROC 下 面 积(AUC)为0.82(0.77,0.87),<50 nmol/L 组AUC 为0.73(0.69,0.77),Hosmer-Lemeshow 拟合优度检验显示模型拥有良好的区分度和一致性,且<25 nmol/L 组的预测效果优于<50 nmol/L 组;当<25 nmol/L 模型决策曲线的概率阈值在10%~20%时,灵敏度、特异度最优,分别为0.74,0.73,阳性预测值为0.24,阴性预测值为0.96,提示在该区域内模型的临床收益最理想。虽然该风险预测模型具有中等的灵敏度和特异性,但其阳性预测值较低,表明预测出发生维生素D 缺乏人群的可能性较低,可能与整体样本中<25 nmol/L 人群所占比例较低有关,但此研究仅进行模型内部验证,其临床适用性尚有待进一步验证。
Lee 等[32]于2016 年建立了针对膝或髋关节置换手术病人维生素D 缺乏的风险预测工具,通过回顾性研究收集了227例行关节置换术病人的资料,以25(OH)D<30 nmol/L 作为维生素D 缺乏的截断值,采用Logistic回归分析纳入4 项危险因素,即环境中紫外线辐射(UVR)、上周的日照量、牛奶摄入量和西安大略和麦克马斯特大学骨关节炎指数(WOMAC)评分,构建风险预测模型,该模型AUC 为0.76(0.65,0.87),同时决策曲线结果显示,在概率阈值为0.1 时,风险评分模型的净获益最高,灵敏度为68%,特异度为69%,Hosmer-Lemeshow 拟合优度显示模型拟合度良好。该模型是国内首个维生素D 缺乏预测模型,针对行关节置换术病人制定,该模型为预测病人术前维生素D 缺乏发生风险提供参考,但研究未进行内部及外部临床验证,其临床适用性如何尚有待进一步探讨。
2.2 维生素D 缺乏风险评分系统 Sohl 等[33]报告了老年人(平均年龄76 岁)维生素D 缺乏风险评分工具,采用前瞻性队列研究方法,调查了1995 年—1996 年1 509 例荷兰老年人的人口学资料(年龄、BMI 等)、行为学资料(如骑自行车、园艺、运动、步行、饮酒、吸烟情况等)、自我报告的健康状况(是否有食欲、抑郁情绪、焦虑、活动受限、行走时疼痛、精神状态)及药物使用情况(补充维生素D 等),以25(OH)D <30 nmol/L 和<50 nmol/L 作为维生素D 缺乏的截断值,采用逆向选择Logistic 回归分析每个变量与维生素D 缺乏的关系,分别构建出2 个维生素D 缺乏风险评分系统。<30 nmol/L 模 型 纳 入 了10 个 风 险 因 素,<50 nmol/L 模型纳入了13 个风险因素,每个因素的回归系数做整数化处理,赋予不同分值。<30 nmol/L 模型总分为6~204 分,当维生素D 缺乏风险评分≥110 分时为高风险,灵敏度为61%,特异度为84%,AUC 为0.80;<50 nmol/L 模型总分为8~97 分,当维生素D 缺乏风险评分≥58 分时为高风险,灵敏度为61%,特异度为82%,AUC 为0.78。因该研究中只有3.8%的研究对象维生素D 浓度<30 nmol/L,因此只对<50 nmol/L 模型进行了验证。该模型首次将小型精神状态检查(是否记得年份/日期)纳入风险评估中,为维生素D 缺乏风险预测模型的建立提供了新的参考,也为筛查与预防维生素D 缺乏提供了量化的风险评分工具。但该预测模型不能具体估计个体维生素D 缺乏的发生率,只能区分高低风险人群,存在一定的局限性。
2014 年,巴西学者Lopes 等[34]采用横断面研究方法调查了908 名圣保罗市≥65 岁社区居民的相关资料,以25(OH)D≤20 ng/mL(约50 nmol/L)作为维生素D 缺乏的判断标准,将研究对象随机分为训练样本(n=750)和测试样本(n=158),采用多变量Logistic回归分析确定维生素D 缺乏危险因素并建立风险评估模型,最终建立维生素D 缺乏风险指数=2.2×女性+2.6×糖尿病+5.2×冬季/春季。根据危险因素“有”“无”赋值为0 分或1 分,总分为0~10 分,通过测试样本ROC 曲线分析,当风险评分≥3.7 分时为高风险,灵敏度为55.9%,特异度为72.3%,阳性预测值为74.3%,阴性预测值为53.4%,AUC 为0.685,68.5%的病人能够被准确分组。该研究为临床简便、快速地筛查出维生素D 缺乏高危人群提供工具,但考虑到模型的实用性,作者将甲状旁腺激素>65 pg/mL 这一危险因素排除,然后根据OR 值对其他3 个因素进行赋值,使模型加权总分为10 分,但其赋值比例未见报道。
2016 年,法国学者Deschasaux 等[35]基于一项双盲随机对照试验前瞻性收集了1 557 名法国成年人的相关资料,并用大型前瞻性营养调查项目NutriNet-Sante中的781 名受试者验证模型。其对维生素D 缺乏的界定为25(OH)D≤20 ng/mL(约50 nmol/L),用多因素Logistic 回归方程筛选出7 个风险因素,包括性别、肥胖程度、体力活动、居住纬度、季节、日照情况以及Fitzpatrick 皮肤分型。根据回归方程中变量的OR 值构建评分系统,女性、BMI<25 kg/m2、低体力活动、冬季、中等阳照以及Fitzpatrick 皮肤分型为Ⅰ、Ⅱ、Ⅴ、Ⅵ型评分为1.5 分,纬度≥48°N 和春季评分为2.0 分,肥胖(BMI≥30 kg/m2)和深秋评分为2.5 分,低日照评分为3.0 分,若为男性、BMI<25 kg/m2、体力活动>1 h、纬度<48°N、夏季、高日照以及Fitzpatrick 皮肤分型为Ⅲ、Ⅳ型则评分为0 分。总分0~14 分,风险评分<7 分为低风险,7~8 分为中风险,≥9 分为高风险。采用ROC 评估预测模型的预测效能,模型构建组的AUC为0.70±0.01,灵敏度为67%,特异度为63%,阳性预测值为70%,阴性预测值为59%;验证组的AUC 为0.67±0.02,灵敏度为61%,特异度为66%,阳性预测值为55%,阴性预测值为71%。该研究虽然样本量较大,但模型验证组显示阳性预测值较低,表明预测出发生维生素D 缺乏人群的可能性较低,可能与验证组大部分资料是由研究对象自我报告获得,且关于阳光照射、Fitzpatrick 光照类型部分缺失有关,需进一步在前瞻性队列研究中进行验证,以证实其临床实用性。
荷兰Merlijn 等[36]于2018 年建立了针对老年妇女维生素D 缺乏的风险预测工具,研究以2 689 例研究对象作为模型构建组,以856 例研究对象作为模型验证组,以25(OH)D<30 nmol/L、<40 nmol/L、<50 nmol/L、<60 nmol/L 作为维生素D 缺乏的截断值,采用Logistic 回归模型(向后法)分析每个变量与维生素D 缺乏之间的关系,构建出4 个不同程度的维生素D缺乏风险预测模型。4 个模型都包含的预测因素有年龄、BMI、维生素D 补充剂、复合维生素补充剂、补钙、夏季户外活动≥1 h/d、采血季节、使用助行器和吸烟,<30 nmol/L、<40 nmol/L 模型还包括了食用人造黄油和多脂鱼这两个预测因素。每个模型都根据预测因素的回归系数做了整数化处理,赋予不同的分值,预测模型AUC 为0.72~0.77。<30 nmol/L 模型AUC 最高,模型验证组的AUC 为0.71~0.82。虽然该模型是基于大数据调查构建,结果的可推广性较强,但<30 nmol/L、<40 nmol/L 模型显示出较低的阳性预测值,表明预测出发生维生素D 缺乏人群的可能性较低,这可能与样本量过大,25(OH)D<30 nmol/L、<40 nmol/L 阳性病例较少(分别占10%、35%)有关,且研究只针对有骨折高风险的女性群体,对健康的老年妇女临床适用性如何,有待进一步研究。
2019 年,日 本 学 者Kuwabara 等[37]前 瞻 性 调 查 了649 名19~70 岁日本成年人维生素D 缺乏情况,收集了研究对象一般资料、身体疾病、用药情况、生活及饮食习惯等信息,以血清25(OH)D 浓度<20 ng/mL(约50 nmol/L)为结局指标,以其中434 名作为建模队列,215 名进行验证,采用逐步向后选择多变量Logistic 回归分析,构建出维生素D 缺乏预测模型。预测指标包括年龄(<40 岁)、性别(女性)、抽血季节(秋冬)、运动习惯、晒黑×防晒霜、最近3 个月的日照量、摄入含高维生素D 的鱼(每周<2 次)7 个条目,每个条目以回归系数乘以8 做整数化处理,赋予不同的分值。模型总分为0~54 分,通过ROC 曲线分析,在模型构建队列和验证队列中,AUC 分别为0.78(0.74,0.82)和0.75(0.69,0.82)。当截断值为31 分时,敏感性为61%,特异性为79%,阳性预测值和阴性预测值分别为81%和57%。拟合优度检验表明模型拟合度良好。该研究充分收集了临床数据,运用建模样本构建了评估模型,其后又在验证样本中对模型的评估效能进行了评价和验证,使评估结果的临床指导意义加强。但样本来源于日本人群,某些条目如高维生素D 鱼类摄入是日本特色的饮食习惯,其在我国的适用性有待研究,未来需要扩大研究人群和样本量,进一步验证该模型的适用性和预测性能。
2.3 维生素D 缺乏个体化预测模型 2012 年,美国学者Bertrand 等[20]报告了一种基于血清25(OH)D 连续值计算平均值的预测模型,通过分析护士健康研究(NHS)、护士健康研究Ⅱ(NHSⅡ)和卫生专业人员随访研究(HPFS)这3 项前瞻性队列研究4 487 名医护志愿者的数据,采用多元线性回归方法构建模型:25(OH)D=β0+β'X',其中β0代表截距(NHS:22.69,NHSⅡ:35.78,HPFS:31.94),β'代表回归系数,X'代表预测因子。独立预测因子包括种族、居住地紫外线辐射量(仅适用于NHS 和HPFS)、膳食中维生素D 摄入量、维生素D 补充剂摄入量、BMI、体力活动、酒精摄入量(仅适用于NHS 和NHSⅡ)、绝经后激素使用(仅限于NHS)和抽血季节。该研究采用Spearman 相关系数评估25(OH)D 预测得分与25(OH)D 实际水平之间的一致性,并通过25(OH)D 预测得分和25(OH)D实际水平的五分位数对验证样本中的个体进行交叉分类,结果显示NHS、NHS Ⅱ、HPFS 模型Spearman 相关系数分别为0.23(0.16,0.29),0.40(0.32,0.47),0.24(0.18,0.30),NHS、NHS Ⅱ、HPFS 模型对相同五分位数或相邻五分位数的分类准确率分别为59.8%、66.5%、61.4%,模型具有中等的预测性能和一致性。该风险预测模型能够个体化预测维生素D 缺乏发生率,但目前缺乏外部验证结果的支持,其临床适用性如何,有待进一步研究。
2.4 基于机器学习构建的维生素D 缺乏预测模型 2015 年,法国学者Annweiler 等[38]报道了一项应用人工神经网络(artificial neural network,ANN) 构建维生素D 缺乏预测模型的研究。该研究基于法国里昂的健康检查中心“Prévention des Chutes,Réseau 4”项目1 924 名65 岁及以上的社区志愿者的数据,随机选取总样本中70%(n=1 346)的志愿者作为训练样本用来构建模型,剩余30%(n=578)的志愿者作为测试样本用来验证模型。然后在23 个临床变量中选择不同的临床变量组合作为输入变量,以25(OH)D≤75 nmol/L、≤50 nmol/L 和≤25 nmol/L 为输出变量构建多个人工神经网络模型。最后发现以性别、年龄、BMI、每天用药次数、使用抗骨质疏松药物、使用精神活性药物、戴眼镜、使用助行器、悲伤情绪、害怕跌倒、跌倒史、认知障碍、营养不良、多伴随疾病、脊椎骨折史、独居这16个临床变量构建出的人工神经网络模型优于其他模型。维生素D≤75 nmol/L、≤50 nmol/L、≤25 nmol/L模型的预测准确率分别为0.963,0.815,0.825,AUC 分别为0.938,0.867,0.835,一致性指数Cohen's Kappa 值分别为0.793,0.578,0.550。表明模型预测效能良好,但≤50 nmol/L、≤25 nmol/L 模型拟合优度一般。人工神经网络能有效克服线性模型的局限性,在复杂多变临床数据中更好地挖掘其潜在规律,对维生素D 缺乏的预测和预防具有重要临床指导意义。但目前尚未见该模型的外部临床验证,其临床适用性如何,有待进一步研究。
目前报道的预测模型中,仅有1 项为回顾性研究[32],其余均为前瞻性研究[20,31,33-38],获取的相关资料较为全面,然而大部分生活方式预测因子(如缺乏体力活动)是通过研究对象自我报告获得的,未经过特定的量表衡量,其证据水平有待考量。大多数研究采用Logistic 回归进行危险因素的分析[31,33-37],少数研究采用了线性回归模型[20]、人工神经网络模型[38],其中有5 项研究[33-37]将预测因子转换为简单的分值。模型各有其优缺点,仅法国Deschasaux 等[35]构建的模型进行了外部验证,未检索到研究比较不同预测模型的临床效益或经济效益,何种预测模型较好尚无统一意见。此外,各预测模型中维生素D 缺乏诊断标准并不一致,且大部分研究的对象局限于本土人群,这可能是这些预测模型未能在全球范围中广泛应用的原因之一。今后模型构建中还需考虑纳入文化、宗教习俗和民族服装风格等因素,提高维生素D 缺乏预测工具的全球适用性。
综上所述,国外就各种风险因素构建的维生素D缺乏预测模型较早且多,而国内大部分相关研究则局限于对维生素D 缺乏危险因素的研究,预测模型的构建起步较晚。研究者应在大样本、多中心研究基础上进一步探究维生素D 缺乏的影响因素,在大数据的基础上对国内外预测模型进行多人种、多地区的临床验证,优化预测模型,并进一步实现预测模型的网络化,以期为临床医护人员提供简便、高效、智能的维生素D缺乏风险预测工具,有助于避免维生素D 缺乏低风险人群进行不必要的血液检测,也为促进临床维生素D规范性补充提供重要参考。