张媛婷,胡宗仁,蔡虎志,陈新宇*
1.湖南中医药大学第一中医临床学院,湖南 长沙410007;2.湖南医药学院康复医学与保健学院,湖南 怀化418000;3.湖南中医药大学第一附属医院,湖南 长沙410007
高脂血症是常见慢性病,可导致动脉粥样硬化,引发心脑血管疾病,严重损害人体健康。前期研究发现,“湿”可以引起糖脂代谢紊乱、肠道菌群失调以及肠道蛋白质组学的改变[1-2]。 目前,通过多组学的方式寻找特征生物标志物是系统研究疾病发病机制的重要手段。 发病风险评估、疾病提前预警以及多样、无创、精准的信息化诊断技术是慢性、传染性疾病等高发背景下亟须解决的医学难题。 机器学习是目前分析生物信息大数据以及进行发病预测的重要手段[3-4]。 如通过食物摄入情况即可进行高脂血症发病预测,使用深度神经网络、Logistic 回归和决策树3种预测模型分别对10 731 个受试者进行预测,准确度分别为0.586 54、0.584 48 和0.521 48[5]。 随着样本量以及纳入特征指标的增加,准确度还可以进一步提高。大数据智能分析可以实现科学精准的“见微知著”和“司外揣内”,从而为疾病提前预警提供基础,通过较少的生物信息实现较为精准的预测。鉴于此,本文探索基于“三态四浊”理论的高脂血症预警方法,以探讨中医“治未病”研究的新范式。
高脂血症“三态四浊”预警体系重点关注从“欲病态”到“已病态”人体体征、血液、尿液以及粪便的生物信息从“清”到“浊”的动态变化过程,通过数学模型量化“欲病态”以进行疾病风险预警。
目前,以血脂为主要量化指标的高脂血症疾病预警以及健康管理主要存在4 个方面的问题:第一,血脂低于诊断标准前,难以进行高脂血症患病风险预测,从而提前干预以延缓发病或减少发病;第二,血脂达到诊断标准后,较多患者由于没有明显不适而不进行干预,致使高脂血症继发其他疾病;第三,血脂评价体系过于单一,没有根据体征表现以及血液、尿液、粪便等的理化检测以及生物标志物进行多维度的系统评估,不能全面反映高脂血症发生、发展的病理演变过程,不能综合评估高脂血症引发其他疾病的风险;第四,目前已有很多研究发现高脂血症的生物信息,但对这些指标的研究大多停留在定性水平,没有建立数学模型反映疾病的发生、发展过程,因此不能动态量化高脂血症的发病风险。 “治未病”是中医学的重要理论,包括未病先防、欲病救萌、既病防变、瘥后防复4 个层面。疾病预防和早期干预是“治未病”的核心内容,如何理解高脂血症“未病”的生物学基础,做到精准预防,是目前亟须解决的难题。
将高脂血症的发生、发展态势分为“三态”:不具有危险因素人群归为“健康态”;具有危险因素人群归为“欲病态”;确诊人群归为“已病态”。“欲病态”具有动态性以及显著的个体差异性,是早期筛查和预警的主要对象。 可以利用生物、数学、人工智能等多学科交叉研究手段,揭示高脂血症从“欲病态”到“已病态”发生、发展的生物学原理,明确表征高脂血症的指标,构建高脂血症发病临界状态的数学模型。不同态势阶段,随着脂代谢的变化,人体的生理和病理会随之发生变化,从而表现出从“清”到“浊”的演变。
在“欲病态”时,除肥胖外,其他明显的宏观体征往往较少,而微小的体征改变只能用仪器检测,如用红外热成像技术可以检测机体各个区域微小的体温改变。 但生物学变化往往相对比较明显,在血液、尿液以及粪便中都可能发现特征生物标志物。 根据中医学取象比类的“象思维”方式,可以将高脂血症的体征表现和生物学特征概括为“四浊”,即“体浊”“血浊”“尿浊”“粪浊”。 “体浊”指体征的特殊表现,“血浊”“尿浊”“粪浊”分别指血液、尿液、粪便中蕴含的高脂血症的特征生物学信息。
“体浊”反映的是在脂代谢紊乱过程中机体外部表现出的各种显现的以及微小的改变。高脂血症的发生、发展过程中,除体重、腹围这些比较明显的改变外,心率、脉搏波、体温、身体活动度、睡眠波等人体测量学数据以及体脂肪率、内脏脂肪面积等身体成分分析数据皆可发生微小的改变,这些改变容易被忽视,因此,需要借助现代仪器进行“捕捉”,通过大数据智能分析挖掘有预测价值的表征数据,即基于数学判别模型的“见微知著”和“司外揣内”,从而明确可定量化的高脂血症“体浊”的客观指标。 如研究发现,腰围、腰高比和腰臀比都是高脂血症的独立预测指标,OR 值分别为1.366(1.143~1.562)、1.508(1.260~1.806)、1.252(1.015~1.543)[6]。 研究者通过神经网络模型分析眼底视网膜成像,从而预测血脂异常,ROC曲线下面积达0.703[7]。 研究还发现,倦怠感可以用于预测高脂血症发病[8]。 以上都提示,外在的改变对于高脂血症预测有重要意义。
“血浊”反映高脂血症病理改变过程中血液表现出的生物信息改变。 随着血脂的持续紊乱,血液出现由“清”到“浊”的改变过程。 相较正常人而言,高脂血症患者的血清往往较浑浊,严重者甚至出现乳糜状分层。 人体血液样本较容易获得,而且蕴含大量的代谢、遗传、免疫、内分泌等各个方面的生物信息。 如高脂血症患者血浆代谢组学检测发现,磷脂酰胆碱、磷脂酰乙醇胺、I-尿胆素、白三烯C4 等是潜在生物标志物,高脂血症的发病可能与甘油磷脂代谢、鞘脂代谢、二羧酸代谢、叶酸生物合成等通路的紊乱有关[9]。 遗传表现方面的研究发现,高脂血症患者外周血全基因组DNA 甲基化水平较高,这表明高脂血症发病过程中伴随遗传表现的改变,DNA 甲基化诊断高脂血症的最佳截断点为9.51%,ROC 曲线下面积为0.695,灵敏度为87.04%,特异度为81.67%[10]。内分泌方面,睾酮可以调节代谢,其失衡会导致血脂代谢异常、能量代谢失调以及肥胖的发生,男性的低睾酮水平与女性的高雄激素水平均可伴随不同程度的血脂及能量代谢紊乱[11]。 研究发现,男性高脂血症患者血清睾酮水平明显降低,Spearman 相关性分析发现血清睾酮水平与甘油三酯、高密度脂蛋白胆固醇、游离脂肪酸明显相关(r 值分别为-0.540、0.222、-0.687)[12]。 除此以外,慢性炎症是公认的高脂血症病理改变,目前也发现较多血清炎性标志物如白细胞介素-38等[13]。 研究还发现,中性粒细胞/淋巴细胞比值与高脂血症严重程度呈高度正相关,ROC 分析发现其预测高脂血症的敏感性为68.0%、特异性为78.5%[14]。 可见,“血浊”对于疾病预警有重要意义。
“尿浊”反映高脂血症病理改变过程中尿液表现出的生物信息改变。 尿液不仅是诊断泌尿系统疾病的关键因素,尿酮体、尿糖、尿酸、尿淀粉酶、尿微量半蛋白等也可用于诊断代谢性疾病。 如对高脂血症患者和正常人的尿液进行代谢组学分析,发现22 个与高脂血症相关的生物标志物,涉及氨基酸、脂肪酸、核苷酸、类固醇激素和肠道菌群代谢,这些改变与炎症反应以及氧化应激有关[15]。可见,尿液中的代谢物改变对于预警高脂血症也有价值。
“粪浊”反映高脂血症病理改变过程中粪便表现出的生物信息改变。其中,肠道微生态紊乱和高脂血症发病紧密相关。 如研究发现,高脂血症患者与非高脂血症人群的差异菌群,在科级别主要为毛螺菌科、疣微菌科,在属级别主要为双歧杆菌属、粪杆菌属、拟杆菌属等8 个菌属[16]。 诸如Lactobacillus、Bifidobacterium、Akkermansia、Bacteroides spp.等有益于脂代谢的益生菌丰度降低及其代谢产物如短链脂肪酸、胆汁酸等的浓度改变,对于预警、诊断以及治疗高脂血症均有重要价值[17-18]。
“清浊”其本来意义指水之清澈与否,在中医理论体系不同语境中其意义有所区别,有天地、营卫、轻重、上下、升降、稀稠等不同寓意,这些均具有明显的“象思维”特征。正如《素问·经脉别论》所言:“饮入于胃,游溢精气,上输于脾。 脾气散精,上归于肺,通调水道,下输膀胱。 ”中焦脾胃是饮食水谷运化及精气转输的枢纽,也是痰湿浊气形成的主要场所。痰湿浊气积累过多,泛于肌肤则出现面部油腻、肥胖、疲倦乏力等,表现为“体浊”;痰湿浊气进入血脉,则引起血液浑浊,表现为“血浊”;痰湿浊气泛于各脏腑中则会导致脏腑功能失调,并且引起排泄物的黏腻,出现“粪浊”“尿浊”。 体内的痰湿浊气主要经过尿液及粪便排出体外,即《素问·阴阳应象大论》所谓“清阳出上窍,浊阴出下窍”。进食肥甘厚腻过多,超出了人体正常的运化和排泄功能,或者痰湿浊气伤及脾、肾,导致由实变虚,出现运化功能亏损,均可导致血液、尿液以及粪便中痰湿浊气过多,从而出现“血浊”“尿浊”“粪浊”的微观病理改变,即可出现代谢组学、蛋白质组学以及肠道微生态等的生物学特征改变。
首先,根据高脂血症的诊断标准以及目前公认的高脂血症危险因素,对多中心、大样本的受试者进行定性分类,达到临床诊断标准的归为“已病态”,具有危险因素而未达到临床诊断标准的归为“欲病态”,其余为“健康态”。 通过Spearman 相关性分析、Logistic 回归、Cox 回归、ROC 分析等进行态势组间对比,筛选各态势“四浊”生物信息数据中的候选标志物,再通过前瞻性队列研究进行长期态势追踪,通过态势前后对比对候选标志物的特异性进行验证,从而分析得到特征标志物。
运用生物学、信息学等方法,结合体征信息(如体质量指数、腰围、腰围/体质量、腰围/体质量指数、腰围/内脏脂肪面积)和生物样本检测数据(如血液、尿液和粪便样本的理化检测以及多组学分析),研究从“欲病态”到“已病态”发展的演变过程和内在规律,辨识“欲病态”的宏观体征数据、微观关键分子及其复杂网络,系统性建立高脂血症临界状态和“欲病态”到“已病态”发展过程的生物标志物谱图,鉴定“欲病态”到“已病态”进展的关键因素并阐明相关分子机制,多维度解读“欲病态”的整合生物学基础。
将上一步筛选的“四浊”标志物进行因子权重分析,进一步筛选特异性强和灵敏度高的“四浊”特征指标,并且构建“三态”判别函数,可以根据“四浊”特征指标的变化分析从“欲病态”转为“已病态”的风险,从而实现较为精准的“治未病”。为了进一步开发更为精确的智能诊断和预警模型,可以从XGBoost、CatBoost、RandomForest 等多个机器学习预测模型中选择最佳算法,并且将模型用于受试者,以验证临床模型的敏感性及特异性(图1)。 如Logestic 多元回归分析是进行疾病相关因素分析的基本方法,研究者用其预测高脂血症,利用ROC 曲线下面积(area under the curve, AUC)进行模型评价,AUC达0.741[19]。研究者采用Cox 比例风险回归建立高脂血症预测模型,十折交叉验证法检验模型的预测效果和判别能力,结果预测模型的AUC 为0.741(95%CI:0.731~0.752),灵敏度为0.676,特异度为0.696[20]。 贝叶斯网络可以反映疾病与因素之间的整体联动效应,揭示疾病与病因以及病因与病因之间的复杂网络联系,并且进行风险推理,用MMPC-Tabu 算法构建贝叶斯网络进行高脂血症的风险推理:当体质量指数在正常范围(18.5~24.0 kg/m2)且体型正常时,患高脂血症的风险为26%;当体质量指数>28.0 kg/m2且体型正常时,患高脂血症的风险上升到42%;当体质量指数>28.0 kg/m2且属于中心性肥胖时,患高脂血症的风险提高到57%[21]。 应用C5.0 算法决策树模型预测高脂血症,个人水平模型训练样本和测试样本的预测准确率分别为80.20%和82.02%;临床模型训练样本和测试样本的预测准确率分别为91.13%和88.76%[22]。事实上,纳入的特征性生物学数据越多,预警模型的特异度和灵敏度则更高。
图1 高脂血症“三态四浊”预警模型构建方法
发挥中医药在“治未病”中的主导作用,并且将“治未病”与现代健康管理结合,是目前亟须解决的难题。本文旨在提供一种新的“治未病”研究思路,通过生物信息与机器学习的结合,系统了解“治未病”的现代医学内涵。 高脂血症是中医药治疗的优势病种,有多种可用的干预方式[23-25]。 可通过高脂血症“欲病态”的多维动态数据,建立“欲病态”的宏观、微观量化方法,构建表征“欲病态”的动态网络化模型,发展临界慢化的数学理论,刻画系统失稳前的“欲病态”临界状态,建立“欲病态”到“已病态”转化的网络模型数据库,从而揭示临界转变的共性规律,为系统理解高脂血症发病机制、预判高脂血症发病与进展、实现精准预防以及开发诊疗新技术提供新的研究方法。