复发性外阴阴道假丝酵母菌病患者宫颈病变的多层人工神经网络分类预测模型的构建

2023-03-14 03:41刘昊莫坚
中国计划生育和妇产科 2023年1期
关键词:加德纳杂菌乳酸杆菌

刘昊,莫坚

复发性外阴阴道假丝酵母菌病(recurrent vulvovaginal candidiasis,RVVC)严重影响患者的生活质量、心理健康和性生活[1]。研究表明,长时间的阴道菌群紊乱,可引起人乳头瘤病毒(human papillomavirus,HPV)感染和持续不消退,而进展为宫颈癌[2]。现阶段临床将HPV病毒检测作为宫颈病变的常规筛查方法,但针对宫颈病变的高风险患者,临床缺乏一种简单快速、科学客观的识别方法或预测手段,而且目前影响HR-HPV感染并阻止疾病进展为癌前病变的因素有哪些,国内外尚未达成共识。Logistic回归是采用线性模型,寻找疾病危险因素及预测疾病风险的常用分析方法,但对于当自变量与因变量为非线性关系时,预测效果不够理想[3]。依托大数据学习可根据多项生理指标预测RVVC患者宫颈病变发生风险,与传统统计学方法相比,多层人工神经网络可以高效处理更多医学数据,且可使用函数近似方法拟合复杂的函数,解决非线性分类问题,是RVVC患者感染HR-HPV的一种低成本辅助性风险评估工具。由此,本研究依据多项指标构建Logistic回归及多层人工神经网络模型,预测RVVC患者发生宫颈病变的风险,并比较两种模型的性能,报道如下。

1 材料与方法

1.1 研究对象

选取2016年1月至2020年12月于南宁市第一人民医院妇科门诊就诊,明确诊断为RVVC的152例患者,作为研究对象,行阴道分泌物检查。纳入标准:① RVVC患者:既往患单纯性外阴阴道假丝酵母菌病,经治疗后,临床症状和体征消失,假丝酵母菌检查阴性后,再次出现症状,经假丝酵母菌检查又为阳性,1年内发作 4次或以上;② 有性生活史女性;③ 年龄18~45岁;④ 此次就诊时无阴道炎临床症状;⑤ 无宫颈手术史及HPV治疗史;⑥ 此前疾病处于活动期未用药或缓解期避开局部用药阶段。排除标准:① 有自身免疫性疾病者;② 妊娠期或月经期;③ 合并滴虫、衣原体、淋球菌、HIV等其他性传播疾病者;④ 近1个月连续服用抗生素或其他特殊药物者;⑤ 72 h内有性生活、阴道冲洗或阴道放药者。⑥ 既往有反复阴道炎症,但不符合RVVC标准者。⑦ TCT异常,为ASCUS及以上宫颈病变患者。最终符合入组标准的患者152例,依据HPV E6/E7mRNA检查结果,以HPV E6/E7阳性患者为观察组,以HPV E6/E7阴性患者为对照组,观察组患者65例,对照组患者87例。本研究经南宁市第一人民医院伦理委员会审核批准,所有患者对本研究知情并签署知情同意书。

1.2 观察指标

收集患者年龄、RVVC病程等一般资料及阴道分泌物的微生态指标,如清洁度、乳酸杆菌、加德纳菌及杂菌、乙酰氨基葡糖苷酶、唾液酸苷酶、过氧化氢、白细胞脂酶、pH值等实验室检查指标。

1.3 Logistic回归模型建立

采用单因素方差分析筛选出与宫颈病变相关的变量作为自变量,以是否存在宫颈病变(是=1,否=0)为因变量,进行多因素Logistic回归分析。

1.4 多层人工神经网络分类模型建立

通过R语言利用neuralnet包构建由1个输入层、多个隐含层及1个输出层组成的多层人工神经网络分类模型(图1),该模型是一种深度学习模型,可将输入变量映射到高维非线性空间、学习到多个输入变量之间的复杂相关性,进而提高预测准确性[4]。

图1 多层人工神经网络分类模型示意图

1.4.1 模型入选变量 纳入患者年龄、RVVC病程、阴道分泌物清洁度、乳酸杆菌、加德纳菌及杂菌、乙酰氨基葡糖苷酶、唾液酸苷酶、过氧化氢、白细胞脂酶、pH值10个指标作为多层人工神经网络的输入层,输入层各指标定义及赋值(表1),输出变量为患者检查结果是否属于HPV E6/E7阳性。

表1 各指标定义及赋值

1.4.2 数据预处理 本研究基于多变量方法进行数据分析,根据研究对象是否属于HPV E6/E7阳性进行分类。数据集包括10个输入变量和2个输出变量,其中有2个输入变量部分样本存在数据缺失,缺失率小于0.5%,缺失值以0位填补。通过随机数字法选取数据集的2/3为训练集,1/3为测试集,训练集共102例,用于模型训练,建立预测模型;测试集50例,用于模型测试,检验模型的预测效能。

1.5 统计学方法

2 结果

2.1 单因素分析

两组患者病程、乳酸杆菌、加德纳菌及杂菌、乙酰氨基葡糖苷酶、唾液酸苷酶、过氧化氢、白细胞脂酶、pH值等指标比较,差异均有统计学意义(P<0.05),详见表2。

2.2 多因素Logistic回归分析

将单因素分析筛选出的特征变量作为自变量,以是否存在宫颈病变(是=1,否=0)为因变量,进行多因素Logistic回归分析,结果显示,加德纳菌及杂菌、白细胞脂酶是RVVC患者宫颈病变的危险因素,乳酸杆菌、过氧化氢是保护因素,详见表3。

表3 多因素Logistic回归分析

图2 预测RVVC患者宫颈病变发生风险的多层人工神经网络分类结构图

图3 模型中各指标重要性

2.3 训练集和测试集中各组患者参数比较

训练集和测试集中观察组与对照组患者病程、清洁度、乳酸杆菌、加德纳菌及杂菌、乙酰氨基葡糖苷酶、唾液酸苷酶、过氧化氢、白细胞脂酶、pH值等指标比较,差异有统计学意义(P<0.05)。

2.4 多层人工神经网络分类模型展示

本研究中训练样本102例,测试样本50例,对数据分类的正确率均达到98.26%,模型的诊断参数均为96.12%,说明所构建的多层神经网络预测模型的效果很好。模型展示图见图2。

2.5 可视化模型中各指标的重要性比较

图3为多层人工神经网络分类模型中各指标的重要性排序,根据权重大小,特征重要度排名前4的输入变量分别是乳酸杆菌、过氧化氢、加德纳菌及杂菌、白细胞脂酶。

2.6 模型的预测效能比较

两种模型的预测结果见下页图4,Logistic 回归模型ROC曲线下面积为0.833,灵敏度为0.802,特异度为0.808,在保证模型的稳定性和泛化性的前提下,最终确定多层人工神经网络分类模型ROC曲线下面积为0.987,灵敏度为0.895,特异度为0.889,多层人工神经网络分类模型的预测效能高于Logistic回归模型。

3 讨论

女性生殖道是重要的微生态区域,是由阴道正常解剖结构、阴道微生物群、局部免疫系统和内分泌调节系统等组成的相对平衡复杂体系,是人体重要的生物屏障之一。已有研究证实,HPV感染与阴道微生态菌群构成有关,阴道菌群平衡失调可能增强HPV病毒的表达,从而诱发宫颈病变[5]。RVVC属于阴道菌群失衡的范畴,病情反复难以治愈,长时间的阴道微生态紊乱,可导致阴道微环境pH值升高,延长了宫颈上皮细胞的化生期,导致上皮细胞发育不良,为HPV感染创造良好的条件,增加宫颈病变和宫颈癌风险[6]。目前临床主要通过宫颈液基细胞学检查、进一步病理活检及颈管搔刮明确诊断宫颈病变和宫颈癌[7],尚缺乏高危HPV阳性患者宫颈病变之前的预测方法。传统的Logistic回归模型难以处理高维数据,且对数据分布有较严格的假设,数据不满足条件时,预测精度较低。多层人工神经网络分类模型多元共线性不敏感,可根据假设检验结果及临床经验纳入输入变量甚至将个体有关信息全部纳入,有利于减少个体差异,在寻找高效性预测指标中可发挥重要作用。

本研究发现,加德纳菌及杂菌、白细胞脂酶是RVVC患者宫颈病变的危险因素,乳酸杆菌和过氧化氢是保护因素。女性生殖道是开放性腔道,寄居着多种病原体,正常情况下以乳酸杆菌为优势菌,较为常见的有卷曲乳杆菌、加氏乳杆菌、詹氏乳杆菌和惰性乳杆菌,该菌群占阴道细菌的90%左右[8],其对维持阴道局部正常微环境具有重要作用。健康女性的阴道清洁度为Ⅰ~Ⅱ度,pH值为3.8~4.4,乳酸杆菌以糖原为媒介形成乳酸,释放过氧化氢,维持生殖道酸性环境,抑制其他细菌的生长,进而维持阴道处于正常清洁度及酸性环境。此外,乳酸杆菌表面存在的黏附素可定植于生殖道上皮细胞,并通过刺激机体免疫防御来抵抗外来病原体的入侵[9]。古萍等[10]发现随着乳酸杆菌数目的增多,HPV-DNA的载量逐渐减少,乳酸杆菌产生的过氧化氢与蛋白抑制剂结核抑制了HR-HPV的生长。RVVC发病使某种专性厌氧菌,例如加德纳菌、普雷沃菌、阿托波菌、巨型球菌和纤毛菌成为优势菌异常增生,乳酸杆菌功能受到影响,导致过氧化氢释放减少,破坏局部免疫微环境的生物屏障,利于HR-HPV诱发宫颈的系列演变。此外,在女性阴道中加德纳菌相较于其他厌氧杂菌,表现出更高的细胞毒性,其可通过形成生物膜、产生阴道溶解素、 唾液酸酶、诱导上皮脱落等机制影响疾病结局[3]。白细胞脂酶、唾液酸苷酶与HR-HPV持续感染和宫颈病变的严重程度密切相关[11],白细胞脂酶阳性提示阴道分泌物中有大量多核白细胞被破坏,阴道黏膜受损,存在炎症反应。有研究表明,唾液酸苷酶在肿瘤细胞的生存中有重要地位,其高水平表达有利于肿瘤细胞的凋亡,这一发现在未来可能成为宫颈癌治疗的潜在靶点[12]。

注:A为Logistic回归模型 B为多层人工神经网络分类模型

与传统的统计学方法对数据分布和类型要求对比,多层人工神经网络分类模型具有很强的非线性映射能力,不需要考虑自变量是否满足正态性和变量间独立等条件,还可以根据模拟数学理论对复杂无规律的大规模样本进行量化处理,模型隐藏层数量增多时可将输入变量转化到复杂的非线性空间,以此得到有效向量,分类性能更优[13-14]。本研究Logistic 回归模型预测RVVC发生宫颈病变ROC曲线下面积为0.833,灵敏度为0.802,特异度为0.808,多层人工神经网络模型预测RVVC发生宫颈病变的ROC曲线下面积为0.987,灵敏度为0.895,特异度为0.889,多层人工神经网络模型预测效能高于Logistic回归模型,取得令人满意的效果。本研究多层人工神经网络的输入层纳入的10个指标(年龄、病程、清洁度、乳酸杆菌、加德纳菌及杂菌、乙酰氨基葡糖苷酶、唾液酸苷酶、过氧化氢、白细胞脂酶、pH值)均为妇科阴道微生态检测中的重要指标,在平时的检查中,即可展开宫颈病变和宫颈癌的预测,该预测模型适于在临床上推广应用。

综上所述,本研究构建的多层人工神经网络分类模型相较于Logistic回归模型,预测效能更高,分类性能优良,结果证实加德纳菌及杂菌、白细胞脂酶是RVVC患者宫颈病变的危险因素,乳酸杆菌和过氧化氢是保护因素。但由于本研究样本量有限,加之数据的复杂性和个体差异性,可能导致了过拟合或分类性能下降,今后仍需进一步探究。

猜你喜欢
加德纳杂菌乳酸杆菌
加德纳 跌宕人生
加德纳把幸福变成一个动词
茶树菇感染杂菌的原因和控制方法
三种常见杀菌剂对白僵菌纯化以及生产中作用研究
生产食用菌 石灰用途广
交换生的计谋
加德纳多元智力理论下的历史教学
乳酸杆菌表层蛋白基因结构及功能研究进展
2种乳酸杆菌肠道黏膜免疫调节作用的比较
荧光定量PCR比较不同季节妇女阴道主要乳酸杆菌的差异