张峰,周笑涵,黄金容,罗琼,龚强
(1.赣州市妇幼保健院 儿童神经康复科,江西 赣州 341000;2.长沙金域医学检验实验室有限公司,湖南 长沙 410006)
全面发育迟缓(global developmental delay, GDD)指年龄< 5 岁,存在≥ 2 个能区没有达到预期发育标志,且无法接受系统性智力功能评估的儿童[1]。GDD 的病因诊断流程较为复杂,多数与遗传因素有关。尽管多数研究指出,在没有明确病因诊断线索时,拷贝数变异(copy number variation, CNV)检测可以作为GDD 的一线病因学诊断方法[2-3],但GDD 儿童临床症状复杂多样且有遗传异质性,临床医师在分析其遗传病因时多依靠临床经验,主观性较强,目前尚无简单易行的方法对其遗传学病因的概率进行快速判断,没有统一的量化标准[4]。本研究旨在通过分析GDD 患儿的遗传学临床特征,制订不明原因GDD 患儿遗传因素风险预测表,以量化分值的方式帮助临床医师,尤其是非神经遗传专科医师,快速筛选出需要进一步进行遗传学检测的患儿,缩短病因学诊断流程,避免重复检查或漏诊。
选取2019 年6 月—2022 年6 月在赣州市妇幼保健院儿童神经康复科就诊的散发性不明原因GDD患儿396 例。依据基因测序结果将检测结果阳性的患儿归为阳性组(130 例),检测结果阴性的患儿归为阴性组(266 例)。阳性组男性84 例,女性46 例;中位数月龄18(8,50)个月。阴性组男性191 例,女性75 例;中位数月龄22(9,49)个月。两组患儿性别、月龄比较,差异均无统计学意义(P<0.05),具有可比性。本研究经医院医学伦理审查委员会批准,患儿家属签署同意书。
1.2.1 纳入标准 ①符合GDD 诊断标准[1];②依据《儿童智力障碍或全面发育迟缓病因诊断策略专家共识》[1]常规非遗传学检查仍无法明确病因学诊断的GDD 患儿;③依据《儿童智力障碍或全面发育迟缓病因诊断策略专家共识》[1]中诊断程序进行遗传学检测。
1.2.2 排除标准 ①依据上述专家共识,经家族史、体格检查、临床非遗传学辅助检查即可明确病因学诊断的患儿;②孕期及围生期病史不明,或儿童遗传背景不清晰的患儿;③患儿正在接受基因治疗或其他因素导致遗传物质改变的因素;④既往已经在产前诊断筛查或常规核型分析中明确诊断的患儿。
1.3.1 不明原因GDD 患儿遗传因素风险预测表的编制方法 查阅不明原因发育迟缓病因学研究相关文献[5-7],结合临床专家意见初步将25 项GDD 患儿可能存在的临床特征作为相关因素纳入量表条目池[8]。依据经典测量理论(classical test theory,CTT)区分度分析法及逐步回归法进行量表条目筛选[9]。将患儿的基因检测结果作为因变量,再将收集的25 项临床特征作为自变量,先对比各项条目在阳性组和阴性组间的差异,结合文献分析及专家经验,确定本量表的入选条目。将其中差异有统计学意义的条目纳入Logistic 回归模型,进一步分析各条目预测阳性基因结果的能力,据此对各项条目进行赋分,制作不明原因GDD 患儿遗传因素风险预测表。遗传因素风险预测表用于对所有入选患儿进行复测,绘制受试者工作特征(receiver operating characteristic, ROC)曲线分析本量表预测患儿基因诊断的能力,并计算最佳截断值[10],同时得出对应的敏感性、特异性、阳性预测值、阴性预测值,评估本量表应用于临床GDD 诊断流程的实用价值。
1.3.2 基因测序方法 采集患者及其父母外周血各3 mL 置于抗凝管。使用血液基因组柱式中量提取试剂盒(中国康为世纪生物科技股份有限公司)提取基因组DNA,用Qubit 2.0 型荧光计、0.8%琼脂糖凝胶电泳对DNA 样本进行质检。使用xGen®Exome Research Panel v1.0 捕获探针(美国IDT 公司,)与基因组DNA 文库序列进行液体杂交,将目标区域DNA 片段进行富集,构建全外显子文库。二代测序在NovaSeq 6000 测序仪(美国Illumina 公司)上进行高通量测序,目标序列测序覆盖度≥ 99%。CNV-seq 分析使用患者2 mL 外周血标本,经基因组片段化、末端补平修复、3'-端腺苷化和加多聚A 接头后,经4~6 轮连接介导聚合酶链反应扩增,建立全基因组文库。高通量测序在NovaSeq 6000 测序仪上完成,使用BWA 软件包,将测序序列与Ensemble参考基因组GRCh37/hg19 进行比对。变异致病性使用美国医学遗传学临床实践指南分级[11],最后由临床医师确认报告结果。
数据分析采用SPSS 25.0 统计软件。计量资料以中位数和四分位数[M(P25,P75)]表示,比较用秩和检验;计数资料以率(%)表示,比较用Fisher 确切概率法;影响因素的分析用多因素逐步Logistic 回归模型;绘制ROC 曲线。P<0.05 为差异有统计学意义。
阳性组与阴性组患儿父亲高龄生育、MRI 提示结构畸形、癫痫、毛发异常、头围异常、颅骨外观异常、皮肤异常、眼外观异常或畸形、鼻梁外观异常或畸形、耳廓畸形或耳位异常、下颌畸形、牙齿异常、出生低张力、非智力因素合并症比较,差异均有统计学意义(P<0.05)。两组患儿母亲高龄生育、父母不良生活史、不明原因流产史、辅助生殖、早产、孕期及围生期异常史、孤独症谱系障碍、口腔或腭弓畸形、生殖器外观异常、肢体畸形、器官畸形比较,差异均无统计学意义(P>0.05)。经文献检索提示肢体畸形、器官畸形高度提示遗传性病因[12],结合专家经验,仍将其保留。最终将父母不良生活史、不明原因流产史、辅助生殖、早产、孕期及围生期异常史、孤独症谱系障碍6 项条目从量表中剔除。将剩余的19 个项目确定为最终量表条目。见表1。
以基因检测结果为因变量(阳性组= 1,阴性组=2),以假设检验中差异有统计学意义(以P<0.20)的指标即父亲高龄生育、父母不良生活史、不明原因流产史、MRI 提示脑结构畸形、毛发异常、头围异常(头围无异常= 0,头围偏小= 1,头围偏大= 2)、颅骨外观异常、皮肤异常、眼外观异常或畸形、鼻梁外观异常或畸形、耳廓畸形或耳位异常、下颌畸形、口腔或腭弓畸形、生殖器外观异常、出生低张力、非智力因素合并症、器官畸形为自变量(除头围外各自变量无异常赋值为0,有异常赋值为1),进行多因素逐步Logistics 回归分析(引入水准是0.05,剔除水准是0.10),结果显示:鼻梁外观异常或畸形[=5.272(95% CI:1.007,27.607)]、耳廓畸形或耳位异常[=6.987(95% CI:1.555,31.383] 及非智力因素合并症[=3.826(95% CI:1.884,7.771] 均为GDD 患儿遗传学检测阳性预测因素(P<0.05)。见表2。
表2 不明原因GDD患儿遗传风险预测因素的多因素逐步Logistic回归分析参数
依据以上统计学分析,结合相关文献及专家经验,笔者将最终保留的条目合并整理为5 大类条目(双亲因素、异常面容、器官畸形、非智力因素合并症、异常头颅MRI 改变)作为最终量表条目。依据GDD 基因测序指南[13],将阳性家族史、既往产前诊断遗传学筛查阳性、具有典型的面容及临床症状作为独立危险因素。依据Logistics 回归分析,将鼻梁及鼻翼畸形(包括鼻梁扁平)、耳廓畸形或耳位异常、非智力因素合并症3 项差异有统计学意义的项目赋值2 分,鉴于鼻梁畸形与耳廓畸形的高权重值,将单独列出,各赋值2 分。文献报道,不明原因GDD儿童神经发育障碍或脑结构畸形MRI 改变高度提示遗传性病因,因此赋值2 分[14-15]。除鼻梁与耳廓畸形的其他外观异常,每项赋值1 分,最高2 分。不明原因GDD 患儿遗传因素风险预测表的最终版本见表3。
表3 不明原因GDD患儿遗传因素风险预测表
对396 例PDD 患儿信息使用本量表进行复测,以基因检测结果为因变量(阴性组= 2,阳性组= 1),以患儿量表分数为自变量,绘制ROC 曲线,分析本量表预测患儿基因诊断的效能,并计算最佳截断值,结果显示曲线下面积(area under curve, AUC)为0.707(95% CI:0.649,0.765)。见图1。
图1 遗传因素风险预测表预测PDD患儿的ROC曲线
计算约登指数后得出最佳截断值为2.5 分,但由于量表实际赋值均为整数,可认为最佳截断值为3 分,其所对应的敏感性为60.8%(95% CI:0.518,0.691),特异性为75.6%(95% CI:0.699,0.805)。其他最佳截断值对应的各项统计值见表4。
表4 不同最佳截断值及量表分数对应的统计值
GDD 为暂时性诊断,在年龄> 5 岁时,如达到智力低下诊断标准应该修正诊断。一些轻度发育迟缓的儿童通过适当的支持性措施,5 岁前可能进步至正常功能范围而不再符合智力障碍的诊断标准[16]。对GDD 儿童进行准确的病因学诊断是临床进行有效康复治疗的前提,能最大限度地减轻患儿功能障碍程度,改善预后[6,17]。由于GDD 儿童病因的多样性,诊断流程较为复杂,临床医师在诊断过程中常常在时间成本和经济成本的选择中难以抉择[6]。文献报道,GDD 儿童遗传因素病因占30%~50%[18]。在决定是否需要进行遗传学检测时,家长通常希望医师能针对孩子检测结果阳性率给出准确的估值。本研究通过简单的量表评分就能直观地提供量化数据,同时整合了遗传病因GDD 患儿的临床特征,以方便临床医师辨识,并明确各项特征的权重,为临床医师对患儿是否需要进行遗传学检测提供决策参考,从而缩短GDD 儿童的诊断时间,也能帮助家长理解患儿病情,提高诊疗依从性。
当患儿得分为1 分时,此时阳性预测值为0.330,即患儿只有33%的概率基因检测结果为阳性;当患儿得分为3 分时,患儿为真阳性的可能性为54.8%;而当患儿得分为9 分和> 14 分时,患儿为真阳性的概率分别达到75%和100%。
有研究报道,通过CMA 和WES 对GDD 儿童进行病因学诊断的阳性率为60.7%,ID 合并运动障碍的阳性诊断率可达100%[19],目前多个GDD 诊疗指南的病因诊断流程均推荐CMA 作为一线检测手段[1,15,20],如仍无法明确诊断再选择二代测序的相关检测方法。但各项指南均推荐在临床特征具有特异指向性的情况下,如阳性家族史、既往产前诊断遗传学筛查阳性、具有典型的面容及临床症状,应针对其进行特异性遗传学检测。因本量表的制订主要是为了解决无临床线索GDD 患儿的遗传学风险预测,故此将以上因素视为独立危险因素,推荐直接对其进行相对应的遗传学检测,而并未进行风险测序评分。
本研究在进行各项临床特征统计时,多因素逐步Logistic 回归分析提示只有鼻梁及鼻翼畸形(包括鼻梁扁平)、耳廓畸形或耳位异常、非智力因素合并症3 项有统计学意义,虽然鼻梁畸形与耳廓畸形同属器官畸形,鉴于其高权重值,将其单独列出。母亲高龄生育在初始统计学分析时差异无统计学意义,但回顾样本数据发现,高龄母亲与高龄父亲的伴随关系呈高度一致性,与文献报道一致[21]。因此,本研究将父母高龄均作为危险因素纳入统计范畴。不明原因流产史虽然有统计学意义,但只发生在阴性组,属于阴性指标,因此并未纳入预测指标。父母不良生活史、辅助生殖、早产、孕期及围生期异常史的影响因素众多,难以用单一遗传因素进行解释。依据现有研究证据,孤独症谱系障碍的病因系多基因病的可能性大,且与环境因素有关。加之以上因素在两组间比较差异均无统计学意义,因此将以上因素排除,不作为遗传风险因素的预测指标。最终,本研究选定了5 项指标作为GDD 遗传风险预测的最终量表条目,分别是双亲因素、异常面容、器官畸形、非智力因素合并症及异常头颅MRI 改变。
目前涉及GDD 的已知遗传综合征有300 多种,尽管遗传学测序技术有了明显的提升,但仍有多种疾病涉及多基因及其他环境因素而无法明确具体病因[22]。de VRIES 等[23]试图通过量表筛查的方法来帮助临床医师识别脆性X 综合征,该量表将家族史、皮肤、耳朵、面容、关节、睾丸及人格症状7 项指标进行评分,得分越高脆性X 综合征的可能性越大。该筛查量表的使用使得脆性X 的识别更为简单,准确率也更高[23]。本研究涉及的量表涵盖了该量表的内容,依据其评分标准进行遗传学风险预测评分,除外家族史独立危险因素,具备所有脆性X 综合征特征的患者得分在8 分,提示具有95%的遗传学病因风险,两者均具有预测其遗传学病因风险的价值,结论一致。de VRIES 等[24]在后期又制作了一份亚端粒重排患者检视表,该量表将智能落后家族史、宫内发育迟缓、生后发育迟缓、头围、矮身材、面部畸形及其他脏器畸形作为评分指标,评分最佳截断值为6 分;该量表同样可以提高疾病的临床识别率及准确率。在除外独立危险因素族史的情况下,依据该量表评分指标进行不明原因全面发育落后遗传风险量表评分,亚端粒重排患者得分为10 分,提示具有97.7%的遗传学病因风险,两者结论一致。但与本研究量表相似,de VRIES 等[23-24]设计的2 个量表也存在随分值增加特异性升高,但敏感性下降的问题。
作为一项风险提示作用的量表,本量表仍然存在许多不足[25]。由于本研究涉及的样本是在排查非遗传性病因后仍无法明确病因的GDD 儿童样本。因此,本研究提供的遗传因素风险预测量表并不能作为独立遗传学检测参考依据,无法替代医师的临床判断。尽管国内学者认为遗传性因素占多数,但对于遗传学风险均基于临床经验总结,尚无量化指标[26-27]。在临床上仍然无法通过快速量表化筛查出病因学结论[28],本研究对GDD 儿童病因学筛查提供了一种新思路,具有一定创新性。
尽管本研究提供的量表AUC 为0.707,但在进行最佳截断值计算时,无论取哪一个分值作为预测阈值,均不能同时取得较为满意的敏感性和特异性。本研究通过约登指数计算得出GDD 遗传风险检查表的最佳截断值为≥ 3 分,其敏感性为60.8%,特异性为75.6%,这将会漏诊约39.2%的真阳性患儿,并误诊24.4%的真阴性患儿。而将阈值设为≥ 1 分时,虽然敏感性达97.7%,几乎不会漏诊,但同时量表也会将绝大多数(96.6%)真阴性的患儿预测为假阳性,使量表基本失去了筛选的作用,故仍有待进一步完善及修正。