周 梅,何莎莎,张先红,杨章菊,范 娟
(重庆医科大学附属儿童医院新生儿科/国家儿童健康与疾病临床医学研究中心/儿童发育疾病研究教育部重点实验室/儿童发育重大疾病国家国际科技合作基地/儿科学重庆市重点实验室 400014)
高危儿是指在胎儿期、分娩时、新生儿期具有各种可能导致脑损伤高危因素的婴儿[1]。有高危因素的婴儿在后期往往面临较高的神经功能障碍后遗症或发育落后的风险[2]。研究证实大脑在生命早期有较高的可塑性,针对高危儿进行早期干预可使神经可塑性最优化,减少高危因素带来的不利后果[3]。因此,在随访工作中如果能早期识别高危儿不良神经发育结果,制订干预计划,对于改善其预后有重要意义。目前,国外循证证据推荐适用于早期脑瘫风险预测的方法有全身运动(general movements,GMs)评估、婴儿运动表现测试(test of infant motor performance,TIMP)、Hammersmith婴儿神经检查,前两种评估工具已在国内临床上应用[4]。GMs评估是一种观察早产儿及足月后4~5月龄小婴儿自发性全身运动以预测其神经发育结果的评估方法,尤其适用于对脑瘫的预测[5]。TIMP是一种评估胎龄32周的早产儿至矫正胎龄58周的婴儿姿势和运动能力的方法,能及早识别婴儿运动发育异常[6]。但目前研究对二者之间的相关性还有争议[7-8],本文就高危儿应用这两种早期神经系统评估方法的一致性进行探讨。
回顾性分析2020年1月至2021年6月在本院新生儿门诊随访的有高危因素的患儿,选择其中在同一天就诊时间内完成 GMs和TIMP的研究对象共246例,男138例,女108例,出生胎龄25~41周,平均(33.85±3.89)周,出生体重650~4 224 g,平均(2 113.42±826.87)g,其中43例完成连续2个GMs评估阶段(即GMs扭动与不安运动阶段)测评,156例仅完成GMs扭动运动阶段测评,47例仅完成GMs不安运动阶段测评。纳入标准(符合以下一条即入选):(1)早产;(2)低出生体重;(3)围产期窒息;(4)缺血缺氧性脑病;(5)颅内出血;(6)中枢神经系统感染;(7)高胆红素血症;(8)持续性低血糖。排除标准:(1)母亲末次月经日期不明确;(2)有肢体畸形无法完成运动发育评估;(3)已知患有遗传或遗传代谢性疾病。本研究经医院伦理委员会批准[(2021)年伦审(研)第(333)号]。
两种方法在各自测评室由两组评估人员独立完成,互不干扰。GMs分为2个阶段:GMs扭动运动阶段(出现于足月后2月龄以内),GMs不安运动阶段(出现于足月后2~5月龄)。扭动运动阶段的异常分为单调性(poor repertoire GMs,PR)、痉挛-同步性(cramped-synchronised GMs,CS)和混乱性(chaotic GMs,Ch)3种亚类;不安运动阶段的异常分为不安运动缺乏(absence of fidget movements,F-)和异常性不安运动(abnormal fidgety movements,AF)2种亚类[5]。
GMs评估通过拍摄录像观察婴儿在非干扰状态下自发的全身运动是否正常。录像记录条件:婴儿放置在辐射台上,穿着纸尿裤或包屁衣,露出头部和四肢,摄像范围包括脸、四肢、躯干,摄像时避免哭闹、打嗝及情绪不佳。录像时间>10 min,对视频按照评估要求剪辑成3.5 min,由2名经过专业培训并获得相关资质的人员完成,一人初评,一人复评。
TIMP有42项评估项目,包括选择性姿势控制、中线对齐、运动质量等13项观察项目和不同姿势方位对婴儿头部控制、对视觉和听觉刺激的反应、防御动作、躯干运动、四肢运动等进行评估的29项诱发项目,如果观察到相应的表现,则该项得分,部分项目分左右侧计分,每项最多可重复测试3次,最后计算出总分,总分为142分,并转换为Z值[6]。根据TIMP手册说明提示,Z值是考察实际偏离均值标准差的距离,Z值<0.5被认为有运动发育迟缓的风险。按照TIMP要求,将婴儿放置在辐射台上,周围环境安静、明亮,在其处于安静、清醒的状态下进行评估,尽量减少穿戴,使身体各部分可被观察,由2名通过相应资格认证的人员轮流完成。
共199例完成GMs扭动运动阶段评估,其中31(15.58%)例正常,162(81.41%)例PR,6例(3.02%)CS;TIMP中59例(29.65%)正常,140例(70.35%)异常。共90例完成GMs不安运动阶段评估,其中70例(77.78%)正常,20例(22.22%)F-;TIMP中35例(38.89%)正常,55例(61.11%)异常。
199例高危儿在GMs扭动运动阶段评估为异常168例(84.42%)明显高于TIMP异常的140例(70.35%),差异有统计学意义(χ2=21.403,P<0.05);GMs扭动运动阶段评估与TIMP具有一般一致性(Kappa=0.302,P<0.05),见表1。GMs扭动运动阶段评估结果为异常组的TIMP评分Z值(-1.00±0.39)明显低于正常组(-0.23±0.24),差异有统计学意义(t=13.862,P<0.05)。
表1 GMs扭动运动阶段评估与TIMP的一致性比较[n(%)]
90例高危儿在GMs不安运动阶段评估为异常20例(22.22%)明显低于TIMP异常的55例(61.11%),差异有统计学意义(χ2=9.030,P<0.05);GMs不安运动阶段评估与TIMP具有一般一致性(Kappa=0.229,P<0.05),见表2。GMs不安运动阶段评估为异常组的TIMP评分的Z值(-1.34±1.0)明显低于正常组(-0.62±0.55),差异有统计学意义(t=4.115,P<0.05)。
表2 GMs不安运动阶段评估与TIMP的一致性比较[n(%)]
近年来,我国每年大约有2 000万新生儿出生,其中10%~20%被诊断为高危儿[9]。高危儿因为有潜在脑损伤风险,后期可能出现不利神经发育结局甚至脑瘫。虽然有多种方法可评估出生后婴儿的脑功能,但对异常发育结局的早期预测仍是挑战。已有meta 分析表明,GMs 评估与TIMP是早期评估婴儿神经发育异常方法中最能有效预测的两个工具[10]。GMs能根据婴儿足月后3月龄的评估结果,对脑瘫等严重神经发育障碍作出早期有效的预测。TIMP主要对矫正月龄4月龄以内婴儿的运动和姿势表现进行评估,侧重于发现与运动相关的功能性动作技能发育迟缓,并为早期干预方案的制订提供依据[11]。
Kappa值反映两种检验方法的一致性,Kappa值越高一致性程度越高[12]。本研究结果显示GMs评估与TIMP有一定的相关性,但一致性程度不高。这与国外研究结果一致,SNIDER等[7]研究结果显示GMs与TIMP、Einstein新生儿神经行为评估量表、Alberta婴儿运动量表等测试之间存在低强度相关性。国内探讨 GMs评估与NBNA评分相关性的研究较多,两项分析扭动运动阶段GMs评估与NBNA评分的相关性结果显示,Kappa<0.289,一致性程度一般[13-14]。这些研究支持PRECHTL等[15]的观点,GMs作为神经不良预后的预测工具,可能反映了一种独特的结构,与测量姿势或行为反映的方法不同。
本研究结果显示,在GMs不安运动阶段和扭动运动阶段评估为异常的患儿中TIMP评分Z值均明显低于正常组。这与国外的一项研究结果相似,PEYTON等[8]分析大脑灰白质评分与GMs评估、TIMP之间的相关性结果显示,在足月后10~15周测试结果中,有异常不安运动模式的婴儿TIMP评分明显低于具有正常不安运动模式的婴儿。提示GMs评估为异常的患儿其发生运动异常的风险较正常结果的患儿高,即使其没有达到TIMP运动迟缓的评分等级,也值得随访者注意,必要时应进行针对性的早期干预。
本研究结果显示,高危儿在GMs扭动运动阶段评估为异常的比例明显高于TIMP评分为异常的比例,但在GMs不安运动阶段评估异常的比例明显低于TIMP异常的比例,这可能与不同阶段GMs运动模式的发展规律有关。根据GMs发展规律,扭动运动阶段异常模式PR发展到不安运动阶段可以表现为正常,CS和(或)持续性F-对后期神经运动发育异常的具有特异性预测指征[16]。国内外研究结果均显示GMs在神经运动发育异常的预测中,不安运动阶段评估特异性和阳性预测值均高于扭动运动阶段[17-18]。GMs倾向于对脑损伤儿异常运动发育结局特别是脑瘫结局的预测,如果将运动发育迟缓与脑瘫共同作为异常运动发育结局,GMs的预测敏感性有所降低[16]。TIMP对于与运动相关的功能性动作细节发育迟缓则更为敏感。提示在随访工作中将二者结合能更全面地评价高危儿脑发育及脑损伤的情况。循证依据也提出早期对严重神经发育障碍的诊断需要应用标准化的组合工具(包括行为测试、神经学评估、脑损伤的确认)来进行全面评估和临床推断[4]。
目前在国内应用较多的是GMs的初级评估,其评估结果只能分类不能量化评分,对于早期干预的效果评估有一定局限。此外,由于GMs在矫正年龄 5~9周龄是两种运动模式的交叉时间,测评需要避开此段时间,所以其随访连续性不如 TIMP,因此在早期干预方案的制订和评价方面TIMP更具有优势[11]。值得注意的是国内已有GMs细化评分的相关研究,虽未大范围开展但其在高危儿随访和干预中的应用价值值得进一步探索[19-20]。
综上所述,大脑发育过程复杂且受多因素影响,难以采用一种方法或技术预测高危儿是否有神经发育障碍。GMs评估和TIMP方法有各自的特点,联合使用可以更加全面地识别脑瘫高风险婴儿,还能发现婴儿早期出现的运动迟缓,便于制订连续性早期干预计划,从而改善其发育结局。本研究为回顾性、单中心研究,样本量较少,研究结果有一定的局限性,未来有必要采取前瞻性研究的方式,扩大样本量和研究范围,进一步验证和深入讨论两种评估方法的临床使用差异。