王浩原,王崴然,白春梅,刘甜甜,土增荣
(山西医科大学,太原 030000)
自1978年世界首例试管婴儿诞生以来,行体外受精(IVF)和卵胞浆内单精子注射(ICSI)助孕治疗的不孕症患者逐年增多。据人类受精和胚胎学管理局统计,1991年至2019年欧洲行IVF/ICSI-ET治疗的周期数目从6 700个增加到69 000个,已有超过39万例婴儿通过辅助生殖技术(ART)出生。但是,截止到2019年IVF的妊娠率最高只有32%左右[1],许多患者需接受多次IVF治疗才能成功妊娠,这不仅增加了患者的精神和经济成本,也增加了一定的健康风险。选择性单胚胎移植(eSET)可较大程度改善IVF妊娠结局,避免多胎妊娠的发生[2],并降低患者的经济费用及社会负担,缓解患者心理压力。因此,如何高质量的选择优质胚胎进行移植,以最少备孕时间获得健康新生儿成为目前亟待解决的重要问题。随着eSET大范围的推广,需要快速、精确、无创、简便、实用、低成本、低样本需求量、低检测限的胚胎发育潜能评估方法。本文对胚胎形态学观察、胚胎活检、囊胚液检测、胚胎培养基检测等人类胚胎发育潜能评估方法作以下综述。
胚胎形态学观察是指通过显微镜对胚胎的形态和结构进行观察,主要观察胚胎的形态特征和发育速率,自ART技术诞生后该技术被用于选择优质移植胚胎。
1.胚胎形态学观察方法:(1)传统显微镜观察。在胚胎的整个体外孵化期间内,于特定的时间点将胚胎从培养箱的受控环境中移出,并在光学显微镜下评估胚胎发育的形态特征(图1)。胚胎的静态观察阶段主要包括受精卵、卵裂期和囊胚期,主要观察指标包括数量、大小、均一性、碎片比例、胞浆颜色、卵周间隙、多核现象、内细胞团(ICM)和滋养层细胞(TE)等。(2)延时成像(TLI)监测系统。TLI监测系统通常由标准培养箱和集数码相机于一体的显微镜组成,它能够自动定时收集图像并形成动态影像,可以收集大量的卵裂时间、卵裂模式、卵裂同步性等传统显微镜无法记录的胚胎发育动力学数据,TLI在一定程度上优于传统静态显微镜观察。Coticchio等[3]运用TLI深入研究受精过程及受精锥、胞质波、原核出现消失时间和位置移动等。通过TLI人们还发现了直接卵裂和逆卵裂等异常卵裂模式,比较发现直接卵裂胚胎的种植率显著优于逆卵裂胚胎,但仍显著低于正常卵裂胚胎[4]。有研究表明,异常卵裂胚胎的整倍体率及活产率均显著低于正常卵裂胚胎,因此,建议异常卵裂胚胎应进行非整倍体胚胎着床前遗传学检测(PGT-A)[5]。(3)人工智能(AI)系统。目前,TLI系统越来越多地利用先进的计算技术进行视觉静态图像处理,并开发出基于AI的胚胎发育潜能预测模型,提出以算法作为胚胎分类的工具,提高无创选择正常胚胎的概率[6]。AI的优点是它们评价体系稳定,不会受到不同胚胎学家之间评估偏差的影响[2]。Bormann等[7]开发的AI系统,在9例病人的742枚胚胎中进行选择发育潜能较高的胚胎,准确率可达到90%,AI系统的准确率显著优于来自5个不同机构的15名胚胎学家的评估结果。
图1 胚胎发育潜能的形态示意图
2.胚胎形态学观察的干扰因素:形态学观察方法的主要干扰因素是观察者的主观性。Paternot等[8]集结了4个ART中心的5位胚胎学家,每位胚胎学家针对不同发育阶段胚胎图片进行独立的评估和决策,结果发现几位学家评估的多项指标的一致性较差。由于胚胎学家对形态学分类的主观认识存在差异,使得观察者间的评估差异也很大[9]。TLI结合AI通过自动图像分析可以识别62%的卵裂胚和71.8%的囊胚,识别假阳性率为28.2%,以上结果证明虽然AI能够提高胚胎发育潜能评价的客观性和一致性,但是,就目前阶段该技术只能作为人工检查的补充[10],胚胎形态学观察依旧存在主观干扰的影响。
3.胚胎形态学观察的利弊:由于人类胚胎发育遵循特定的时间规律,而形态学观察以发育阶段为基础,因此形态学观察在一定程度上能够识别具有优质发育潜能的胚胎,通过这种方法筛选胚胎可以使妊娠率有显著提高[11]。目前胚胎评估的金标准仍然是使用显微镜技术在胚胎发育特定阶段进行静态观察[2]。然而,形态学观察评估胚胎发育潜能的方法目前仍然主要是依靠人工进行的,具有观察的时间依赖性和分类的潜在主观性[12],此为其主要劣势。
4.胚胎形态学观察的安全性:尽管形态学观察对胚胎安全性影响较小,并且矿物油能够在一定程度上减轻环境变化对胚胎的影响。但大量研究表明,反复将胚胎从培养箱中取出,开箱后温度、湿度、灯光、气体浓度、pH等因素发生变化,可独立于对胚胎倍性的影响而干扰胚胎生化、代谢和表观遗传[13-14]。
胚胎活检是指获取胚胎细胞并进行胚胎着床前遗传学检测(PGT),包括极体活检、卵裂球活检和TE活检,分析胚胎细胞DNA并进行人类白细胞抗原(HLA)分型或基因异常检测,如PGT-A、单基因病胚胎着床前遗传学检测(PGT-M)以及染色体结构重排胚胎着床前遗传学检测[15]。
1.胚胎活检技术:(1)极体活检。与其他细胞活检的方法相比,极体活检侵入性更小,无嵌合体干扰,但是极体没有提供胚胎遗传物质中关于父方的信息,且因需要检测大量不成熟卵母细胞而浪费劳力[16]。(2)卵裂球活检。卵裂球活检的方法是去除卵裂期胚胎的1~2个卵裂球进行PGT,因为这一时期的胚胎细胞通常被认为具有细胞全能性,即可以独自发育成一个完整的个体,具有高度的发育可塑性,能够耐受细胞移除的操作[16]。然而,胚胎在最开始的3次有丝分裂中最易发生错误[17],50%~80%卵裂期胚胎具有1个或者多个非整倍体卵裂球[18],此时活检不仅对检测结果的影响较大,且胚胎存在产生神经退行性疾病和表观遗传改变等风险[16]。(3)TE活检。TE活检是目前PGT的主要检测方法,通常是在胚胎发育的第5、6天对5~10个TE进行活检。TE活检与卵裂球活检相比,能在去除相对较低胚胎质量等级的情况下获得较多的遗传物质以供检测,因而具有更强的恢复能力且更耐受显微操作过程的影响[16],使得每个周期可移植的整倍体胚胎数目更多,累积活产率更高[19]。
2.胚胎活检技术的干扰因素:胚胎活检主要受到嵌合体和等位基因脱扣(ADO)的干扰。嵌合体定义为胚胎中产生一个以上具有不同核型细胞群的状态[15]。行IVF时卵裂期和囊胚期胚胎中嵌合体发生率分别高达70%和90%[20],但是在临床中,囊胚嵌合体只能根据一次TE活检的结果进行诊断,再加上由于抽样误差的存在,真实嵌合体发生率仍可能被低估。从移植结果来看,嵌合体或节段嵌合体胚胎确实有一定程度的发育潜力和健康活产案例,但与整倍体胚胎相比其移植率显著降低、流产率显著升高。一般来说,PGT检测发现嵌合体发生率小于40%时,胚胎移植成功率较高;嵌合体发生率40%~80%时,胚胎移植成功率较低;如果PGT检测发现存在1条以上复杂嵌合染色体时,胚胎移植成功率最低[21]。ADO干扰定义为杂合细胞的两个等位基因中的一个在PCR后扩增失败,单个细胞的分析具有很高的基因分型错误率。在极端情况下,40%的PGT扩增都存在ADO[22]。TE活检中DNA数量高于卵裂球活检,从而降低了TE活检的扩增失败率和ADO风险。
3.胚胎活检技术的利弊:胚胎活检是目前评估胚胎发育潜能的最佳指标,多年来研究表明,以此方法评估胚胎发育潜能后进行eSET的总体植入率显著升高[23]。但是,这种方法需要购买和维护价格昂贵的专业设备,需要聘请和培训技艺精湛的胚胎学家和相关人员,易受限于每天所能检测的最大数量,导致一些机构可能无法开展PGT[16]。胚胎活检这种有创性操作的安全性,以及嵌合体和ADO对检测结果造成的干扰,都是胚胎活检的主要劣势因素。
4.胚胎活检技术的安全性:目前仍缺乏关于人类胚胎活检生物安全性的长期随访数据[24],早期胚胎发育未完全破解,过多的人为干预可能反而会损害胚胎发育潜能。胚胎活检技术基础依赖于活检细胞的遗传物质能够代表整个胚胎[25],但是TE活检没有直接检测ICM细胞,活检细胞代表性的问题将不可避免地导致假阳性和假阴性的产生[24]。TE活检的假阳性结果可能高达40%,导致原本可以正常出生的胚胎被丢弃[26],假阴性结果也可能导致移植失败甚至孕育不正常的胎儿,从而给家庭和社会带来重大影响。
囊胚液检测技术分为取样和检测两部分,囊胚液取样过程又称囊胚穿刺术,是将1个ICSI移液管穿过位于囊胚ICM对侧的滋养外胚层,仔细抽出囊胚液致囊胚腔完全皱缩[27](图2),从而分离出0.01 μl左右的囊胚液[28],然后将获得囊胚液用于检测蛋白质、遗传物质和代谢物质来评估胚胎发育潜能。
图2 囊胚穿刺术获得囊胚液示意图
1.囊胚液检测技术:(1)囊胚液检测蛋白质。Poli 等[11]利用囊胚液检测技术从每个囊胚腔中提取4~6 nl囊胚液,通过串联质谱检测到288种蛋白质,其中182种为囊胚来源蛋白,并且发现囊胚液中H2A和GAPDH水平能够预测胚胎核型,其准确性为100%。以上研究证明,使用靶向蛋白质组学技术可以在单个囊胚液中实现蛋白质的定量检测,囊胚中靶蛋白的丰富度与整个胚胎的染色体状态之间存在潜在关联。(2)囊胚液检测遗传物质。在囊胚液中的胚胎源性DNA能够提供适合遗传分析的DNA模板[16]。研究表明,在整倍体方面,囊胚液检测与TE活检、全囊胚活检、极体活检和卵裂球活检的一致率分别为97.4%、100%、93.3%和100%;在单条染色体方面,囊胚液检测与TE活检、全囊胚活检、极体活检和卵裂球活检的一致率分别为96.6%、98.1%、93.5和94%[29],说明囊胚液是一种很有前途的PGT替代来源。(3)囊胚液检测代谢物质。人们已经可以利用高效液相色谱-质谱技术从低至5 nl的囊胚液中高灵敏度检测出乳酸、葡糖-6-磷酸、酮戊二酸、磷酸葡萄糖酸三钠盐、谷氨酸、ATP、NAD+、NADH、NADPH等代谢产物,囊胚液的代谢产物检测可以成为评估胚胎发育潜能的辅助工具[27]。
2.囊胚液检测技术的干扰因素:囊胚液检测的检测量较小且容易被穿刺、降解和污染所干扰。据报告显示,囊胚液样品体积从0.3 nl(纯囊胚液)到1 μl(包括培养基或其他液体)不等[16],可用于检测的体积过小,检测难度显著升高。囊胚液污染的来源可能是漂浮的ICM或TE细胞碎片,也可能是穿刺引入的TE细胞质[11]。此外,Capalbo等[30]研究发现,在行PGT-M检测时囊胚液检测和TE活检的一致性很低,这可能是由于受到来自母系的卵丘细胞或极体的DNA被污染所引起的。这些都需要人们优化分离技术,解决扩增难题,使囊胚液检测常规化成为可能。
3.囊胚液检测技术的利弊:随着冷冻囊胚技术的普及,囊胚液检测可伴随囊胚冷冻进行,副产物囊胚液的收集无需额外操作,与胚胎活检技术相比,节省人员培训周期,费用更少,较易开展普及。囊胚腔内有ICM,外被单层的TE细胞,可与外界环境隔开,是胚胎分泌和代谢物质释放和积累的独立空间,且分子转运受到高度调控[11],受外界干扰较小。但是至今没有长期随访数据证明囊胚液检测的安全性,且由于囊胚液样本量过小增加了检测难度和误差几率[31],这是其主要的劣势因素。
4.囊胚液检测技术的安全性:理论上吸出囊胚液对囊胚无害且操作简便,皱缩囊腔是囊胚玻璃化冷冻前提高胚胎复苏率的常规措施。但是,获取囊胚液需要推迟胚胎移植,同样存在一些缺点。首先,体外环境不如体内环境稳定,可能导致一些在卵裂阶段移植成功的胚胎在培养过程中不能形成囊胚,减少可移植胚胎数量;其次,在体外培养环境下发生胚胎基因组激活,可能会对胚胎造成潜在影响,导致表观遗传改变或产生同卵双生等[32]。为实施囊胚液检测而特意冒风险推迟胚胎移植的策略是否最终有利于活产率提升尚需证明。此外,与囊胚液穿刺技术相比,使用激光脉冲对于囊胚皱缩可以显著提高移植率、生化妊娠率、临床妊娠率和活产率[33]。因而,还需进一步研究囊胚液检测所能提高的胚胎选择效率与微侵入操作和延长培养时间导致的胚胎潜在伤害,综合分析囊胚液检测技术是否可以提高ART成功率。
培养基检测技术指在胚胎体外培养过程中,收集被更换的培养基部分,以检测蛋白质、遗传物质和代谢物质来评估胚胎发育潜能,广义上包括非更换培养基时间段获取的培养基用于检测[13]。
1.培养基检测技术:(1)培养基检测蛋白质。Bori等[34]利用距离扩展分析技术从1 μl的培养基中检测出了92种蛋白,其中IL-6、uPA和IL-8与妊娠结局显著相关。Montskó 等[35]研究发现,与仅使用形态学观察技术相比,利用培养基检测技术与形态学观察相结合的胚胎发育评估方法可以显著降低假阳性率并提高妊娠率。新发现的培养基检测指标包括可溶性的白细胞抗原-G、载脂蛋白A1、胰岛素样生长因子、血小板活性因子及白细胞介素等,但其能否真正提高胚胎发育潜能的预测能力仍存在争议[12-13]。(2)培养基检测遗传物质。培养基比囊胚液存在更多的DNA,可以作为真正意义上的非侵入性基因检测手段的材料来源[31]。而对于人们关注的嵌合体干扰,Leaver等[16]认为,培养基是整个胚胎的一个更有代表性的样本,它排除了人类胚胎镶嵌现象的干扰。Pais等[36]通过飞行时间质谱在培养基中发现了整倍体与非整倍体的特征性基因频谱,这是快速评估胚胎发育潜能方法的又一突破。研究表明,培养基检测结合TE活检与常规TE活检在整倍体方面的一致率分别为87.2%和85.0%,在染色体方面的一致率分别为98.8%和98.3%[37]。临床研究发现,利用培养基进行PGT-A鉴定50个整倍体胚胎在移植后有27个胚胎能够正常发育并成功分娩[38]。(3)培养基检测代谢物质。Ribeiro等[39]利用微流控芯片电泳质谱法,能够在2 min内分离出16种氨基酸,并同时可进行胚胎培养状态的监测与评估。研究发现,与非妊娠组相比,妊娠组培养基中丙酮酸浓度显著增高,乳酸浓度显著降低,并且培养基中丙酮酸浓度对预测妊娠的敏感性为90.9%,特异性为75%[40]。不仅如此,人们还发现体外培养胚胎的表观遗传状态在培养基中的代谢变化有可能预示未来子代的健康[41]。
2.培养基检测技术的干扰因素:培养基检测方法易受样本量、商品化培养基组分、扩增和污染等因素干扰,评估胚胎发育潜能时应该综合考量。(1)样本量。ART中胚胎培养基体积为10~50 μl,胚胎分泌蛋白浓度一般小于1 pg/ml,因而只能利用扩增方法检测培养基的核酸,而检测蛋白质的难度较大[42]。最常用的酶联免疫吸附试验(ELISA)要求样本容量至少需为50 μl,然而常规单个胚胎的培养基仅为5~20 μl,所以部分实验室将数个胚胎的培养基合并以获得足够的样本量,但这样得出的实验结果只能是平均值,这对统计妊娠结局有不小的难度。此外,有的实验室通过稀释培养基来获得足够的样本量,但这样对于检测方法精度的要求就随之增加[43]。(2)商品化培养基组分。现有的商品化培养基的组分可能会显著影响以培养基为媒介评估胚胎发育潜能的检测方法。Dyrlund等[12]检测了3个不同供应商提供的8种胚胎培养基组分发现,除了培养基说明书中证实添加的人血清白蛋白(HSA)外,还检测到110种蛋白质,其中8种曾被误认为是胚胎自身产生的,但实际这几种蛋白质很有可能是伴随HSA添加到胚胎培养基中的。不同批次的胚胎培养基间伴随HSA添加到胚胎培养基中的Afamin和Haptoglobin这两种蛋白的添加量相差70%和95%,这很容易误导检测结果。(3)扩增和污染。Hanson等[44]研究发现,培养基的扩增失败率为37.3%,而Li等[37]研究发现,培养基扩增成功率高达97.6%,培养基扩增成功率间的差异可能是由于实验方法及技术不同所致,也可能由于培养基中的DNA数量较少或被降解所致[31]。Lledo等[45]研究发现,培养基检测结果与TE活检结果的差异55.6%是由母体DNA污染所致且与检测技术无关,表明污染可独立于扩增问题影响检测结果。
3.培养基检测技术的利弊:培养基检测为无创性评估胚胎发育潜能的方法,因而不需限定评估时胚胎的发育阶段,且样本量较囊胚液多,使得检测方式较为灵活、多样。有大量研究表明,培养基中的检测指标可作为评价指标参与胚胎发育潜能的选择评估[2]。但是,由于培养基缺乏透明带的保护,直接暴露处于胚胎外部环境,如温度、湿度、CO2浓度、培养基成分、培养皿质量等都可能影响检测结果。
4.培养基检测技术的安全性:由于胚胎具有自我校正能力,而培养基中游离DNA的主要来源是被排出的非整倍体细胞及其碎片,可能导致假阳性率升高[46]。培养基的取得同样需要在特定时间段开箱,虽然对胚胎而言为非侵入性,但是该技术若应用于临床仍需关注移液器和枪头的无菌和质控等问题。去除部分培养基后使得胚胎周围液体量减少,在胚胎不断自分泌和旁分泌的前提下,不论是否对培养中胚胎的培养基加以补充都可能造成浓度相应变化,这些都需要研究证实是否对胚胎进一步发育造成影响。
我们总结了4种评估胚胎发育潜能的方法,分别为胚胎形态学观察、胚胎活检技术、囊胚液检测技术和培养基检测技术。胚胎形态学观察包括传统显微镜观察、TLI监测系统和AI系统;胚胎活检技术包括极体活检、卵裂球活检和TE活检;囊胚液检测技术包括检测蛋白质、遗传物质和代谢产物;培养基检测技术包括检测蛋白质、遗传物质和代谢产物。形态学观察和培养基检测为非侵入性方法,囊胚液检测为微侵入性方法,而TE活检属于侵入性方法;形态学观察和培养基检测可在胚胎发育期间的全阶段进行,胚胎活检主要在囊胚期进行,囊胚液检测必须在囊胚期进行;形态学观察是定性检测方法,囊胚液检测和培养基检测都是定量检测方法。
囊胚液检测和培养基检测的物质都为液体,不论是扩增还是稀释,可操作性强,检测方法多。其囊胚液和培养基检测结果量化后可建立公式和模型来计算胚胎发育潜能的参考值和异常值范围,较定性分析而言,不论是对单个指标相互比较还是多个指标综合比较都更为方便,有利于科研统计和临床工作。Kuznyetsov等[47]研究发现,囊胚液检测和培养基检测相结合与单独TE活检结果的一致率为87.5%,与单独全囊胚活检结果的一致率为96.4%,而单独TE活检与单独全囊胚活检结果的一致率为91.7%,比较后发现囊胚液检测和培养基检测相结合的检测方法比单独TE活检与全囊胚活检的一致率显著升高。然而,囊胚液检测和培养基检测的特点并不是完全相同,囊胚液检测以胚胎内环境为检测媒介,培养基检测以胚胎外环境为检测媒介,囊胚液直接接触ICM和TE,即直接反映胚胎发育潜能,而培养基检测则不能直接反映ICM发育情况。囊胚液检测中样本浓度高于培养基检测,但是囊胚液检测体积远远低于培养基检测,由于囊胚液检测的高浓度优势未抵消因体积过小导致的检测难度过大的劣势,使得囊胚液检测研究的开展显著少于培养基检测。囊胚液检测和培养基检测作为新兴技术,都是不错的定量检测媒介,但却由于检测难度大未进入临床。全时间段评估优势是培养基检测推向临床的重要基础,培养基检测以非侵入性和样本量较囊胚液大的优势,在短期内是较优的胚胎发育潜能评估方法。
通过综合比较发现,每种胚胎发育潜能评估技术均因自身特点有其优势。因而,以形态学观察为基础,TLI监测结合AI系统为提升,培养基检测和囊胚液检测为辅助,TE活检为诊断的综合评价体系,可能是未来一段时间内评估胚胎发育潜能的发展方向。