邓伟,倪亚莉,谢广妹,高喜红
荟萃分析
基础窦卵泡数对卵巢低反应及体外受精临床 结局预测的Meta分析
邓伟,倪亚莉,谢广妹,高喜红
目的对基础窦卵泡数(AFC)预测卵巢低反应性及体外受精临床结局的能力进行Meta分析。方法计算机检索PUBMED、EMBASE、Cochrane图书馆、中国生物医学文献数据库、万方数据库等,收集符合纳入标准的研究,检索时限均为从建库至2013年4月,并追溯纳入研究的参考文献和手工检索相关会议资料。由2位研究者按照纳入与排除标准独立筛选文献、提取资料和评价质量后,采用MetaDisc1.4软件进行Meta分析。结果共纳入14篇文献2 306个周期。结果显示:AFC对卵巢低反应(POR)的汇总受试者工作特征曲线(SROC)的AUC=0.825 0,Q*=0.758 1;对未临床妊娠(NCP)的AUC=0.528 3,Q*=0.521 2。表明AFC对POR的准确性及诊断价值较高,具有较好的预测能力;而对NCP的诊断价值较低。亚组分析中,当AFC诊断阈值由<4个增多至<6或7个时,POR方面合并敏感度由0.47升至0.81,合并阳性似然比由4.11降至2.76;NCP方面合并敏感度由0.21升至0.41,合并阳性似然比由1.17升至1.96;表明随着AFC诊断阈值的增高,其对POR及NCP的准确预测能力逐渐增强;研究对象发生POR的概率逐渐降低;但发生NCP的可能性增高,此点与临床不符。结论AFC对卵巢低反应有较好的预测能力,可作为独立预测指标;但对体外受精结局的预测能力相对较差,尚需结合其他诊断指标来综合判断妊娠结局。
基础窦卵泡数;卵巢低反应性;体外受精临床结局;Meta分析
辅助生殖技术的预后受多个因素的影响,其中卵巢的反应性是最重要的因素之一。在进行控制性超排卵前正确预测卵巢的反应性有助于选择合理的治疗方案;有助于指导临床医师采取最佳的控制性超排卵治疗方案以获得数量适中、优质的卵子及胚胎,提高临床妊娠率。因此,卵巢反应性评估成为目前体外受精技术(in-vitro fertilization,IVF) 研究的焦点。目前评价卵巢反应性的方法有:年龄、基础内分泌、氯米芬刺激试验、基础卵巢体积、基础窦状卵泡计数(antral follicle count,AFC)、抗苗勒管激素、抑制素B等。其中AFC因可以较为直观地反映卵巢储备功能,与其他生物学评价指标(如抗苗勒管激素、抑制素B等) 的作用机制联系紧密,又与获卵数以及IVF临床结局关系密切,加之监测AFC简单易行,故近年来国内外关于AFC预测卵巢反应性及IVF临床结局的研究日趋增多。
国内学者何于夏等[1]研究认为,AFC是患者接受辅助生殖技术前的首要检查,其能直接有效地评价卵巢反应性。但目前尚缺乏此方面的系统评价,而单项研究的检验效能又不足,为此本研究就已发表的关于AFC对卵巢反应性和IVF临床结局预测的文献进行Meta分析,综合定量评价AFC对上述2个方面的应用价值。
1.1 纳入标准
1.1.1 研究设计:国内外公开发表的回顾性或前瞻性队列研究,且至少报道了1个本研究涉及的结局指标,能从原始文献或相关文献中提取或计算获得AFC对卵巢低反应(poor ovarian response,POR)和未临床妊娠(non clinical pregnancy,NCP)的真阳性值(true positive,TP)、假阳性值(false positive,FP)、真阴性值(true negative,TN)和假阴性值(false negative,FN)等。语种限中、英文。
1.1.2 研究对象:接受IVF的不孕症患者。
1.1.3 结局观察指标:POR及NCP患者例数。
1.2 检索策略 以“antral follicle count”“ovarian response”“clinical pregnancy ”“assisted reproductive technology”为英文检索词,检索PUBMED、EMBASE、Cochrane图书馆,以“窦卵泡数”“卵巢反应性”“临床妊娠”“辅助生殖技术”等为中文检索词,检索中国生物医学文献数据库、中国期刊全文数据库、中文科技期刊全文数据库、万方数据库等,检索时限均为从建库至2013年4月,检索策略采用主题词与自由词相结合的方式,并辅以手工检索会议资料和追溯纳入文献的参考文献。
1.3 资料提取与质量评价 由2名评价员独立提取纳入文献数据,包括:(1)试验设计方法、期刊名称、第一作者、出版年、国别、诊断标准、检测方法等;(2)诊断参数信息:TP、FP、TN、FN。然后对结果进行交叉核对,对有分歧而难以确定是否纳入的研究通过讨论或与第3位研究员协商确定。纳入研究的质量评价根据文献[2,3]并同时结合本研究实际情况,主要以下列4条标准对纳入文献进行质量评价:(1)研究对象的选择标准是否明确;(2)是否设立“金标准”或参考标准;(3)“金标准”和待评价试验检测的间隔时间是否足够短,以避免出现疾病病情的变化;(4)原始文献或相关文献中是否能够提取或计算获得TP、FP、TN、FN。
1.4 统计学方法 采用MetaDisc 1.4软件进行Meta分析。首先探讨各研究间是否有阈值效应及其他异质性来源,通过计算灵敏度和特异度的Spearman相关系数判断各研究间是否存在阈值效应;若各研究间不存在阈值效应,异质性分析P<0.05为存在统计学差异,采用随机效应模型;P>0.05为研究间具有同质性,采用固定效应模型分析,然后合并灵敏度(SEN)、阳性似然比(PLR)等单一指标;如果各研究间存在阈值效应,则依据文献[4]拟合SROC(汇总受试者工作特征)曲线,计算曲线下面积(AUC)和Q*指数。再按不同阈值进行亚组分析。鉴于各研究纳入患者的病因可能存在差异,导致其患病率不同,对SEN存在一定的干扰,而PLR不受患病率的影响,且又能综合灵敏度和特异度,故本研究选择SEN和PLR综合判断AFC对POR与CP结局的预测价值。
2.1 检索结果及纳入研究质量评价 初检文献786篇,通过阅读摘要和全文,最终纳入符合标准的14篇文献[5~18],共2 306个周期。AFC测定均由彩色超声诊断仪完成,频率4~7 MHz。AFC的诊断界值多不相同,为小于3~10个。大部分研究将POR定义为获卵数目小于3~4个,文献[7]为小于2个,文献[9]未具体说明。多数研究将临床妊娠定义为移植胚胎后35 d经超声检查见宫内孕囊及原始胎血管波动、流产或异位妊娠者经病理学检查证实,文献[14~17]未具体说明。所有纳入研究均为回顾性队列研究。所有纳入研究基本特征及质量评价见表1、表2。
2.2 Meta分析结果
2.2.1 判断阈值效应:(1)POR预测,Spearman相关系数=0.737,P=0.001,存在阈值效应,汇总SROC曲线,计算AUC=0.825 0,Q*=0.758 1;(2)NCP预测,Spearman相关系数=0.550,P= 0.042,存在阈值效应,汇总SROC曲线,计算AUC=0.528 3,Q*=0.521 2。见图1。
表1 纳入研究的基本特征
表2 纳入研究的质量评价
注:Ⅰ.研究对象的选择标准是否明确;Ⅱ.是否设立“金标准”或参考标准;Ⅲ.“金标准”和待评价试验检测的间隔时间是否足够短,以避免出现疾病病情的变化;Ⅳ.原始文献或相关文献中是否能够提取或计算获得TP、FP、TN、FN
2.2.2 不同阈值间的亚组分析:(1)AFC小于4个组。POR预测:6个研究 SEN合并=0.47,95%CI 0.37~0.57;PLR合并=4.11,95%CI 2.47~6.84。未临床妊娠结局预测:6个研究SEN合并=0.21,95%CI 0.17~0.25;PLR合并=1.17,95%CI 0.57~2.41。见图2、图3。
(2)AFC小于6个或7个组。POR预测:6个研究 SEN合并= 0.81,95%CI 0.73~0.87;PLR合并=2.76,95%CI 1.95~3.91。未临床妊娠结局预测:4个研究SEN合并=0.41,95%CI 0.36~0.46;PLR合并=1.96,95%CI 0.94~4.09。见图4、图5。
图1 AFC预测POR(A)及NCP(B)的SROC曲线
图2 AFC<4对POR的SEN合并(A)及PLR合并(B)
图3 AFC<4对NCP的SEN合并(A)及PLR合并(B)
图4 AFC<6/7预测POR的SEN合并(A)及PLR合并(B)
图5 AFC>6/7预测POR的SEN合并(A)及PLR合并(B)
AFC是指阴道超声下卵巢内可见的直径2~9 mm的卵泡,其能反映卵巢储备功能,而且AFC检查具有无创、价廉、易掌握的特点,是用于预测卵巢反应性的一项较好的临床指标[19,20]。有研究提示[21,22], AFC应作为IVF前评价卵巢反应性的首选指标。本研究中,AFC对POR的SROC曲线的AUC接近于1,表明AFC对POR的准确性及诊断价值高,具有较好的预测能力;在妊娠结局预测方面,AUC接近于0.5,Q*指数亦有所下降,提示其对NCP的诊断价值较低,不及对POR的预测能力。其机制可能为:(1)虽然POR受多种因素的影响,但AFC对卵巢反应性的影响较为重要,故其预测POR的能力亦较强。(2)ART结局受到AFC、年龄、基础FSH、促性腺激素使用总量、胚胎质量、子宫内膜容受性等多个因素影响,对主要影响因素仍处在研究之中。如陈士岭等[23]研究发现,AFC≤7个且年龄<38岁组的患者临床妊娠率、分娩率高于AFC>7个且年龄≥38岁组,提示年龄是影响临床妊娠率及分娩率的主要因素,AFC次之,AFC主要影响卵子数量,而年龄主要影响卵子数量及质量;另外,任何年龄不孕妇女的AFC≤7个或年龄≥38岁且AFC≤10个是卵巢反应性降低较为合适的界定指标,而年龄≥40岁的妇女POR发生率则明显增加。
亚组分析中,考虑到本研究仅判断AFC对POR及NCP的预测能力,因此仅选用了SEN和PLR 2个评价指标,而没有计算特异度、阴性似然比等指标。SEN是将实际患者正确地判定为真阳性的比例,代表了某种试验检测出患者的能力。PLR是指患者中某种试验出现阳性结果的机会是非患者的多少倍,其值越大说明患病的概率越大,试验结果的诊断价值越高,其不受患病率的影响。结果发现:(1)POR方面,当AFC由≤4个增多至<6个或7个时,AFC对POR的准确预测能力将增强(SEN合并由0.47升至0.81),表明随着AFC增多,更多的POR患者将被检测出,漏诊几率将降低。PLR合并呈下降趋势(由4.11降至2.76),提示随着AFC增多,研究对象发生POR的概率将降低。其原因可能如下:AFC做为评价卵巢反应性的最佳单一指标,当AFC≤4个时提示卵巢反应性重度降低,5~7个者为卵巢反应性中度降低,8~10个者为卵巢反应性轻度降低。国内学者全吴敏等[24]研究亦发现,与AFC<5个相比,AFC<10个时,预测POR的能力最强,本研究结果基本与其相符。(2)NCP方面,当AFC由≤4个增多至<6个或7个时,SEN合并呈上升趋势(由0.21升至0.41),提示AFC增多将有更多的NCP患者被发现,漏诊的几率将降低;PLR合并亦呈上升趋势(由1.17升至1.96),提示随着AFC增多,患者发生NCP的可能性略有增高,此点与临床不符,原因可能为NCP受到的影响因素较多,而AFC本身对NCP的预测价值有限,导致合并后的PLR出现了偏差。本研究的局限性:(1)纳入文献质量有限。提取的原始资料并不理想,尽管通过电子邮件联系了相关作者,但大多数作者没有回信,故文献涵盖不够全面,本研究中数据大多数是根据原始文献的相关资料计算得到;此外,尽管国内关于AFC的临床研究较多,但缺少从敏感度、特异度、阳性似然比做诊断性试验评价的文献,故本研究存在一定的选择偏倚。(2)亚组分析较少。由于纳入研究质量有限,本文未分析AFC<9个或10个的SEN合并及PLR合并,仅通过2个数值区间来推测其诊断能力趋向,可能存在研究内偏倚,限制了本研究的临床应用价值。(3)年龄也是POR的重要预测因子,不同年龄阶段的POR所对应的AFC可能不同,但因纳入文献的质量有限未能进一步对不同年龄阶段进行亚组分析,只能通过单项研究的结果进行描述性分析,降低了AFC的可信性。(4)由于不孕症的病因较多,各个研究纳入患者的病因构成存在差异,由此可能存在疾病谱偏倚[22],在一定程度上扩大或减低了AFC的诊断价值。
总之,尽管有上述局限,本研究发现AFC对卵巢反应性有较好的预测能力,随着AFC的增多(不超过10个),其对卵巢反应性的预测能力亦逐渐增强,提示在临床应用中AFC可做为卵巢反应性的单一预测指标,若能结合年龄则其预测能力可能更强。但AFC对IVF临床结局的预测能力较差,在判断IVF临床妊娠结局时尚需结合其他诊断指标来综合判断。
1 何于夏,夏容,陈薪,等.在体外受精-胚胎移植中应用多项卵巢储备功能评估指标预测卵巢反应性[J].南方医科大学学报,2013,33(2):216-220.
2 LucaSNP,Macaskill P,Irwig L,et al. The development of a quality appraisal tool for studieSof diagnostic reliability (QAREL) [J]. J Clin Epidemiol,2010,63(8):854-861
3 Whiting PF,RutjeSAW,Westwood ME,et al.QUADAS-2:a revised tool for the quality assessment of diagnostic accuracy studies[J]. Ann Intern Med,2011,155(8):529-536.
4 刘关键,吴泰相.诊断性试验的Meta分析—SROC 曲线法介绍[J].中国循证医学杂志,2003,3(1):41-44.
5 Hsieh YY,Chang CC,Tsai HD.Antral follicle counting in predicting the retrieved oocyte number after ovarian hyperstimulation[J].J Assist Reprod Genet,2001,18(6):320-324.
6 Nahum R,Shifren JL,Chang Y,et al.Antral follicle assessment aSa tool for predicting outcome in IVF-iSit a better predictor than age and FSH ? [J] J Assist Reprod Genet,2001,18(3):151-155.
7 Chang MY,Chiang CH,Hsieh TT,et al.Use of the antral follicle count to predict the outcome of assisted reproductive technologies[J].Fertil Steril,1998,69(3):505-510.
8 Ng EH,Tang OS,Ho PC.et al.The significance of the number of antral follicleSprior to stimulation in predicting ovarian responseSin an IVF programme[J].Hum Reprod,2000,15(9):1937-1942.
9 Sharara FI,McClamrock HD.Difference in invitro fertilization(IVF)outcome between white and black women in an inner-city,unilersity-based IVF program[J].Fertil steril,2000,73(6):1170-1173.
10 Jarvela IY,SladkeviciuSP,Kelly S,et al.Quantification of ovarian power Doppler signal with three-dimensional ultrasonography to predict response during in vitro fertilization[J].Obstet Gynecol,2003,102(4):816-822.
11 Yong PY,Baird DT,Thong KJ,et al.Prospective analysiSof the relationshipSbetween the ovarian follicle cohort and basal FSH concentration,the inhibin response to exogenouSFSH and ovarian follicle number at different stageSof the normal menstrual cycle and after pituitary down-regulation[J].Hum Reprod,2003,18(1):35-44.
12 Bancsi LF,BroekmanSFJ,EijkemanSMJ,et al.PredictorSof poor ovarian response in in vitro fertilization:a prospective study comparing basal markerSof ovarian reserve[J].Fertil Steril,2002,77(2):328-336.
13 Frattarelli JL,Lauria-Costab DF,Miller BT,et al.Basal antral follicle number and mean ovarian diameter predict cycle cancellation and ovarian responsivenesSin assisted reproductive technology cycles[J].Fertil Steril,2000,74(3):512-517.
14 Fiçicioglu C,Kutlu T,Demirbasoqlu S,et al.The role of inhibin B aSa basal determinant of ovarian reserve[J].Gynecol Endocrinol,2003,17(4):287-293.
15 Frattarelli JL,Levi AJ,Miller BT,et al. A prospective assessment of the predictive value of basal antral follicleSin in vitro fertilization cycles[J]. Fertil Steril,2003,80(2):350-355.
16 Durmusoglu F,Elter K,Yoruk P,et al.Combining cycle day 7 follicle count with 6the basal antral follicle count improveSthe prediction of ovarian response[J]. Fertil Steril,2004,81(4):1073-1078.
17 Sher G,Fisch JD.Effect of vaginal sildenafil on the outcome of in vitro fertilization (IVF) after multiple IVF failureSattributed to poor endometrial development[J].Fertil Steril,2002,78(5):1073-1076.
18 Kupesic S,Kurjak A,BjeloSD,et al.Three-dimensional ultrasonographic ovarian measurementSand in vitro fertilization outcome are related to age[J]. Fertil Steril,2003,79(1):190-197.
19 王丽红,王春光,张海灵,等.IVF-ET治疗高龄不孕时卵巢储备功能预测的临床研究[J].现代妇产科进展杂志,2013,22(8):657-659.
20 Oner G,MuderriSII.Assessment of ovarian reserve based on hormonal parameters,ovarian volume,and antral follicle count in women with familial Mediterranean fever[J]. Eur J Obstet Gynecol Reprod Biol,2013,170(2):449-451.
21 HendrikSDJ,Mol BW,Bancsi LF,et al. Antral follicle count in the prediction of poor ovarian response and pregnancy after in vitro fertilization:a meta-analysiSand comparison with basal follicle-stimulating hormone level[J]. Fertil Steril,2005,83(2):291-301.
22 Panchal S,Nagori C.Comparison of anti-mullerian hormone and antral follicle count for assessment of ovarian reserve[J].J Hum Reprod Sci,2012,5(3):274-278.
23 陈士岭,夏蓉,陈薪,等.基础窦状卵泡数结合年龄用于评估卵巢储备及预测卵巢低反应和体外受精结局[J].南方医科大学学报,2011,31(4):572-277.
24 全吴敏,朱桂金.基础窦卵泡数在评价卵巢的反应性及预测人类辅助生殖技术(ART)结局中的作用[J].生殖与避孕,2012,32(9):630-637.
AMeta-analysisofantralfolliclecountpredictingovarianpoorresponseandIVFoutcome
DENGWei,NIYali,QIUjie,XIEGuangmei,GAOXihong.
MaternalandChildHealthHospitalofGansu,Lanzhou730050,ChinaCorrespondingauthor:NIYali,E-mail:niyali@126.com
ObjectiveTo assessment the predictive value of antral follicle count for ovarian poor response and IVF outcome.MethodsWe searched PUBMED,EMBASE,Cochrane Library,Chinese Biomedical Literature Database,database,etc. ArticleScollected studieSmet the inclusion criteria,were retrieved from time building a database to April 2013,with retrospective referenceSand manual included in the study retrieve relevant meeting materials. By the two researcherSaccording to inclusion and exclusion criteria independently screened the literature and evaluation of the quality of the extracted data,using MetaDisc1.4 Meta-analysiSsoftware.Results2 306 cycleSin 14 literatureSwere included. The resultSshowed that:AFC low ovarian response (POR) summary receiver operating characteristic curve (SROC) of AUC = 0.825 0,Q*= 0.758 1; for non-clinical pregnancy (NCP) of AUC = 0.528 3,Q*=0.521 2. AFC indicate the accuracy and diagnostic value of POR iShigh,haSa better predictive capability; while lower diagnostic value of the NCP. Subgroup analysiSshowed that,when the AFC diagnostic threshold increased by a < 4 to < 6 or 7,POR aspectScombined sensitivity rose from 0.47 to 0.81,positive likelihood ratio from the merger fell from 4.11 to 2.76; NCP combined aspectSof the sensitivity rose from 0.21 to 0.41,positive likelihood ratio combined rose from 1.17 to 1.96; show that with the increase of AFC diagnostic threshold,and itSability to accurately predict and NCP POR gradually increased; probability study POR occurSgradually reduced; yet occurred NCP'Spossibility of increased,itSdiscrepancieSwith clinic.ConclusionAFC haSgood prediction ability to the ovarian poor response,but haSpoorer prediction ability to IVF outcome. Prediction of pregnancy outcome remainSto be combined with other diagnostic indicator to overall judgment.
BasiSof the number of antral follicles; Ovarian low reactivity; IVF clinical outcomes; Meta-analysis
甘肃省科技厅国际合作项目(No.1011WCGA165)
730050 兰州,甘肃省妇幼保健院
倪亚莉,E-mail:niyali@126.com
10.3969 / j.issn.1671-6450.2014.04.027
2013-12-12)