精子库供精导致近亲婚配的概率模型与统计分析方法*

2015-03-18 09:23谭玉梅范立青
激光生物学报 2015年3期
关键词:婚配精子库婚龄

谭玉梅,范立青,宋 革

(1.广东省计划生育科学技术研究所生殖科,广东 广州510600;2.中南大学湘雅医学院生殖与干细胞工程研究所,湖南 长沙410081)

在我国不孕症发生率占育龄夫妇的10%~15%,其中无精子症是导致男性不育的重要原因。这部分患者可以采用供精方法,通过供精的辅助生殖技术(Assisted reproductive technology,ART)来使妻子怀孕,包括供精 人工授精(Artificial insemination by Donor,AID)或供精体外受精(in vitrofertilization with donor)。但供精存在后代近亲婚配的伦理风险问题,因此,如何规避供精后代的近亲婚配,是精子库临床应用和科学管理的一个重要方面[1]。我国大陆2001年8月开始实施《人类辅助生殖技术管理办法》和《人类精子库管理办法》,2003年又发布了《关于修订人类辅助生殖技术与人类精子库相关技术规范、基本标准和伦理原则的通知》,严格规定每个省只允许建立一个精子库,防止同一位供精者在多处供精,每份精液只允许使5个接受辅助生殖技术的女性怀孕[2]。但这些措施降低近亲婚配风险的效果如何,目前尚无法有效评估。因此,如何定量评估精子库供精导致近亲婚育的伦理风险,对精子库运行管理具有重要意义。

上世纪60年代初英国学者John Hajnal最早提出了供精导致近亲婚配风险性评估的数学模型,以供精者后代近亲婚配的最大可能数为依据,给出了年均发生近亲婚配几率的计算方法[3]。80年代以后,Curie-Cohen M[4]、de Boer A[6]、Charlotte Wang[8]等学者相继对供精导致近亲婚配风险性开展定量评估研究。其中,Curie-Cohen根据供精者平均后代数量(包括供精和正常婚配生育的后代)和婚配概率,完善了John Hajnal关于年均发生近亲婚配几率的计算公式。de Boer A、Charlotte Wang等主要研究了最大供精数对近亲婚育风险几率的影响,探讨了如何合理确定最大供精数,建立了不同的几率计算公式和最大供精数的风险性判断准则[6]。这些研究不断完善供精伦理风险定量分析思想和评估方法,但存在如下问题或不足:

(1)根据供精子代数量来计算可能发生近亲婚育的最大数量,不能反映出供精子代数量、性别及其婚配的随机性。譬如,John Hajnal采用供精子代数量和捐精者自然生育后代的平均数,且假定男女性别均匀分布,建立了年均发生近亲婚配几率公式[3],不符合数学随机事件逻辑检验要求;

(2)在精子库临床应用中难以获得完整的调查数据,包括供精者后代的数量、性别和具体的生活区域,不能准确统计婚配情况,因此,以可能发生近亲婚育的最大数量为指标来评估近亲婚育风险具有片面性;

(3)Curie-Cohen公式采用概率表示了供精子代婚配的随机性,但却没有给出严格意义下的概率定义(包括随机事件和样本空间),而且使用了条件概率来确定供精者子代婚配几率,缺乏实际意义。

国内类似的研究相对较少,黄东晖在文献[9]中简单地用AID子代数量在总人口中的比例来评估近亲婚育的几率,虽然计算简易,操作性强,但是人口比例仅是近亲婚育风险性的一个影响因素,不能作为该风险性评估的主要依据。而其它相关文献则主要围绕供精技术、精子库建设和管理等内容展开研究[10~12],而对于我国供精生育孩子数量的估算、单份精液供5个患者怀孕的情况下,子代近亲婚配的风险有多大等问题,目前尚无有效分析方法。

本文探讨我国供精导致近亲婚育风险性的定量评估问题。由于我国人口基数和区域人口流动性大,供精导致近亲婚育是一个大样本随机事件,影响因素较多,具有周期性,因此,需要采用大样本理论,从主要因素的概率分布、指标综合与统计方法来建立模型,才能符合我国精子库实际情况,不能简单照搬现有数学模型。

1 供精导致近亲婚育的概率模型

精子库用单个匿名捐精者的精液给多名患者受孕导致近亲结婚生子的过程如图1所示,即供精生育子代之间、供精生育子代与捐精者(及其兄弟姐妹)正常婚育的小孩之间因未知血缘关系而可能结婚生子。这是相对复杂的随机过程,表现为:

图1 精子库供精导致近亲婚育的过程Fig.1 Process of Consanguineous Marriage Due to Multiple Use of Sperm Donors by Sperm Bank

(1)供精子代数量以及性别比例具有随机性;

(2)捐精者及其兄弟姐妹正常婚育的小孩数和性别比例具有随机性;

(3)小孩长大后如何婚配具有随机性,受到生活地域、相貌特征、结婚年龄以及文化传统等因素的影响[1,3-9]。

如何用概率指标来评估供精导致近亲婚育风险,需要分两个阶段建立模型:

(1)供精子代、捐精者近亲后代数量与性别比例分布的估计模型;

(2)供精子代与同期小孩长大后的随机婚配模型。

根据文献[4-7],可以采用两类指标:(1)在某一地区同期婚育群体中发生供精子代近亲结婚的概率;(2)某一地区在一定时期内可能发生供精子代近亲结婚的几率。前者是一类随机事件(供精子代近亲婚育)在给定样本空间(生活地区在某一时期内群体自由结婚生育)发生的概率,后者是一类随机过程(一段时间内发生近亲婚育)的概率累计或年均几率,需用该类随机事件的序列进行统计。

1.1 供精导致近亲婚育的基本概率

首先,考虑某个地区在某一时期适龄男女自由婚配数量。设婚龄男女人数分别为m,n人,男女自由组合形成以自由婚配为事件的样本空间Ω,其总样本数为m×n(即,男女婚配的最大可能数)。已知血缘关系的男女之间不可能结婚,据此,按照近亲血缘关系将婚龄男女分为L组,每组的男女人数分别为则有效婚配的总样本数为ΩN=m×n-同时,社会婚配受到年龄差别、经济状况、工作环境、家庭背景、教育程度、社会观念等多种因素的影响,根据文献[7,8],采用一个比例系数α,0<α<1,修正男女婚配的总样本数。即:

假设在当前婚龄群体中存在供精生育的后代,捐精者人数为J个,单个捐精者供精生育男孩和女孩数分别为同时,该捐精者及其兄弟姐妹婚育的男孩和女孩数分别为个,则供精子代发生近亲结婚事件的总样本数为:

上式给出了在未知血缘关系的情况下供精子代之间、供精子代与捐精者近亲小孩之间可能发生婚配的数量,α',0<α'<1亦为修正系数,不仅包括社会婚配习俗影响,而且包括供精子代生活与结婚地域分布等影响,即仅有部分供精子代在实际生活中可能发生近亲婚育,且α'<α。本文为简化问题描述,仅考虑一代血缘关系,如果按照家族三代内为近亲结婚,则需要分析三代血缘关系的男女数量。

根据上述分析及式(1)和式(2),按照概率定义,供精导致近亲结婚的概率为:

上式含义在于:在Ω表示的婚龄群体中存在供精子代,除了已知有血缘关系男女不能结婚外,其他均存在婚配可能性,在此条件下,供精子代发生近亲结婚的概率。

1.2 供精导致近亲婚育的人口婚配模型

某一地区在一定时期婚龄男女人数m,n均为随机数,那么,如何来确定样本值呢?采用两类方法:一是直接分析婚龄人数的变化规律,建立婚龄人口随机模型[13];二是分析该地区人口总数的变化率,根据婚龄人数占人口总数的比例估计婚龄男女人数。假设该地区在tk,k=1,2…时期的人口总数为x(tk),人口增长率的系数(不是增长率)为a(tk),人口增长的随机干扰系数为σ(tk),干扰变量为Wiener随机过程w(tk),则参考文献[13]的人口模型,总人口变化规律可以用下述方程描述:

采用y(tk)表示总人口数x(tk)中婚龄人数,其比例为ξ^(tk),则有y(tk)=ξ^(tk)x(tk)。同时,设婚龄人群中男女比例为p(tk),那么,适婚男女人数为

通过地区人口调查和血缘关系统计,获得(1)和(4)式的参数,就可以估计出人口数量m,n和~ml,~nl分布,从而可以确定公式(3)中地区人口自由婚配总样本数。

1.3 供精子代近亲人口数量估计模型

如何估计精子库供精子代数量。设在tk-τk,k=1,2…时期采用捐精者(其精液被使用并成功受孕)数量为z(tk),也用随机方程表示变化情况:

式中,b(tk),ρ(tk)分别表示增长率系数和随机干扰系数。此处,考虑供精子代经过若干年后才长大结婚,因此,(4)式和(5)式之间存在时间滞后值,即(5)式中第tk:=tk-Tk年供精生育的小孩经过k年后才进入到(4)式中第tk年人口数量的统计,τk是表示小孩婚龄分布的随机变量,选择在区间Tk∈[15,60]上服从泊 松分布P(λ),λ=16,如 图2所示。

图2 供精子代结婚年龄的泊松分布Fig.2 Poison Distribution of Marriage Ages for Sperm Donors’Children

设一个捐精者最大供精H份,其中hj(hj≤H,j=1,2…J)份精液成功生育了个男女孩。考虑供精两种统计关系:

综合上述两个方面,得到捐精者与供精子代之间的数量关系为:

设男女比例为,则所有供精生育男孩与女孩的总量估计为:

[7,8],考虑捐精者及其兄弟姐妹生育的小孩(男孩数+女孩数)总数为:

式中,β为一个统计系数,主要根据该地区某一时期三代血缘关系中家庭成员平均数量来确定,譬如,统计捐精者父母的兄弟姐妹数量、捐精者兄弟姐妹以及表兄弟姐妹数量、捐精者家庭生育小孩的平均个数,从而确定一个合理的估计量β。

取男女比例为p(t),则所有捐精者近情后代中男孩与女孩的总量估计值为:

1.4 供精导致近亲婚育的综合概率指标

综合式(3)、(6)和(7),采用几何不等式,可以得到供精导致近亲结婚的最大概率公式:

上式揭示了供精导致近亲结婚风险性的主要因素。

在式(3)基础上,估计在一定时间周期,如1年,2年,…,5年可能发生近亲结婚的几率为:

其中,K表示婚育统计的时间段,Pm,n(tk)由式(10)中将m,n,m⌒,n⌒,m︶,n︶,p,J=z(t~k换成相应的tk时期的值计算得到,即:

式中,考虑人的成长周期Τκ,用t~k=tk-τk表示在第t~

k年AID生育的小孩按照Tk泊松分布归入到第tk年结婚生育人口统计中。

2 供精导致近亲婚育风险评估的统计方法

2.1 供精导致近亲婚育概率参数估计

如何确定式(12)中随机参数,是相对复杂的系统性问题。譬如,某一地区在某一时期人口数、婚龄男女比例及实际登记结婚的人口数量、近亲血缘关系的人口分布等,需要从户籍管理与民政部门获取统计数据,并对居民抽样调查。限于篇幅,本文仅以精子库统计为例,如何确定供精子代数量分布参数。分两步考虑:一是选择某一个或几个精子库进行样本数据统计,确定供精子代总数分布情况;二是统计单个捐精者提供多份精液生育小孩的情况,包括生育时间、男(女)孩数量。此外,调查捐精者及其近亲生育情况,包括捐精者3代直系亲属的人数,包括伯(叔)父、姑妈、舅舅、姨妈、兄弟姐妹、堂(表)兄弟姐妹、侄儿女、堂(表)侄儿女等人数,制作合适的调查表。根据调查数据(捐精者数量J、最大供精数H、二代血缘关系子代数量采用偏最小二乘方法确定式(6)和(8)参数估计值即:

2.2 供精子代婚配模型参数估计

针对精子库供精子代长大后可能生活地区,如湖南省的精子库主要向该省供精,考虑该省人口流动特点,应将广东省(广州市、深圳市、惠州市)、湖北省武汉市等省市人口统计进来,因为这些区域是该省人口最大流向地域。通过调查这些地区在供精子代婚龄时期人口数量的变化、适婚男女比例、近亲血缘关系和登记结婚人口的比例,确定式(4)中主要参数的估计值。例如,收集该地区5年以上人口数据,建立人口数量时间tk序列样本X(tk)或(k=1,2,…),采用自回归滑动平均方法,获得人口变化的平稳时间序列,由矩估计方法确定参数a^(tk)和a~^(tk),再用白噪声迭代辨识方法确定参数σ^(tk)和σ~^(tk),具体统计方法和计算步骤可参考文献[7,14],不赘述。

2.3 供精子代近亲婚育风险性调查流程

供精子代从出生到长大婚育在时间和地域分布上具有极大的随机不确定性,因此,近亲生育风险的调查分析与评估是一项时间与空间跨度很大的工作,需要做好调查规划。根据概率模型,主要包括两部分:(1)精子库捐精者及其供精信息档案管理,捐精者抽样回访调查,供精子代抽样调查;(2)精子库影响区域人口数与婚育情况调查。按照时间顺序,两部分工作关系(流程)如图3所示。

由于调查数据的获取需要通过不同的医疗机构(精子库、不孕不育科室)或政府部门(户籍、民政),数据的完整性难以保证,因此,需要优化模型中样本统计方法,以较少的样本数获得更优的调查统计结果。现代社会信息化广泛实施,为获得较详细的调查数据提供了有力手段,可以建立专门的精子库伦理风险性调查信息系统。

图3 供精导致近亲生育风险性的调查流程Fig.3 Process of Investigation for Potential Risk of Consanguineous Marriage Between Sperm Donors’Children

3 供精子代近亲婚育概率的蒙特卡洛模拟分析

本文采用蒙特卡洛数据模拟方法来验证概率模型的表现特征和有效性。设某一精子库供精子代长大后生活地区的人口数为460万左右(为模拟计算精确性,设为4657349人),根据以往人口统计数值估算并采用蒙特卡洛(Monte Carlo)抽样,模拟在未来20年该地区人口变化情况,公式(4),(9)主要参数如表1所示。

根据式(4)对应的随机方程计算Euler-Marayama格式[13],计算20年该地区人口总数与结婚人口数的分布。

考虑该地区精子库在5年内供精生育小孩情况,这些小孩数量由式(5)~(9)中捐精数量确定,主要参数如表2所示。由此计算5年内捐精人数(起始数量为5463人,最大供精份数为5份),供精子代数量和模拟捐精者近亲后代数分布如表2所列。

表1 某地区婚配人口数预估模型模拟计算的主要参数Tab.1 Simulation Values of Parameters with Marriage Population Scale Model in a Given Dist rict

表2 供精子代人口预估模型参数值及供精数与子代数模拟值Tab.2 Parameters’Values with Population Estimate Model of Sperm Donors’Children and Simulation Number of Given Sperms and their Children

精子库连续5年供精生育的小孩长大后结婚生育,根据婚育年龄泊松分布确定近亲婚育的年度人口数,由式(10)计算每年度发生近亲结婚风险概率分布如图4所示。其次,为了考察单个供精者最大供精数对该类风险性的影响,模拟不同最大供精数导致近亲结婚的风险概率,得到累计概率分布如图5所示和不同人口规模下的概率分布曲面如图6所示。

从蒙特卡洛模拟的结果可以看出:(1)最大风险概率值小于3×10-4,说明合理控制精子库捐精数量和供精区域范围,其伦理风险性总体上是比较小的;(2)某一时期供精子代发生近亲婚育集中于婚龄时期,如图4所示;(3)比较精子库供精范围、管理模式和供精子代及同代近亲生活区域的人口规模、流动性和远近关系等因素,最大捐精数量和近亲人口数量及其分布对这类风险性的影响是比较大的。因此,需要控制单个供精者的精液最大受孕数量和提倡异地供精,从图5和6所示概率分布可以得到依据。

在模拟最大捐精数(最大受孕数量)对风险性影响时假设不同供精数量都被完全采用,使得供精子代数量不受限制,这与实际情况有所不一致。由于某一地区一定时期内考虑不育不孕家庭采用供精生育的数量是有限的,因此,在此约束条件下考虑不同最大捐精数对伦理风险性的影响,结果会有所不同,限于篇幅,不在此探讨。

图4 在给定供精数量和人口规模条件下供精子代发生近亲结婚的概率分布Fig.4 Probability of Consanguineous Marriage between Sperm Donors Children from Model Simulation with Given Sperms and Population Scale

图5 不同最大供精数下供精子代发生近亲结婚概率(20年累计分布)Fig.5 Total Probability of Consanguineous Marriage between Sperm Donors Children with Different Maximum Use of Sperm Donors(in 20 years)

4 结论

本文分析了供精子代出生到婚育过程,建立了近亲婚育风险性评估的概率模型与统计方法,探讨了供精导致近情婚育风险性调查的主要流程。在模型与方法上发展了已有文献的成果,主要在于:(1)给出了供精导致近亲婚育风险概率的严格数学定义,分析了样本空间的构成和抽样统计方法;(2)给出了在男女自由婚配条件下供精近亲婚育概率的最大估计方法和样本数据的获取流程;(3)给出了精子库供精伦理风险性评估的蒙特卡洛模拟方法,可分析风险性主要因素的影响程度。本文以理论分析与数据模拟试验为主,仍需要在模型参数分布、样本组成与统计方法上做进一步探讨和细化,才能很好地应用于精子库伦理风险调查和评估之中。

图6 不同最大供精数和不同人口规模中供精子代发生近亲结婚概率分布Fig.6 Probability Curved Surface of Consanguineous Marriage between Sperm Donors Children from Model Simulation with Different Maximum Use of Sperm Donor and Population Scale

参考文献

[1] SAWYER N.Sperm donor limits that control for the‘relative’risk associated with the use of open-identity donors[J].Hum Reprod,2010,25(5):1089-1096.

[2] 卫生部.关于修订人类辅助生殖技术与人类精子库相关技术规范、基本标准和伦理原则的通知[Z].2003.Ministry of Health.Information on Revision of Technical Specifications,Standards and Basic Principles for Assisted Reproductive Technology and Human Sperm Bank[Z].2003.

[3] HAJNAL J.Artificial insemination and the frequency of incestuous marriages[J].Journal of the Royal Statistical Society.Series A(General),1960,123(2):182-194.

[4] CURIE-COHEN M.The frequency of consanguineous matings due to multiple use of donors in artificial insemination[J].Am J Hum Genet,1980,32(4):589-600.

[5] DE BOER A,OOSTERWIJK JC,RIGTERS-ARISCA.Determination of a maximum number of artificial inseminations by donor children per sperm donor[J].Fertility and Sterility,1995,63(2):419-421.

[6] WANG C,TSAI M Y,HUANG SY,et al.Maximum number of live births per donor in artificial inseminations[J].Human Reproduction,2007,22(5):1363-1372.

[7] SAWYER N,MCDONALD J.A review of mathematical models used to determine sperm donor limits for infertility treatment[J].Fertility and Sterility,2008,90(2):265-271.

[8] TANAKA K,HAYASE R,TANIMURA M.Reliability of methods to estimate number of potentially marriageable first cousins for an individual using the mean and variance of sibship sizes[J].The Japanese Journal of Human Genetics,1977,21(4):239-245.

[9] 黄东晖.人工授精与近亲结婚[C].湖北省性学会第二届第二次学术年会论文集,2005年,武汉.HUANG Donghui.Artificial insemination and consanguineous marriage[C].The 2th Session of 2th Symposium with Sexual Institute of Hubei Province.2005,Wuhan.

[10] 罗莉,王海燕,乔杰,等.供精人工授精后代近亲婚配的伦理学新思考[J].中国医学伦理学,2011,24(2):226-227,259.LUO Li,WANG Haiyan,QIAO Jie,et al.A new ethical reflection on intermarriage between offsprings of artificial insemination by donor(AID)[J].Chinese Medical Ethics,2011,24(2):226-227,259.

[11] 王敬琦.供精人工授精的伦理保障[D].天津:天津医科大学,2014.WANG Jingqi.Ethics indemnification about the AID[D].Tianjin:Tianjin Medical University,2014.

[12] 朱文兵,范立青,涂玲,等.人类精子库伦理管理的困惑与对策[J].医学与哲学:人文社会医学版,2007,28(9):26-28.ZHU Wenbing,FAN Liqing,TU Ling.et al.Confusions and countermeasures of ethical management in human sperm banks[J].Medicine and Philosophy(Humanistic&Social Medicine Edition),2007,28(9):26-28.

[13] MAO X R.Stochastic differential equations and their applications(the 2nd ed.)[M].UK:Ellis Horwood Pub.,Chichester,2007.

猜你喜欢
婚配精子库婚龄
浅析《红楼梦》中贾府不同时期的婚配选择
艾利·康迪《婚配》中的反乌托邦世界
降低法定婚龄,你怎么看
婚龄宜修改,但非“灰犀牛”
农村男青年婚配难问题研究
婚龄的法理学研究
二孩放开,精子库告急
神回复
中国古代宗族婚配与惩罚