孙晓玉,刘胜军,庄雨龙,高志浩,梁魏苹,王洪亮
(1.黑龙江省农垦科学院畜牧兽医研究所,哈尔滨 150038;2.黑龙江八一农垦大学动物科技学院, 黑龙江 大庆 163319)
黑龙江北大荒集团(原农垦总局),2011年成立了培育“北大荒牛”领导小组和育种委员会,提出了培育“北大荒牛”目标。从2009年开始引进了40余万剂德国弗莱维赫牛冻精,以改良本地肉牛和低产奶牛,同时,开展了西门塔尔牛小群体的纯种繁育。本研究以澳大利亚引进的110头纯种西门塔尔母牛为育种材料,引进德国弗莱维赫种公牛冻精,有计划地开展了选种选配,实现了纯种繁育,科学有效地利用了优秀种公牛的优良基因,有目的地避免了近交。研究整理了德国弗莱维赫牛与澳大利亚西门塔尔母牛选配,生产的纯繁F1代的系谱信息,利用R语言程序对纯繁的西门塔尔牛育种群,计算近交系数和亲缘系数,了解育种群中是否有近交和个体间的亲缘关系,为科学地使用种公牛冻精,避免近交,提供了选配依据。笔者通过实际计算德国西门塔尔(弗莱维赫牛)改良后代母牛的遗传参数来分析阐明R语言在生物信息研究中的重要应用功能。
试验材料来源于黑龙江农垦科学院畜牧兽医研究所实验牧场(地址在黑龙江省肇东市四方山农场第二管理区),其中饲养的47头德国西门塔尔(弗莱维赫)改良母牛群。试验数据为47头德国西门塔尔(弗莱维赫牛)改良母牛群及其父母代、祖代的系谱信息。
1.2.1 牛群编号 在图1中,将47头母牛进行编号。从子代第1头牛开始编号,记为10101。其父本号记为20101,母本号记为20201。祖父本号记为30101,祖母本号记为30201。外祖父本号记为30301,外祖母本的母号记为30401。若父母代与祖父母代中有相同个体,则以第1次出现的个体编号命名。将所有牛编号之后,得到表1。
图1 牛群编号规则示例
1.2.2 数据整理 将牛群中的个体按照月龄从降序排列,个体的父母代分别作为单独数据Sire(父亲)和Dam(母亲),未知的双亲赋值为0。
表1 数据排序规则示例
1.2.3 近交系数计算 计算公式为:
(1)
式(1)中:FX为个体X的近交系数;CA为个体X的亲本S和D的一个共同祖先;k为个体X的系谱中的共同祖先数;n1为个体X的父亲S到共同祖先A的世代数;n2为个体X的母亲D到共同祖先A的世代数;FCA为共同祖先本身的近交系数。
规则1:如果S和D是Y的双亲,rxy表示X和Y的分子亲缘系数。
(2)
规则2:一个个体和其自身的分子亲缘系数等于1加上它的近交系数。
FX=rXX-1
(3)
规则3:一个个体的近交系数等于其双亲间分子亲缘系数的1/2。
(4)
计算牛群中每个个体的近交系数,需要根据亲缘关系矩阵A,找到它的对角线数值减去1,所得的值即为牛群每个个体的近交系数。
(5)
计算每个个体间的亲缘系数,只需在矩阵中找到对应2个个体的数值,利用两者的协方差除以两者方差积的开方,即可得到两者的亲缘系数。
1.2.5 运算代码 文档读取:
x=read.table("D:\cow\bianma.txt")
y=as.matrix(x)
ped=apply(y,2,as.numeric)
colnames(ped) <- c("ID","Sire","Dim")
ped
近交系数计算:
library(nadiv)
pped=prepPed(ped)
A=as.matrix(makeA(pped))
re=data.frame(ID=row.names(A),inbreeding=
diag(A)-1)
write.csv(re,"D:\cow\inbreeding.csv",row.names=F)
亲缘系数计算:
library(nadiv)
pped=prepPed(ped)
mat=as.matrix(makeA(pped))
id=row.names(mat)
id1=rep(id,length(id))
id2=rep(id,each=length(id))
n=dim(mat)[1]
coeff=matrix(0,n,n)
for(i in 1:n){
for(j in 1:n){
coeff[i,j]=mat[i,j]/sqrt(mat[i,i]*mat[j,j])}}
coeff_value=as.vector(coeff)
RE=data.frame(id1,id2,coeff_value)
write.csv(RE,"D:\cow\coeff.csv",row.names=F)
计算的47头母牛的近交系数结果见表2。在计算该牛群的近交系数中,父母代中公牛有3头,母牛有47头,祖代中公畜有26头,母牛有50头。从表2可以看出,通过计算,该牛群个体间近交系数均为0,目前所有个体均无近交。表明该群体在做选种选配时,注意了各家系公牛的选择,避免了近交。
表2 47头母牛近交系数的计算结果
计算的47头母牛的亲缘系数结果见表3。由表3可以看出,该牛群亲缘系数值在0~0.500 0之间。由于试验个体较多,试验结果数据大,本文以个体17101为例,列举该个体与其他子代个体间的亲缘系数。由表4看出,个体17101与其他子代的亲缘系数值在0.062 5~0.250 0之间。
表3 母牛群不同亲缘程度个体所占比例
表4 子代个体间亲缘系数情况表(以个体17101为例)
(1)遗传学上将有亲缘关系的个体间的交配称为近交。近交系数是指配子基因效应间的相关[1]。本研究内容针对的是一个自繁自育的西门塔尔牛群,对于群体内是否近交是非常关注的,在引进外来遗传物质——德国弗莱维赫牛冻精时,应尽量应用较多的家系,以避免近交。虽然近交能出现优良的纯合基因个体,也能出现有害基因纯合个体,对于一个相对封闭的自繁自育群体,当群体规模较小时,使用的家系公牛又较少时,很容易发生近交。在母牛群体中应使近交系数控制在6.25%以内。张嘉保、陶增思等人指出近交对奶牛的生长发育及繁殖性能都有一定影响,且影响趋势随近交程度的提高而加剧。尤其以12.5%近交组的生长发育、繁殖性能受到的影响最为明显[2]。美国2004年出生的荷斯坦小母牛平均近交系数为5.0%,并且以每年0.1%的速率不断提升[3]。不断提升近交程度的同时,奶牛的产奶量也大幅度提升,带来的负面影响是群体的繁殖率降低,难产率增加。
(2)在肉牛繁育场,除做好选种外,还须做好选配计划,以保持所选育品种的优良性状较好地遗传。近交系数的大小,是对双亲间的亲缘关系程度的间接度量,双亲间的亲缘程度也可用二者间的亲缘系数直接度量。亲缘系数,是指两个个体间加性基因效应间的相关[1]。在肉牛品种纯繁或培育中,种畜应保持较多的血统,特别是各家系后代要有较远的亲缘关系,因为,群体内可利用的遗传变异与种畜间的相似性直接有关。 在本研究中的350头规模的西门塔尔牛群体,经过了自群繁育后,个体间都有一定的亲缘关系,从澳大利亚引进的母亲群的亲缘系数在0~0.500 0,其中,亲缘系数0.5占比1.37%;0.312 5占比0.46%;亲缘系数为0的占到90.87%。但到了子代亲缘系数达到0.062 5~0.250 0,因此,引进血缘关系较远种公牛的冻精尤为重要,在纯种选育时,及时进行育种方案规划,保证畜群始终具有稳定、可利用的遗传变异,才能使牛群育种获得较大的进展。
(3)本文利用R语言程序的特点,开展近交系数和亲缘系数计算,通过实际操作发现,在输入数据时,不能提供方便的操作界面环境,但是,具有很便利的编程功能。
在肉牛繁殖母牛场,建议近交系数应控制在6.25%以下,本试验来自西门塔尔自繁自育母牛场,很好地控制了近交系数,但从亲缘系数来看,所在群应用的种公牛家系较少,导致后代群体中的个体间亲缘关系较近,因此,增加不同家系种公牛的数量,以确保育种群有更多血统种公牛后代,出现更多的优秀个体,才能加快群体内的遗传进展。