李吉印 郭满才
摘要:利用群体遗传学的基本知识推导出1对等位基因平衡群体中半同胞对子间基因型的联合概率分布;给出了半同胞对子间的联合信息熵、互信息,并定义了信息关联系数;与生物统计学研究相比,表明生物信息学的方法可使1对等位基因平衡群体中半同胞对子间的亲属关系研究成为可能。
关键词:1对等位基因;平衡群体;半同胞;亲属关系;信息关联系数
中图分类号:Q811.4 文献标识码:A 文章编号:0439-8114(2017)18-3419-02
DOI:10.14088/j.cnki.issn0439-8114.2017.18.006
Abstract: Using the basic knowledge of population genetics, the author derived the joint probability distribution of genotypes of half sib pairs among alleles equilibrium population; gave the entropy and mutual information about half sib pairs, and defined the information coefficient of correlation. By comparing the results with the statistical study, it indicated that its possible to use the method of informatics to study the kinship of half sib pairs a pair of alleles in equilibrium population.
Key words: a pair of alleles; equilibrium population; half sib; kinship; information coefficient of correlation
群体遗传研究的核心是孟德尔群体(Mendelian population)世代传递中,基因频率与基因型频率变化的规律。群体遗传学的传统研究方法是建立统计学模型[1]。然而,由于基因在世代间的传递本身就是一个信息传递过程,故也可用信息论的方法对其进行研究[2-4]。
平衡群体内存在着亲子、全同胞、半同胞等亲属关系,国内外学者在这方面已做了一些研究。杜俊莉等[5]利用Shannon信息熵指数研究了母子间和同胞对子间的相关与信息关联度,而对半同胞对子间的相关与信息关联度的研究较少。本研究就是用信息論模型讨论1对等位基因平衡群体中半同胞对子间亲属关系的关联性,以此说明运用信息学方法可对群体遗传学的有些问题进行更深入地研究,以进一步丰富群体遗传学的研究内容。
平衡群体内同母异父与同父异母两种情况下的半同胞关系,其结论是一样的。本研究中指定研究同父异母下半同胞对子间的亲属关系。
1 1对等位基因平衡群体的遗传结构及其Shannon信息
这种分析是利用传统统计学方法进行研究,因而需要对AA,Aa和aa分别赋值2,1和0,Aa和aA无区别。在同父异母(即父亲分别与两个母亲产生的后代)的情况下,当父亲的基因型不同时,分别产生的后代的基因型频率如表1所示,由此可以得到各种交配类型中半同胞对子的频率如表2所示,表3给出了平衡群体中各种同胞对子的联合分布。
4 比较分析
传统统计学在研究亲属关系时,只是对1对等位基因群体采用赋值的方法进行了研究,而且得到的相关系数均为常量;但从上面的分析可看出,用信息学的方法可求出其信息关联系数,并进一步研究它们之间的信息关联程度。研究结果表明,在1对等位基因平衡群体中半同胞对子间的亲属关系与基因频率有关,这在进化上更客观。
参考文献:
[1] 袁志发.群体遗传学、进化与熵[M].北京:科学出版社,2011.50-58.
[2] 郭满才,袁志发,宋世德,等.相对Shannon信息量与基因变异的测量[J].西北农业大学学报,1998,26(4):30-34.
[3] 郭满才,宋世德,周静宇,等.非平衡群体基因变异测量的Shannon信息量方法[J].生物数学学报,2001,16(3):341-347.
[4] 袁志发,周静宇.多元统计分析[M].北京:科学出版社,2002.257-288.
[5] 杜俊莉,郭满才,张宏礼,等.复等位基因平衡群体中亲属关系的信息学研究[J].西北农林科技大学学报(自然科学版),2005, 33(2):155-158.endprint