周姝婧, 朱翔杰, 徐新建, 苏显冰, 蔡宗兵, 周冰峰
[1.福建农林大学动物科学学院(蜂学学院),福建 福州 350002;2.福建农林大学蜜蜂研究所,福建 福州 350002]
遗传多样性对生物的生存和发展起到重要作用,是种群适应环境变化的基础,并将长期及动态地影响进化潜力及适应不同环境的能力.合理、有效地评估种群遗传多样性水平是种群遗传学、遗传多样性、保护生物学等学科的重要工作[1-2].微卫星标记是相对中性的共显性标记,具有多态性高、扩增稳定和高效、易于扩增,且价格较低等优点.在分子生物学实验技术快速发展的背景下,微卫星标记仍广泛用于动植物遗传多样性研究,种群遗传分化及相关的分化机制研究,种群的遗传结构与特征、品种鉴定研究,以及评估外来种群对本土种群基因渗透程度等研究[3-5].
蜜蜂遗传多样性研究是进行蜜蜂遗传资源保护和利用的基础,微卫星标记在蜜蜂遗传多样性领域上的应用非常普遍.样本量对蜜蜂微卫星DNA遗传多样性参数的影响尚未见报道,该领域研究所需的样本量始终处于含糊状态.对1998—2021年公开发表的论文进行样本量统计的结果显示,蜜蜂微卫星DNA遗传多样性研究使用的样本量从个位数到百群以上,多为11~60群.其中,样本量为10群以下约占6.4%,11~20群约占14.4%,21~30群约占18.3%,31~40群约占10.2%,41~50群约占16.0%,51~60群约占17.3%,61~70群约占7.3%,71~80群约占3.5%,81~90群约占2.0%,91~100群约占0.9%,100群以上约占3.8%[6-44].随着对微卫星DNA遗传多样性认识和研究的深入,研究者意识到样本量不足可能无法充分体现样本代表区域的遗传多样性水平,因此,样本量小于30群的情况从2010年前的41%下降至近5年的12%.在实际样本采集中,常常有许多困难使得样本难以采集.因此,选择适当大小的样本量,对于提高遗传多样性研究的效率有着非常重要的意义.
本研究对5个180群样本量的东方蜜蜂种群,设置15个样本量梯度进行重复抽样,探讨在遗传多样性研究中,各遗传多样性常用参数在不同样本量时与总体的关系,以及样本量对遗传多样性参数检测稳定性的影响.探索蜜蜂遗传多样性研究的最适宜样本量,可为其他生物的种群遗传学研究提供采集策略借鉴.
在东方蜜蜂分布面积大、蜂群保有量高的陕西省、重庆市、江西省、广西壮族自治区和保有量不高的台湾省开展样本采集.每个省份为一个种群,每个种群的样本量为180群.供试样本以野生蜂群或半野生原始饲养蜂群为主,采样蜂场无引种、选育行为,可代表当地蜜蜂遗传结构和多样性.
每个蜂群取1只工蜂提取全基因组进行微卫星DNA扩增.微卫星标记利用ExTaq Hot Start Version扩增试剂盒(大连宝生生物工程有限公司)进行36个微卫星标记扩增试验,引物设计、PCR扩增体系和扩增程序参考文献[11,14]的方法进行.成功扩增出目的条带的样品,送至北京金唯智公司进行基因分型.
1.3.1 抽样与微卫星DNA遗传多样性参数的计算 试验所用的5个种群,均以10群为间隔,设置15个梯度样本量(10、20、30、40、50、60、70、80、90、100、110、120、130、140、150群),采用简单随机抽样法直接抽样,每个梯度样本量抽样10次.
计算各种群微卫星DNA遗传多样性参数.使用Mstool软件计算等位基因数(Na)、期望杂合度(He)、观察杂合度(Ho)和多态信息含量(PIC);使用FSTAT 2.9.3软件计算稀疏化后的种群等位基因丰富度(Rs);基于MsTools软件得到的数据再利用Popgene1.31软件计算香农指数(I)和有效等位基因数(Ne).
1.3.2 统计分析 使用SPSS 24软件对各种群微卫星DNA遗传多样性参数与样本量进行相关性分析,并进行回归分析和曲线拟合,探讨样本量与各参数的关系;使用单因素方差分析5个种群15个梯度样本量及其总样本量的参数,参数两两之间的显著性采用多重比较Tukey方法检验.
等位基因数和等位基因丰富度是反映种群遗传变异丰富度的参数.5个种群的等位基因数和等位基因丰富度均易受样本量的影响,与样本量呈极显著正相关关系,相关系数(R2)为0.902~0.958.回归分析和曲线拟合显示,等位基因数、等位基因丰富度与样本量呈显著对数增长关系(图1).等位基因数和等位基因丰富度在样本量为10群时,分别达到各种群总样本量的43%~59%和26%~58%;60群时,分别达到各种群总样本量的74%~89%和72%~89%;150群时,分别达到各种群总样本量的91%~100%和91%~99%.
图1 样本量与等位基因数、等位基因丰富度的相互关系
方差分析显示,多样性越高,能反映总体多样性水平所需的样本量就越大.多样性最高的江西种群和广西种群,样本量为150群时的等位基因数、等位基因丰富度与总样本量的差异显著;陕西种群的等位基因丰富度在样本量为140~150群时与总样本量的差异不显著;重庆种群的等位基因数在样本量为130群以上时与总样本量的差异不显著,等位基因数在样本量为120群以上时与总样本量的差异不显著;台湾种群的等位基因数和等位基因丰富度在样本量为150群以上时与总样本量的差异不显著.
期望杂合度和观察杂合度随着样本量的增加,检测值会趋近总样本量检测值,更稳定、准确地反应整个种群的遗传杂合度(图2A、2C).
样本量为10群时,观察杂合度占总样本量的87%~111%,5个种群标准差均值为0.020 1;样本量为150群时,观察杂合度占总样本量的99%~102%,标准差均值降至0.002 2(图2B).标准差方差分析显示,样本量为70群以上的观察杂合度标准差与150群的差异不显著.
样本量为10群时,期望杂合度占总样本量的93%~109%,5个种群标准差均值为0.013 7;样本量为150群时,期望杂合度占总样本量的99%~102%,5个种群标准差均值为0.001 3(图2D).标准差方差分析显示,样本量为40群以上的期望杂合度标准差与150群的差异不显著.
图2 样本量与杂合度、杂合度标准差的相互关系
有效等位基因数与样本量呈极显著正相关关系,陕西、重庆、江西、广西4个种群的有效等位基因数与样本量的R2均在0.600 0以上,台湾种群有效等位基因数与样本量的R2为0.200 0.回归分析和曲线拟合显示,有效等位基因数与样本量呈对数增长关系(图3A).方差分析显示,陕西种群样本量为30群以上时的有效等位基因数与总样本量的差异不显著,重庆、江西种群样本量为40群以上时的有效等位基因数与总样本量的差异不显著,广西种群样本量为50群以上时的有效等位基因数与总样本量的差异不显著,台湾种群为10群以上的有效等位基因数与总样本量的差异不显著.有效等位基因数标准差在10~40群时下降明显,40~140群时下降较为平缓(图3B).标准差方差分析显示,样本量为40群以上的有效等位基因数与150群的差异不显著.
图3 样本量与有效等位基因数、有效等位基因数标准差的相互关系
5个种群的多态信息含量与样本量呈极显著正相关关系,R2为0.482~0.660.回归分析和曲线拟合显示,多态信息含量与样本量呈对数增长关系(图4A).方差分析显示,多态信息含量最高的江西种群,样本量为60群以上时的多态信息含量与总样本量的差异不显著;其次是陕西、重庆、广西种群,样本量为30群以上时的多态信息含量与总样本量的差异不显著;多态信息含量最低的台湾种群,样本量为20群以上时的多态信息含量与总样本量的差异不显著.标准差方差分析显示,样本量为80群以上时的多态信息含量标准差与150群的差异不显著(图4B).
图4 样本量与多态信息含量、多态信息含量标准差的相互关系
5个种群的香农指数与样本量均呈极显著正相关关系,R2为0.699~0.762.回归分析和曲线拟合显示,香农指数与样本量呈对数增长关系(图5A).方差分析显示,样本量为60群以上时的香农指数与总样本量的差异不显著,均达到总样本量的95%以上.标准差方差分析显示,样本量为70~140群的香农指数标准差与150群的差异不显著(图5B).
图5 样本量与香农指数、香农指数标准差的相互关系
遗传多样性研究在使用微卫星标记等共显性分子标记时,常用7种遗传多样性参数.由于每个参数反映的遗传多样性信息不同,能反映总体遗传多样性所需要的最小样本量也不同.本次在东方蜜蜂遗传多样性的研究中,反映种群遗传变异丰富度的等位基因数和等位基因丰富度等参数检测的稳定性,均随着样本量的增加而增强,样本量为60群时能检测到70%的等位基因丰富度,样本量为150群时能检测到91%以上的等位基因丰富度;反映种群遗传变异均匀度的期望杂合度最小样本量为40群,观察杂合度的最小样本量为70群,有效等位基因数的最小样本量为40群,多态信息含量最小样本量为60~80群;同时反映遗传丰富度和均匀度的香农指数最小样本量为60~70群.因此,建议在充分保证样本代表性的前提下,研究蜜蜂遗传多样性的样本量最少60群,最好在80群以上.重点关注等位基因数和等位基因丰富度等参数的研究,样本量应在150群以上;重点关注期望杂合度和有效等位基因数的研究,样本量可在40群以上.
保护生物学和保育遗传学领域,在没有人为迁入的情况下,等位基因的丰富性比等位基因的均匀性更重要,等位基因数会决定生物在自然选择下的生存极限[45].等位基因数以及稀疏化后的等位基因丰富度的参数模型就是从丰富度的角度解释种群遗传变异程度[46],样本量增加使得种群中的更多基因包括稀有基因被检测到,因此在变异数量的检测上受样本量的影响极大.但研究中发现,这类标记除了直接受样本量的影响外,还可能受到均匀度的间接影响.台湾种群的特点是,种群数量较少,分布在台湾全岛,遗传多样性和遗传结构受人工育王、蜂场转地移动等人为因素的影响较小,在丰富度较低的同时均匀度也低,并存在大量的稀有等位基因.因此在研究丰富度相关参数时,台湾种群的样本量需要达到150群时才能代表总体.虽然这类标记在了解种群的等位基因数,设计、实施方案保护本土资源时非常重要,但仍需要与均匀度参数结合在一起来判断遗传多样性水平.
种群遗传变异均匀度的参数在样本量增大时,偏离总体均匀度的程度会减小.期望杂合度、观察杂合度、有效等位基因数、多态信息含量都与种群遗传变异均匀度有关,是从等位基因比例的角度说明种群内遗传变异的分布.杂合度是最常用的反映遗传多样性的参数,其中,期望杂合度可用在单倍体、二倍体和多倍体的研究中,因此被认为是遗传多样性的最适参数之一,已有研究认为样本量对杂合度几乎没有影响[47-48].但本次对东方蜜蜂5个种群15个梯度样本量抽样10次的数据进行分析,发现样本量的增加使杂合度检测的稳定性增强,更能反映总体杂合度水平.样本量为70群时的检测值波动小,能稳定反应种群整体观察杂合度水平;样本量为40群时就能稳定反应种群整体期望杂合度水平.有效等位基因数也是从均匀度角度观察遗传多样性水平,是种群纯合体频率的倒数,能很好地区分同样的等位基因但频率不同的种群.在种群杂合体较多时,江西、广西、陕西、重庆种群的有效等位基因数均大于2.5,样本量为40群时就能代表总体的有效等位基因数;而台湾种群的遗传多样性较低,样本量为10群时即可代表总体的有效等位数.因奠基者效应、小种群、近交等因素导致纯合子较多时,样本量适当减少也能体现总体的有效等位基因数.
香农指数综合考虑了等位基因数和等位基因频率,是较为全面的反映遗传多样性指标.本研究中,香农指数在样本量为70群时即可代表总体多样性水平.香农指数除了受样本量的影响外,参与研究的标记个数会影响结果.各种群的香农指数需要在同样的标记中才能有效比较.
东方蜜蜂遗传多样性研究,除了考虑样本量外,还需要根据本物种特点制定合适的取样方式.其他动物或昆虫的研究,采样策略需要考虑季节和性比对遗传多样性的影响[17].由于蜜蜂的生殖特点,同一蜂群的遗传背景是由蜂王决定的,自然状态下的蜂群一年以上才会换王,因此,季节对蜜蜂种群遗传结构的影响不大;性比对蜜蜂遗传多样性的影响更小.蜜蜂是完全社会性昆虫,雄性蜜蜂只在特定季节出现,且数量较少,因此,蜜蜂遗传多样性的研究样本为雌性工蜂.蜜蜂是经济昆虫,饲养数量很大,人为因素的干扰会影响对当地蜜蜂遗传多样性评估的准确性.合理的采样策略,需要避免人为因素的干扰,包括引种、人工育王、育种,得到的蜜蜂样本才能准确地代表当地的自然种群,可以准确地评估种群遗传多样性和遗传结构,以便设计后续的保护和利用方案.