新疆塔里木河叶尔羌高原鳅遗传多样性研究

2022-04-13 10:26赵文浩易少奎苏君晓沈建忠李大鹏周小云
水生生物学报 2022年3期
关键词:遗传变异塔里木河高原

赵文浩 易少奎 苏君晓 周 琼 沈建忠 李大鹏 周小云

(1. 华中农业大学水产学院, 农业农村部淡水生物繁育重点实验室, 武汉 430070; 2. 湖州师范学院生命科学学院, 湖州 313000)

叶尔羌高原鳅(Triplophysa yarkandensis), 俗称“狗头鱼”, 是新疆南部塔里木河水系的特有鱼类,隶属于鲤形目鳅科(Cobitidae), 条鳅亚科(Noemacheilinae), 是高原鳅属(Triplophysa)鱼类中个体最大、生长速度最快的经济鱼种, 迄今发现的最大个体长30 cm、重305 g[1]。近几十年来, 塔里木河干流水流量日益减少, 盐碱化程度加剧, 加之大量滥捕、外来入侵鱼类捕食等, 导致叶尔羌高原鳅种群数量急剧减少, 即将成为继扁吻鱼和塔里木裂腹鱼之后的又一濒危物种[2]。遗传多样性是物种繁衍、抵抗疾病和适应环境变化的物质基础, 因此, 开展叶尔羌高原鳅野生群体遗传多样性研究, 从分子水平分析其种群遗传结构特征和种群历史动态, 进而制定合理有效的保护方案, 对叶尔羌高原鳅的种质资源保护和科学开发利用有重要的意义。

线粒体DNA(mtDNA)是一种核外遗传物质, 因具有基因组小、结构简单、进化速度快、几乎不发生重组以及不同的区域进化速率存在差异等特点, 成为物种鉴定和群体遗传学研究的理想分子标记[3]。在mtDNA中, 细胞色素b(Cytochromeb,Cytb)基因的进化速度适中, 许多学者选择其作为分子标记, 用于分析种群母系起源、系统进化、遗传结构和遗传多样性等[4—6]; 控制区(D-loop)是线粒体上的一段非编码区, 由于受选择压力较小, 其进化速率是线粒体其他区域的5—10倍, 研究发现, 用D-loop序列进行群体遗传多样性和系统进化研究,获得的信息更全面、结果更准确[7,8]。近年来, 通过分析Cytb和D-loop序列的碱基信息研究水产动物遗传多样性已被广泛应用, 如Guo等[9]用Cytb和D-loop序列对雅鲁藏布江6个地理群体的拉萨裸裂尻鱼(Schizopygopsis younghusbandi)进行遗传多样性分析, 发现各群体的遗传多样性水平均较低, 并且遗传变异主要来自群体内部; 杜景豪等[8]用Cytb和D-loop序列对5个日本囊对虾(Penaeus japonicus)群体分析结果显示, 群体间遗传分化较明显, 近期未曾经历瓶颈效应和种群扩张。上述研究都为种质资源的保护与开发利用提供了重要的数据基础。

目前, 关于叶尔羌高原鳅的研究主要集中在基础生物学[11,12]、繁殖习性[1,10]、肌肉营养成分[13]和耐盐碱性[14,16]等方面, 而在遗传多样性方面, 仅见王锦秀等[15]用SSR标记对塔里木河5个群体的研究报道。为了更多地了解塔里木河叶尔羌高原鳅的遗传多样性现状, 本研究采用线粒体Cytb基因和Dloop序列对塔里木河8个地理群体的遗传多样性进行分析, 研究其种群结构和历史动态信息等, 旨在为叶尔羌高原鳅的资源保护与科学开发利用提供理论依据。

1 材料与方法

1.1 样品采集

本研究所用叶尔羌高原鳅为2019年5至10月从塔里木河支流渭干河和车尔臣河采集, 其中拜城大宛其(DWQ)22尾、托克逊(TKX)20尾、且末第二分水枢纽(JDT)22尾、阿克提坎村(AKT)11尾、苏外斯埂管护站(SWS)23尾、且末五苇场(WWC)28尾、瓦石峡乡(WSX)21尾和台特玛湖(TTM)27尾, 共174尾(图 1)。根据形态学特征确认物种后,取鳍条于100%乙醇中暂存, 运回实验室后置于–80℃冰箱中保存备用。

图1 叶尔羌高原鳅采样点Fig. 1 The sampling locations of T. yarkandensis

1.2 DNA提取、序列扩增及测序

取鳍条约30 mg, 用醋酸铵/异戊醇法提取基因组DNA[17], 分别用1%的琼脂糖凝胶电泳和Nano-Drop 2000紫外分光光度计(Thermo Scientific,USA)检测DNA的质量和浓度。将合格的DNA稀释至50 ng/μL用于后续实验。

分别采用Xiao等[18]和Liu等[19]的引物扩增Cytb和D-loop序列, 具体为: CytbF: 5′-GACTTG AAAAACCACCGTTG-3′, R: 5′-CTCCGATCTCCG GATTACAAGAC-3′; D-loop F: 5′-ACCACTGGC TCCCAAAGC-3′, R: 5′-ATCTTAGCATCTTCAGTG-3′。PCR反应体系30 μL, 包括: DNA模板3 μL、上下游引物各0.75 μL(10 μmol/L), 2×PCR Master Mix 15 μL, ddH2O 10.5 μL。PCR程序为: 94℃预变性5min, 35个循环[94℃变性30s, 退火30s(Cytb为56℃,D-loop为54℃), 72℃延伸50s], 72℃延伸10min。PCR产物经1%琼脂糖凝胶电泳检测为单一明亮的条带后送公司测序。

1.3 数据分析

测序结果用Bio Edit 7.0.5软件[20]进行编辑并人工校对, 然后用MEGA 7.0[21]将其与NCBI中叶尔羌高原鳅mtDNA(KT224367)中的Cytb和D-loop序列同源比对, 确认测序结果的准确性, 并统计序列的碱基组成、变异和群体间遗传距离; 用邻接法(Neighbor-joining, NJ)基于Kimura2-parameter(K2-p)模型构建样本系统发育树, 用Bootstrap(1000次)检验聚类树各分支的置信度。用DnaSP 5.1[24]统计多态位点数目(Number of polymorphic sites, S)、核苷酸多样性指数(Nucleotide diversity,Pi)、单倍型数目(Number of haplotype,H)、单倍型多样性指数(Haplotype diversity,Hd)等。用PopART[22]构建单倍型网络进化图。用Barrier v.2.2[23]分析群体间的遗传障碍。用Arlequin 3.5[25]进行AMOVA分析(Analysis of molecular variance)计算群体内和群体间的遗传变异, 并进行Tajima’sD[26]和Fu’sFs[27]中性检验以及核苷酸不配对分布分析(Mismatch distribution)研究群体是否发生扩张。

2 结果

2.1 序列组成及变异

测序结果经校正和比对后, 分别选取1079 bp的Cytb和887 bp的D-loop序列用于后续分析。结果显示, 两序列的A、T、C、G平均含量分别为24.0%、33.1%、25.7%、17.2%和32.5%、31.1%、21.3%、15.1%、63.6%, A+T含量(Cytb, 57.1%; D-loop,63.6%)均显著高于G+C含量(Cytb, 42.9%; D-loop,36.4%)。Cytb的多态性位点数为50个, 包括40个简约信息位点和10个单一突变位点; D-loop的多态位点数为57个, 包括47个简约信息位点和10个单一突变位点; 两序列的碱基转换与颠换比分别为9.8﹕1和2.9﹕1。碱基突变位点如图 2所示。

2.2 群体遗传多样性

基于Cytb序列共检测到41个单倍型(图 2), 其中, Hap-41为8个群体共有单倍型。单倍型多样性指数(Hd)为0.9247±0.0124, 核苷酸多样性指数(Pi)为0.0065±0.0034; SWS群体的Hd和Pi指数最高,JDT群体最低。基于D-loop序列共检测到51个单倍型, 没有发现所有群体的共享单倍型,Hd为0.9776±0.0032,Pi为0.0115±0.0058; AKT群体的Hd指数最高, 而TKX群体的Pi指数最高。此外, 基于D-loop分析得到的单倍型数量、Hd和Pi均高于基于Cytb序列的分析结果(表 1)。

表1 叶尔羌高原鳅各群体的遗传多样性参数Tab. 1 Genetic diversity parameters in each population of T. yarkandensis

图2 叶尔羌高原鳅Cytb (a)与D-loop (b)序列的变异位点图Fig. 2 The genetic variation loci of T. yarkandensis in Cytb (a) and D-loop (b) sequences

2.3 群体遗传结构与系统发育

遗传分化指数(Fst)表示群体间的遗传分化程度, 通常分为3个等级: 弱分化(Fst<0.05)、中度分化(0.05≤Fst≤0.25)和高度分化(Fst>0.25)[28]。在本研究中, 除TTM和TKX群体与其他群体间的Fst在0.05—0.25, 属于中度分化外, 其他群体间的Fst均小于0.05, 属于弱分化水平(图 3)。同时, 各群体间的遗传距离小, 其范围分别为0.0055—0.0071(Cytb)和0.0092—0.0128(D-loop; 表 2), 表明群体间具有较高的遗传同质性。

表2 基于Cytb(对角线下)和D-loop(对角线上)序列的叶尔羌高原鳅群体间遗传距离Tab. 2 Genetic distance between populations of T. yarkandensis based on Cytb (under the diagonal) and D-loop (on the diagonal)sequences analysis

图3 基于Cytb(a)和D-loop(b)序列的群体间遗传分化指数(Fst)Fig. 3 Pairwise Fst between pairs of populations based on Cytb (a) and D-loop (b) sequences

AMOVA分析结果显示, 基于Cytb和D-loop序列获得的群体内变异贡献率分别为96.57%和95.25%, 而群体间的变异贡献率仅为3.43%和4.75%(表 3)。为了解支流间的遗传变异, 本研究将8个群体按支流分为两个亚群(渭干河亚群和车尔臣河亚群), AMOVA分析发现, 遗传变异依然主要来自群体内部(Cytb, 93.55%; D-loop, 92.65%), 而支流间(Cytb, 5.40%; D-loop, 4.71%)和支流内群体间(Cytb,1.05%; D-loop, 2.64%)遗传变异较小。但是, 遗传分化指数分析结果显示, 两支流之间出现了一定程度的遗传分化(Cytb,Fct=0.0540,P<0.05; D-loop,Fct=0.0471,P<0.05; 表 3)。

表3 基于Cytb和D-loop序列的叶尔羌高原鳅群体间AMOVA分析结果Tab. 3 AMOVA analysis results of inter-population based on Cytb and D-loop sequences

基于各样本的Cytb和D-loop序列构建的NJ系统发育树显示, 8个群体的样本交错分布, 没能形成明显的地理聚类(图 4)。为了验证结果的准确性,本研究进一步构建了单倍型网络进化图, 结果显示,不同群体间共享单倍型较多, 也没能形成明显的地理聚群和谱系结构(图 5)。这与上述分析中各群体间遗传分化指数Fst值小、遗传距离值低的结果相一致。用BARRIER软件分析两支流的群体间是否存在遗传障碍, 基于Cytb和D-loop序列的分析结果一致, 均显示渭干河与车尔臣河群体之间存在潜在的遗传障碍(图 6)。

图4 基于Cytb (a)和D-loop (b)序列构建的叶尔羌高原鳅各样本NJ系统发育树Fig. 4 NJ phylogenetic trees of T. yarkandensis samples based on Cytb (a) and D-loop (b) sequences

图5 基于Cytb (a)和D-loop (b)序列构建的叶尔羌高原鳅单倍型网络图Fig. 5 Median-Joining network of Cytb (a) and D-loop (b) haplotypes from eight populations of T. yarkandensis

图6 基于Cytb (a)和D-loop (b)遗传距离的遗传障碍图Fig. 6 Map of genetic barriers based on Cytb (a) and D-loop (b)genetic distances圆点表失8个叶尔羌高原鳅所在地理位置, 红色箭头a, b代表遗传障碍Circle points represent the locations of the eight T. yarkandensis labeled by abbreviations of their populations, the red arrows a and b represent genetic barriers

2.4 群体历史动态信息

Tajima’sD和Fu’sFs中性检验结果如表 4所示,除SWS和WWC两个群体的Fs值为负值且统计学结果显著(P<0.05)外, 其他6个群体的D值和Fs值的统计学结果都不显著(P>0.05)。随后, 我们将所有个体作为一个整体进行Tajima’sD和Fu’sFs检验, 得到的D值和Fs值均为负值, 但D值的统计学结果不显著(P>0.05), 结合大部分群体D值与Fs值都为正值且统计学不显著的结果, 说明没有明显偏离中性突变。此外, 虽然错配分析拟合度检验结果支持扩张假设(P>0.05; 表 4), 但是基于Cytb与D-loop所得核苷酸错配分布曲线都为多峰形(图 7a和7b)。综合数据结果表明, 整个叶尔羌高原鳅种群相对稳定,近期没有经历过瓶颈效应和明显扩张。

图7 基于Cytb (a)和D-loop (b)序列的叶尔羌高原鳅8个群体核苷酸错配分布图Fig. 7 Mismatch distribution of eight T. yarkandensis populations based on Cytb (a) and D-loop (b) sequences

表4 叶尔羌高原鳅8个群体的中性检验及拟合度检验Tab. 4 Neutrality test and goodness-of-test for eight T. yarkandensis populations

3 讨论

3.1 序列组成及突变

本研究基于线粒体Cytb和D-loop序列对塔里木河支流渭干河和车尔臣河8个叶尔羌高原鳅群体的遗传多样性进行了分析。两序列的碱基组成分析发现, A+T含量均显著高于G+C含量, 呈现明显的偏随机分布, 这与多数脊椎动物线粒体基因的编码模式一致[29]。Meyer[30]提出, 在线粒体DNA进化过程中, 发生转换的频率远高于发生颠换的频率。叶尔羌高原鳅Cytb基因和D-loop序列的碱基转换与颠换比值分别为9.8﹕1和2.9﹕1, 表明两序列的碱基突变类型均以转换为主, 这与Meyer的结论一致[30]。

3.2 种群遗传多样性

遗传多样性是物种进化和适应环境变化的物质基础, 也是评价种群资源状况的重要依据, 一个物种的遗传多样性水平越高, 其对环境的适应能力就越强, 就能获得更多的生存空间使得种群得到更好的发展, 相反, 遗传多样性缺乏则会导致物种资源衰退甚至灭绝[31]。线粒体DNA的核苷酸多样性(Pi)和单倍型多样性(Hd)是评价物种群体遗传变异程度的重要指标, 也是衡量一个群体遗传多样性和遗传分化的重要参数[32]。Grant和Bowen[33]认为, 如果群体的核苷酸多样性指数Pi>0.05且单倍型多样性指数Hd>0.5, 则表明该群体的遗传变异较丰富,遗传多样性也较高。在本研究中, 8个叶尔羌高原鳅群体的Pi指数均大于0.005、Hd指数均大于0.5,因此均属于高核苷酸多样性、高单倍型多样性群体, 这与王锦秀等[15]用SSR标记对塔里木河5个群体的叶尔羌高原鳅的研究结果类似。塔里木河叶尔羌高原鳅较高的遗传多样性水平, 可能是由于其对环境的适应能力较强, 在水体发生汇流时能很好地进行迁移, 使得群体间能够进行基因交流, 进而促进了群体的遗传变异[14—16]。此外, 基于D-loop序列获得的各群体单倍型数、单倍型多态性指数和核苷酸多态性指数均大于基于Cytb序列分析的结果, 这可能与D-loop区不编码蛋白质, 所受的选择压力小, 进化速率会更快等因素有关[34,35], 这也与杜景豪等[8]在日本囊对虾和Guo等[9]在拉萨裸裂尻鱼中的研究结果一致。

3.3 群体遗传结构

遗传距离大小是衡量物种间或同一物种不同群体间亲缘关系远近的常用指标, 种群内的遗传距离通常小于10%, 大于6%的群体间会有明显的亚种或种的分化[36]。在本研究中, 8个群体间的遗传距离值均较低(Cytb, 0.0055—0.0071; D-loop, 0.0092—0.0128), 表明相互间的遗传距离较近。根据Wright[28]的遗传分化理论, 遗传分化指数Fst<0.05代表遗传分化水平较低, 在本研究中, 大部分群体间的遗传分化指数Fst都小于0.05, 因此为低分化水平。王锦秀等[15]用SSR分析塔里木河5个叶尔羌高原鳅群体的遗传结构发现, 其遗传距离在0.606—1.901, 明显高于本研究结果, 并且多数群体间的遗传分化指数在0.05—0.15, 达到中等程度的遗传分化。产生上述结果差异的原因, 一方面可能是由于线粒体DNA标记(Cytb和D-loop)与核DNA标记(SSR)的进化速率不同[37], 因此, 用两种类型的遗传标记对群体遗传结构解析时可能会出现一定的差异; 另一方面,由于种群的遗传结构受地理隔离、生存环境、种群瓶颈和基因流等多种因素的影响, 在王锦秀等[15]的研究中, 其5个采样点分别位于不同的支流(阿尔干、台特玛湖、车尔臣河、阿克苏河和台南河),相互之间的地理位置距离较远, 群体间的基因交流相对较少。此外, AMOVA分析发现, 遗传变异主要来源于群体内部, 而群体间遗传变异很小, 仅3.43%(Cytb)和4.75%(D-loop); 基于样本构建的系统发育树和单倍型构建的网络进化图均显示, 各群体的样本没能形成明显的地理聚群和谱系结构。综合上述结果表明, 本研究的8个叶尔羌高原鳅群体间存在基因交流。虽然渭干河和车尔臣河属于塔里木河中游和下游的不同支流, 但自2000年起, 塔里木河下游启动了生态输水工程[38], 这可能促进了渭干河和车尔臣河间的叶尔羌高原鳅的基因交流。王锦秀等[15]在其研究中也发现, 不同支流的叶尔羌高原鳅群体间存在基因交流, 并指出, 这种交流增加了群体的等位基因数, 是其群体遗传多样性高的原因之一。

3.4 群体历史动态

Tajima’sD与Fu’sFs检验在检测群体是否发生扩张方面比较敏感, 当明显偏离中性突变时,D值与Fs值为显著负值, 表明发生过群体扩张事件[39]; 核苷酸错配分布曲线呈单峰时表明群体发生过扩张,呈双峰或多峰形时表明群体未经历扩张, 而是保持相对稳定的状态[40]。本研究基于Cytb和D-Loop序列的分析结果显示, 大部分群体的D值与Fs值为正值且没有显著性差异(P>0.05), 因此不能拒绝中性突变, 即没有发生过群体扩张事件; 同时, 核苷酸错配分布曲线为双峰形。这些结果表明, 本研究中的8个叶尔羌高原鳅群体没有经历扩张, 而是保持着一个相对稳定的状态。

综上所述, 塔里木河叶尔羌高原鳅各群体的遗传多样性水平较高, 但遗传变异主要来源于群体内部, 群体间的遗传分化程度较小, 各样本没能形成明显的遗传分支与地理群体聚类。虽然两支流群体间存在潜在的遗传障碍, 并发生了一定的遗传分化, 但其遗传距离只在0.05附近(Cytb,Fct=0.0540;D-loop,Fct=0.0471)。因此, 根据进化上具有关键意义的单元ESU(Evolutionarily Significant Unit)设置原则[41], 本研究建议将塔里木河叶尔羌高原鳅种群作为一个保护管理单元进行保护。

猜你喜欢
遗传变异塔里木河高原
高原往事
迸射
高原往事
高原往事
先导编辑技术可编辑近90%的人类遗传变异
永远的塔里木河
基于改进遗传变异算子的海岛算法
塔河生态输水 胡杨风景更美
GABABR2基因遗传变异与肥胖及代谢相关表型的关系
用毛细管电泳检测牦牛、犏牛和藏黄牛乳中β-乳球蛋白的三种遗传变异体