朱 明, 申 欣, 朱笑琳, 屠海淼, 杨 婕, 孟学平
(淮海工学院 海洋学院, 江苏省海洋生物产业技术协同创新中心, 江苏 连云港222005)
基于形态学[1-2]和同功酶[1]资料、扩增片段长度多态性(AFLP)和 16S rRNA 基因[3]、内转录间隔区1(ITS1)[4]、细胞色素c氧化酶亚基 1基因(cox1)[5]、细胞色素b基因(cob)[6]等核DNA和线粒体DNA资料分析显示, 中国黄、渤海西施舌(即墨、胶南、日照、连云港和启东)以及南方的广西北海群体与福建群体(长乐、漳州)发生了高水平的遗传分化[1]。作者用比较线粒体基因组学的资料[7]从全基因组结构差异角度揭示漳州西施舌发生了明显的分化, RAPD分析也认为福建(长乐)群体发生了明显的分化[8], 福建群体可能是西施舌的一个亚种或是腔蛤蜊属的新种。上述资料为西施舌群体遗传分化提共了有力的形态学与分子生物学证据, 但是根据现有资料确定福建西施舌是西施舌的亚种或是隐种, 证据尚显不足, 还需更多的资料证实。
组蛋白是真核生物染色质的基本单位—核小体的重要结构成份, 也是基因表达调控的重要成份[9-10], 特别是与核小体的组蛋白变体与基因转录、DNA复制和染色体的异染色化有关[11]。组蛋白H2A家族的成员之一H2AX与DNA损伤修复、基因组稳定性维持及肿瘤抑制有关[12-13], 组蛋白还有抗菌作用[14]。后生动物组蛋白基因为多拷贝, 如海胆基因组有 2套编码无多腺苷酸尾 mRNA的组蛋白基因, 其中编码核心组蛋白的基因有34个, 分散存在于基因组的不同位置, 还有编码组蛋白变体的基因[15]。组蛋白基因很保守, 如亲缘关系较远的后生动物海胆组织的H3与小牛胸腺H3序列只差1个氨基酸, 小牛胸腺H3与豌豆H3只有4个氨基酸不同。组蛋白中H2A的保守性为中度, 若福建西施舌与其他群体 H2A仍然存在明显的差异, 则能补充说明上述分子生物学资料证据, 因此, 基于组蛋白核苷酸的西施舌群体遗传差异分析资料显得尤为重要。NADH脱氢酶亚基 6基因(nad6)和亚基1(nad1)基因间有2个tRNA基因和1个非编码区[7], 因此, 在nad6的5′端和nad1的3′端设计引物扩增的片段(nad6~nad1)包括nad63′、nad15′端部分序列,tRNAGln和tRNAThr2个 tRNAs基因序列及其之间的非编码区(约 100bp),nad6~nad1区域能够同时反映蛋白质编码基因、tRNA基因和非编码区核苷酸差异, 可提供有效的群体差异分析资料。核基因组DNA和线粒体 DNA资料相互印证, 分析结果更有说服力。
本研究所用西施舌(Coelomactra antiquata)采自山东日照、福建漳州、广西北海沿海。取西施舌斧足肌肉酒精固定4℃保存备用。
取乙醇保存西施舌组织浸出乙醇或新鲜组织研碎, 用SDS-蛋白酶K裂解组织, 酚-氯仿抽提蛋白质,乙醇沉淀DNA。详细步骤参考文献[4]操作, 个别步骤稍作修改。
用 SeqMan软件对作者已经测定的西施舌浮游幼虫表达序列标签(ESTs)进行拼接, 获得含有组蛋白H2A编码区的DNA序列, 用Primer-BLAST(http://www.ncbi.nlm.nih.gov/tools /primer-blast/)在线从编码区两翼的非编码区设计上下游引物, 引物名称及序列如下: HP83-F: GAA AGT CCC TGC CGA ACA;HP83-R: GAA GCA CAC TCG CAC ACC T; PCR 退火温度为52 ℃ , 25μL 体系, 延伸时间40 s, 35个循环。根据西施舌[16-17]、四角蛤蜊[7]和中国蛤蜊(作者测序未登录)nad63′端和nad15′端分别设计扩增nad6~nad1片段上下游引物 YJ-4clam-na6-F: GCY GCT GCK CGY ATD TGT AG 和 YJ-4clam-nd1-R:TGY GCA ATA GCA CGY ATA GC。扩增条件: 退火温度54℃, 延伸时间45 s。PCR产物经0.8%琼脂糖凝胶电泳检测后送生工生物工程(上海)有限公司双向测序。
双向测序结果用 DNAStar软件包中的 SeqMan拼接, 结合测序峰图对序列进行人工校对。用ClustalX (1.83)对序列进行比对并取齐, 用SPSS 17.0进行碱基含量差异显著性分析; 用DnaSP v5.1软件进行基因型或单倍型确定; 用MEGA4.0进行核苷酸序列差异分析: 统计变异位点、简约信息位点, 根据Kimura 2-parameter(K-2P)计算遗传距离; 用 Arlequin v3.1进行分子方差分析(AMOVA), 群体间遗传分化指数(FST)计算采用pairwise difference模型。
本研究共获得西施舌日照(RZ, 10个样本)、北海(BH, 7个样本)和漳州(ZZ, 6个样本)3个群体H2A基因区(包括 H2A编码基因和基因两翼的非编码区)序列 23条, 去除两端不可信序列后所得序列长度为606bp(RZ, BH)或 616bp(ZZ), 同源序列存在长度多态性; 经DnaSPv5对23条序列分析共获得9种基因型(Gen), 其中, Gen1~3、Gen 5由日照和北海群体共享, Gen 4为日照群体独享, 北海群体无独享单倍型,说明日照、北海西施舌存在基因交流。Gen6-9为漳州群体独享, 西施舌漳州群体与其他 2个群体无交叉共享基因型, 无基因交流; Gen 1~5 (RZ, BH)碱基平均含量(%)分别为 T : 23.0、C : 26.2、A : 27.5、G :23.3, Gen 6~9(ZZ)碱基平均含量(%)分别为 T : 23.3、C : 26.0、A : 28.2、G : 22.5, 前者的 AT 含量(%)为50.6, 后者的为51.5, 碱基含量存在差异。
将H2A基因区片段23个序列进行比对分析, 共获得 616个比对位点(图 1), 其中变异位点(V)30个,占比对位点的 4.86%, 简约信息位点(Pi)25个, 占4.05%。日照、北海群体合并为一组计算, 组内 V位点4个, Pi位点1个, 漳州群体内V位点5个, 无Pi位点; 在 616个比对位点中, H2A开放阅读框(ORF)(375bp)相对保守, 只有 6个变异位点, 占变异位点的 20%(此区在图 1中只列出一部分), 其中有 3个位点为漳州群体共享单核苷酸突变位点, 变异发生在密码子的第 3位, 未引起氨基酸组成的改变; 两翼分别是基因上游和下游非编码区, 其中1~106位点为上游非编码区, 漳州群体在此区10~19位点有一段10碱基(CCCGCTGATC)的插入序列(图1左侧虚框所示),在56~96位点区有一碱基高变区(图1右侧虚框所示);482~616位点为下游非编码区, 此区漳州群体有7个共享单苷酸变异位点。序列比对发现, H2A基因ORF的上游变异较大, 有插入序列和高变区, 而 ORF的下游变异相对小, 但ZZ群体ORF上、下游序列中均有标志性的变异位点, 可作为ZZ群体的分子标记。
图1 西施舌H2A基因区两翼部分序列比对Fig.1 Flanking sequences comparison of H2A gene of Coelomactra antiquata
H2A基因区基因型序列比对显示, 在30个变异位点中, 西施舌漳州群体有 23个共享变异位点, 其中在基因区有 3个共享变异位点, 两翼序列中有 20个。日照、北海西施舌有26个共享变异位点(图2), 漳州西施舌与日照、北海西施舌无共享变异位点, 说明无基因交流。
图2 西施舌H2A基因型序列比对Fig.2 H2A genotype sequence comparison of Coelomactra antiquata
根据基因型核苷酸序列, 用Clustalx软件比对后,用MEGA软件计算遗传距离(K-2P) (表1), 将漳州群体分为一组, 日照、北海群体分为另一组(混合组)。结果显示, 混合组组内遗传距离 0.002~0.005, 平均为0.003, 漳州组组内遗传距离为0.002~0.007, 平均为 0.004, 混合组与漳州组间的遗传距离为0.041~0.048, 平均为0.044。组间遗传距离与组内(漳州组)遗传距离之比为 11。分子方差分析(AMOVA)显示两组间的FST= 0.9370(P<0.01), 说明两群体间发生了极显著的遗传分化。
PCR扩增产物经双向测序获得 710bp左右的nad6~nad1片段, 将全部序列经Clustalx取齐后得到547个比对位点, 从 2个群体中共获得 20条nad6~nad1序列(每个群体10个样本), 核苷酸含量统计显示RZ群体T、C、A、G含量分别为40.5%、10.5%、27.5%、21.5%, A+T平均含量为68%, 明显高于C+G含量。ZZ群体T、C、A、G含量分别为38.5%、11.0%、28.1%、22.4%, A+T平均含量为66.6%。2个群体中的T、G含量存在显著差异(P<0.01), RZ群体T显著高于ZZ群体, 而G显著低于ZZ群体。
表1 基于西施舌H2A基因区核苷到序列的遗传距离Tab.1 Genetic distances based on H2A gene region nucleotide sequence of Coelomactra antiquata
对nad6~nad1片段的核苷酸序列检测获得 7种单倍型(hap), 其中漳州西施舌10个个体有2种单倍型(hap1, hap2), RZ群体 10个个体有 5种单倍型(hap3~hap7), 漳州群体与日照群体无交叉共享单倍型; 对7种单倍型进行序列比对显示, 变异位点占比对位点的16.5%(图3), 简约信息位点占15.7%。2群体间的遗传距离(K-2P)0.199~0.202, 平均为 0.200,群体内平均遗传距离分别为 0.003(RZ)和 0.004(ZZ),群体间与群体内遗传距离之比为50~66。
nad6和nad1之间有tRNAGln和tRNAThr2个tRNA基因和tRNAs基因间非编码区。用于比对的序列5′端nad6部分因质量差全部被切除,tRNAGln5′端部分被切除,3′端只剩下9个碱基, 其后依次是96bp的非编码区(NCR96),tRNAThr、4bp的非编码区和最后的368bp的nad1区域(图3)。图3显示在NCR96(96个位点)区, 漳州、日照群体有 4处碱基缺失/插入,且在tRNAThr、nad1编码区均有碱基缺失和插入序列, 两个群体nad6~nad1片段的一级结构存在极大的差异, 包括单核苷酸的高频率突变与碱基的缺失和插入(图3)。将此nad1片段翻译成氨基酸序列, 序列比对发现在 N-端前 20个氨基酸变异很大(图 4),此区日照西施舌 nad1缺失“QILWVQ”6个氨基酸,且在第3、6、13、14、16、17、20、25、113位等 9个座位的氨基酸不同。
本研究结果显, H2A 基因型Gen1~3, Gen5为北海群体和日照群体所共享, 而北海群体与漳州群体发生了明显的遗传分化, 这种现象不符合地理距离产生遗传分化的理论。说明在进化历史过程中, 西施舌日照、北海群体有基因交流发生。日照与北海的地理距离很远, 通过海洋进行的基因交流几率很小,基因交流由人为生成的可能性相对大, 其确切原因有待进一步研究。然而基因型Gen6~9为漳州西施舌特有, 与日照、北海西施舌无共享现象, 只有 Gen8为漳州西施舌 3个不同个体共享。这说明漳州西施舌与日照、北海西施舌无基因交流。nad6~nad1序列分析也显示漳州群体和日照群体无交叉共享单倍型,从线粒体基因角度证实在演化历史上这 2个群体间无基因交流, 已经发生了遗传分化。
关于福建(长乐、漳州)西施舌遗传分化的研究已有报道,cox1分析显示福建(长乐、漳州, 称为 DH组)西施舌与黄、渤海、北部湾(称为BH组)西施舌间的遗传距离为0.0 837, 而DH组和BH组组内遗传距离分别为 0.0047和 0.0035, 组间与组内遗传距离之比为17.8和23.5[5]。 基于cox1钵水母纲13个属属内种间遗传距离(K-2P)在 0.056~0.381, 种内平均遗传距离为 0.013, 种间与种内遗传距离之比为4.3~29.3[18], 西施舌DH与BH组间与组内遗传距离之比值在此范围内;cob分析显示长乐西施舌与非长乐西施舌(大连、启东、北海群体)间的遗传距离为0.191~0.209, 而长乐群体和非长乐群体内平均遗传距离为 0.010, 群体间与群体内遗传距离之比为19.1~20.9倍[6]; 16S rRNA分析显示长乐群体与非长乐群体(辽宁大连、山东即墨、胶南、日照、连云港、启东、广西)间的遗传距离平均为0.081, 群体内的遗传距离为 0.007, 两者之比为 11.6[19], 上述研究显示长乐群体与非长乐群体间遗传距离之比值均大于11.6; ITS1分析显示长乐群体与非长乐群体间的平均遗传距离为 0.0329, 群体内遗传距离平均为 0.0088,群体间与群体内遗传距离之比为3.7[4]; ITS2分析显示长乐群体非长乐群体间遗传距离平均为 0.029, 群体内平均遗传距离为 0.012, 两者之比为 2.42[19]; 本研究发现漳州西施舌与非漳州(日照、北海)西施舌间的遗传距离平均为 0.044, 而群体内的遗传距离平均为 0.004, 两者之比达 11。不同基因解析能力不同,但有规律可循, ITS1和ITS2群体间与群体内遗传距离之比值在2.4~4.2, 不大于5, 而线粒体基因组此值大于 10, 这达到了“10×”规则的标准[20-21], 说明福建(长乐、漳州)与其他群体西施舌发生了明显的分化。特别是来自组蛋白基因两翼序列的证据证明, 漳州西施舌发生了明显的分化。组蛋白H2A基因在核心组蛋白中属中度保守, 但在漳州和非漳州西施舌群体中相对保守, 只有 3个漳州群体特征性单核苷酸突变位点, 但通过这 3个位点的碱基可识别漳州西施舌。H2A基因的两侧非编码区突变率高, 在群体分子遗传学研究中具有重要意义, 特别是组蛋白H2A编码区上游-77至-86位的插入序列和-11至-50区的高变区可以作为漳州西施舌明显的分子标记(图1方框), 在群体鉴别中具有重要意义。
图3 日照、漳州西施舌nad6~nad1片段核苷酸序列差异分析Fig.3 Analysis of difference in nad6~nad1 fragment nucleotide sequence of Coelomactra antiquata from Rizhao and Zhangzhou coast
图4 日照、漳州西施舌nad1 N′端氨基酸序列比对Fig.4 Amino acid sequence aligment of nad1 N′-end between Rizhao and Zhangzhou Coelomactra antiuqata
本研究扩增了nad6和nad1基因之间的核苷酸序列, 用来比对的 DNA序列包括trnQ(9bp)部分序列、2个非编码区(96bp+4bp)、trnT(63bp)全序列和nad1(371bp)部分序列(图 3), 此 DNA片段的总碱基数虽不多, 但所包涵的信息却很丰富, 这些信息显示西施舌日照、漳州群体这个区域核苷酸差异极为明显, 2个群体的7种单倍型有90个变异位点, 2个群体nad1编码的氨基酸有6个位点不同, 可见此区域是区分日照、漳州西施舌的更加有效的分子标记。而漳州西施舌共享变异位点 84个, 占变异位点的93.3%。本研究结果为西施舌的系统演化研究提供了来自核基因组和线粒体基因组的重要参考。
[1] Kong L F, Li Q, Qiu Z X. Genetic and morphological differentiation in the clamCoelomactra antiquata(Bivalvia: Veneroida) along the coast of China [J].Journal of Experimental Marine Biology and Ecology,2007, 343 (1): 110-117.
[2] 刘德经, 朱善央. 福建与江苏西施舌群体形态差异研究[J]. 南方水产, 2010, 6 (2): 29-34.
[3] Kong L F, Li Q. Genetic comparison of cultured and wild populations of the clamCoelomactra antiquata(Spengler) in China using AFLP markers[J]. Aquaculture,2007, 271: 152-161.
[4] 孟学平, 高如承, 申欣, 等. 西施舌 5个地理群体ITS1序列变异及系统发生分析[J]. 生态学报, 2010,30 (20): 5555-5561.
[5] 孟学平, 高如承, 申欣, 等. 基于 COI的中国西施舌DNA 条形码[J]. 水产科学, 2011, 30 (10) : 626-630.
[6] 孟学平, 申欣, 张波, 等. 西施舌Cytb基因核苷酸差异分析[J]. 水产科学, 2010, 29 (9) : 537-542.
[7] Meng X P, Shen X, Zhao N N, et al. The complete mitochondrial genome of the clamMactra veneriformis(Bivalvia: Mactridae): Has a unique non-coding region,missing atp8 and typical tRNASer[J]. Mitochondrial DNA, 2013, 24(6): 613-615.
[8] 孟学平, 王帅, 高如承, 等. 西施舌群体遗传结构及分化的RAPD分析[J]. 海洋科学, 2011, 35 (2): 6-9.
[9] 陈伟, 罗辽复. 基于组蛋白甲基化信息的 H2A.Z和H2A 核小体识别[J]. 生物物理学报, 2009, 25 (4):269-274.
[10] Marzluff W F, Duronio R J. Histone mRNA expression:multiple levels of cell cycle regulation and important developmental consequences[J]. Current Opinion in Cell Biology, 2002, 14(6): 692-699.
[11] 张琼. 蜘蛛组蛋白H3基因保守序列的克隆与进化分析[D]. 武汉: 湖北大学, 2006.
[12] 倪冠英, 何淑梅, 董娟聪, 等. 电离辐射对 Jurkat细胞γ-H2AX蛋白表达的影响[J]. 吉林大学学报, 2010,36 (5): 895-899.
[13] 涂文志, 尚增甫, 李兵, 等. 与细胞周期 G2/M 期进程相关的 H2AX磷酸化[J]. 中国生物化学与与分子生物学报, 2012, 28 (4): 339-345.
[14] 李成华. 栉孔扇贝核心组蛋白的基因结构及 H2A抗菌活性的研究[D]. 青岛: 中国科学院海洋研究所,2007.
[15] Marzluff W F, Sakallah S, Kelkar H. The sea urchin histone gene complement[J]. Developmental Biology,2006, 300(1): 308-320.
[16] Meng X P, Shen X, Zhao N N, et al. Mitogenomics reveals two subspecies inCoelomactra antiquata(Mollusca: Bivalvia) [J]. Mitochondrial DNA, 2013, 24(2): 102-104.
[17] 孟学平, 申欣, 赵娜娜, 等. 漳州西施舌线粒体基因组全序列: 腔蛤蜊属(Coelomactra)存在新种的证据[J].海洋学报, 2013, 35(3): 213-222.
[18] Ortman B D, Bucklin A, Pages F, et al. DNA barcoding the Medusozoa using mtCOI[J]. Deep-Sea Research II,2010, 57: 2148-2156.
[19] 孟学平, 申欣, 赵娜娜, 等.基于ITS2 和16S rRNA的西施舌群体遗传差异分析[J].生态学报, 2013,33(24): 7882-7891.
[20] Hebert P D N, Cywinska A, Ball S L, et al. Biological identifications through DNA barcodes[J]. Proceeding of the Royal Society B: Biology Science, 2003, 270(1512): 313-321.
[21] Hebert P D N, Penton E H, Burns J M, et al. Ten species in one: DNA barcoding reveals cryptic species in the neotropical skipper butterflyAstraptes fulgerator[J]. Proceedings of the National Academy of Seieaees of the United States of America, 2004, 101(41): 14812-14817.