猪的免疫球蛋白基因鉴定和注释

2020-05-03 04:11张璞林育游斌杰孙静
中国实验动物学报 2020年2期
关键词:轻链相似性基因组

张璞,林育,游斌杰,孙静,5*

(1. 四川农业大学畜禽品种资源发掘与利用省重点实验室,四川 611130; 2. 重庆市畜牧科学院,重庆 402460; 3. 农业部养猪科学重点实验室,重庆 402460; 4. 养猪科学重庆市市级重点实验室,重庆 402460; 5. 重庆市医用动物资源开发与利用工程技术研究中心,重庆 402460)

家猪(Susscrofadomesticus)属于哺乳纲、真兽亚纲、偶蹄目,是较早被驯化的动物之一[1],也是最为广泛的肉类来源。在驯化过程中,猪体型的头躯比从原始野猪的7∶3变成了现代家猪的3∶7左右,使得现代家猪具有很强的产肉性能[2]。我国是猪肉生产大国,猪肉是我国城乡居民主要消费的肉类,猪肉消费比重占肉类消费总量的60%左右。全世界猪肉的消费比重在总体肉类消费中同样占据重要地位。

除了可以提供肉制品,猪还是重要的模式动物。尽管猪是非灵长类动物,但是在基因同源度、部分器官解剖学结构、新陈代谢方式等多个方面与人类有着较高相似性[3-4]。利用其繁殖性能优秀、单胎产子数多等特点,可以在较短时间内提供充足的试验材料。如今猪的克隆技术已较为成熟,可在一定程度上进行相关基因的编辑[5-6],为疾病研究提供稳定且性状均一的动物模型,现阶段在疾病模型研究中已经有了一定应用[7-11],同时有望作为器官供体进行器官移植[12]。

编码免疫球蛋白(immunoglobulin,IG)的基因包括重链(immunoglobulin heavy chain)和轻链(immunoglobulin light chain)基因,重链和轻链的胚系基因(germline gene)由编码可变区(V区)和恒定区(C区)的多个基因偏关串联形成的基因簇组成。重链可变区基因包括V、D、J三类基因片段,轻链可变区基因包括V、J两类基因片段[13]。重链和轻链基因在基因组中通常位于不同染色体上,其胚系基因彼此由内含子隔开。

免疫球蛋白是指具有抗体活性且化学结构与抗体类似的一类球蛋白,具有调节免疫、介导消除抗原等多种功能。免疫球蛋白分子单体都具有由两条重链多肽和两条轻链多肽组成的基本结构,两条轻链分别靠二硫键及非共价作用力与重链结合,两条重链间通过二硫键与非共价键的亲水和疏水作用力结合在一起,形成一个Y字型结构[13]。根据重链和轻链恒定区结构的不同可以将重链分为五类(α,δ,ε,γ,μ链),分别组成IGA、IGD、IGE、IGG、IGM五类免疫球蛋白;将轻链蛋白分为κ型和λ型,分别对应IGK与IGL。

基因注释方法主要包括两大类:一是进行序列比对,二是进行从头预测。研究者在对芥菜(Brassicajuncea)基因组进行基因注释时便采用了这两种注释策略,并结合转录组数据,取得了很好的注释效果[14]。彭长军等人对大熊猫(Ailuropodamelanoleuca)基因组重复序列采取了基于序列比对的方法注释其转座子元件,选取的数据库为食肉目,仍获得了不错的注释效果[15]。在对某一种或某一类基因进行预测时,通过序列对比的预测方法较为常用[16-17]。

最新版猪基因组(Susscrofa11.1版本)是2018年由英国罗斯林研究所Alan团队主导拼装并公布的,其基因组组装指标contig N50已经提高到与人接近的水平,是极其优秀的参考基因组。基因组组装得越好,对基因、功能元件、基因组修饰等的注释帮助就越大。当前版本猪基因组组装得足够好,但是猪的免疫球蛋白基因并未获得完全注释。猪与人的基因相似度较高,而人的免疫球蛋白基因研究得足够深入,通过序列对比对猪的免疫球蛋白基因进行注释可能取得不错的效果。研究表达的猪免疫球蛋白基因有助于了解相关免疫球蛋白的组装机制,进一步研究猪对抗原、病原的免疫特性,以更好地发挥其作为农用动物及疾病模型的作用。

1 材料与方法

1.1 资料来源

人的免疫球蛋白基因信息下载自NCBI数据库(https://www.ncbi.nlm.nih.gov/),猪的最新版基因组数据(Sscrofa 11.1)下载自Ensembl数据库(http://asia.ensembl.org/Sus_scrofa/Info/Index)。

1.2 数据处理

我们首先利用已知的人免疫球蛋白基因作为模板,使用Blast+(https://www.ncbi.nlm.nih.gov/books/NBK52640/),将猪基因组数据进行序列比对,筛选出潜在的猪的免疫球蛋白基因,并进行定位与注释;之后结合注释信息使用R软件绘制基因图谱;并根据已知的人免疫球蛋白基因信息,与鉴定所得猪的免疫球蛋白基因进行系统发育分析,使用TreeBest(http://treesoft.sourceforge.net/treebest.shtml)基于Neighbor-joining计算方法构建系统发育树。

同时我们根据鉴定出的猪的免疫球蛋白重链和轻链基因片段,使用DNAstar(DNAstar Inc., Madison, USA)对其核苷酸序列进行同源性分析,将同源性大于80%的序列划分为同一基因家族。此外我们还使用WebLogo[18]分别对猪免疫球蛋白的重链和轻链基因序列绘制序列标识图。

2 结果

2.1 猪免疫球蛋白基因及其基因座结构概述

BLAST搜索共鉴定出43个免疫球蛋白重链基因,其中IGHE基因1个,IGHG基因7个,IGHV基因35个,这些基因散乱地分布于多个scaffold上,难以对其进行具体定位(见表1)。

同样方法鉴定出52个免疫球蛋白轻链基因,其中IGK型轻链蛋白基因27个,IGL型轻链蛋白基因25个。IGK基因分布于一个基因组scaffold上,所有基因跨越的长度范围为290,541 bp。其中V区基因26个,C区基因1个,具体注释信息见图1。IGL基因分布于14号染色体上,长度范围为250,644 bp。其中V区基因21个,C区基因4个,具体注释信息见图2。

表1 猪的IGH基因概述Table 1 Summaries of IGH gene in pig

图1 猪的IGK基因物理图谱Figure 1 Physical map of IGK gene in pig

2.2 猪免疫球蛋白基因的系统发生分析

选取所有鉴定出的猪免疫球蛋白基因片段,对比分析猪与人的免疫球蛋白基因的进化关系。结果如图3、图4、图5所示,免疫球蛋白重链和轻链基因的V区与C区的基因被划分成两个分支。对IGH与IGL基因的分析发现,猪与人的VH(重链可变区)和VL(L链可变区)基因聚在一起,表明其具有很高的相似度,而对IGK基因的分析发现,一部分猪的VK基因独立聚在一起,跟人的VK(K链可变区)基因同源性很低,不排除其为假基因的可能。

2.3 猪免疫球蛋白基因家族分析

根据鉴定出的猪免疫球蛋白基因序列的相似性,将相似性80%及以上的序列划分为一个免疫球蛋白基因家族。免疫球蛋白重链基因可分为七个家族,每个家族包含的基因数1到18个不等;轻链IGK基因可分为六个基因家族,每个家族基因数1到12个不等;IGL基因可分为九个基因家族,每个家族基因数1到6个不等。同时,根据IGH、IGK和IGL基因的序列绘制序列标识图(Sequence logo),见图6、图7、图8,提示在同一种免疫球蛋白基因中,大部分位点存在较高的保守性。

3 讨论

此前的研究表明,多种动物的免疫球蛋白基因库远大于其抗体库[19]。一部分免疫球蛋白基因在复制的过程中发生点突变并成为新的免疫球蛋白基因家族成员,这可能是免疫球蛋白各家族成员庞大且序列相似度较高的原因之一。免疫球蛋白存在多种亚型,并非所有编码免疫球蛋白的基因会常时性表达,如敲除IGD的小鼠对部分胸腺依赖性和非胸腺依赖性抗原的免疫反应良好[20],而兔子则完全缺乏IGD[21]。一些具有IGD基因的哺乳动物也几乎不表达它,但不能忽视这些免疫球蛋白亚型的作用。因此,在基因组层面注释免疫球蛋白基因,了解其基因库特征将有助于揭示其系统发育机制及表达机制,从而建立更加有效的适应性免疫系统。

图2 猪的IGL基因物理图谱Figure 2 Physical map of IGL gene in pig

图3 猪与人的IGH基因系统发生分析Figure 3 Phylogenetic analysis of IGH gene in pig and human

图4 猪与人的IGK基因系统发生分析Figure 4 Phylogenetic analysis of IGK gene in pig and human

图5 猪与人的IGL基因系统发生分析Figure 5 Phylogenetic analysis of IGL gene in pig and human

图6 猪IGH基因的序列标识图Figure 6 Sequence logo of IGH gene in pig

图7 猪IGK基因的序列标识图Figure 7 Sequence logo of IGK gene in pig

图8 猪IGL基因的序列标识图Figure 8 Sequence logo of IGL gene in pig

基于免疫球蛋白基因的保守性,研究者利用脊椎动物免疫球蛋白重链基因克隆了中华鳖(Pelodiscussinensis)的免疫球蛋白重链基因,发现中华鳖的三种免疫球蛋白重链亚型(IGM、IGY和IGD)跟鸡、青蛙、壁虎和人等的相应亚型有40% ~ 50%的同一性[22]。此外,基于序列同源性比对鉴定出爬行动物变色蜥(Anolinscarolinensis)的免疫球蛋白重链基因座[23],预示基于序列比对、利用生物信息学分析手段预测免疫球蛋白基因是可行的。

由于猪与人在基因同源度、部分器官解剖学结构等多个方面的高度相似性,从生物信息的角度,通过比对人的免疫球蛋白基因与猪基因组可成功筛选鉴定出相关的猪免疫球蛋白基因。此前对猪的免疫球蛋白可变区的研究共发现约33个VH基因。由于轻链基因的研究较少,共发现14-15个VL基因,而且VK基因数目存在较大波动[19]。本研究共鉴定猪的IGH基因43个,可分为7个基因家族;IGK基因27个,可分为6个基因家族;IGL基因25个,可分为9个基因家族。这将有助于对猪免疫特性等研究,以期更好地发挥其作为疾病模型的作用。结合更多免疫球蛋白的研究,可深入探索猪免疫球蛋白重排特性、连接特性等。

在小鼠和人等多种动物上的研究表明,免疫球蛋白基因可变区的基因数目往往远大于恒定区的基因数目,可变区的V基因片段通常具有较高的相似性,通常按照80%的相似性进行基因家族的划分。小鼠的VH基因十分丰富,总数上百个[24],至少可以分为九个家族。研究表明小鼠免疫球蛋白重链基因受到增强子的调控[25]。人的VH基因按照相似性至少可以分为七个家族,并且各个家族的基因片段并不是相互独立,可与其他家族混杂分布于染色体上。从猪的免疫球蛋白重链和轻链基因序列标识图(图6-8)还可以看出其IGH、IGK和IGL基因序列上具有一定的保守性,其VH、VK和VL基因片段的序列也具有较高的相似性。

对免疫球蛋白轻链的研究在多种哺乳动物中都发现了κ型和λ型两种轻链类型,但是在鸟类上仅发现λ型轻链[26]。在哺乳动物中,κ型和λ型轻链蛋白所占比例有所不同。人和小鼠以κ型轻链为主,牛、马、猫、狗等动物主要的轻链蛋白却是λ型,由浆细胞产生的猪免疫球蛋白的κ型和λ型轻链蛋白比例近乎相等[27]。本研究发现,猪的IGK和IGL型免疫球蛋白基因数目较为接近,虽然免疫球蛋白的含量并不能仅靠基因评定,但可通过其可变区V、J基因片段去探索猪的VJ重组多样性,为进一步研究猪的κ型和λ型免疫球蛋白奠定基础。

猜你喜欢
轻链相似性基因组
一类上三角算子矩阵的相似性与酉相似性
外周血单个核细胞miR-146a和微管相关蛋白1轻链3及红细胞沉降率与类风湿关节炎疾病活动的关系
“植物界大熊猫”完整基因组图谱首次发布
轻链检测在慢性肾脏病中的应用评估
牛参考基因组中发现被忽视基因
游离轻链与免疫固定电泳检测对多发性骨髓瘤的诊断价值分析
科学家找到母爱改变基因组的证据
免疫固定电泳结合免疫球蛋白检测在多发性骨髓瘤诊断与分型中的应用评价
浅析当代中西方绘画的相似性
血清HBV前基因组RNA的研究进展