SNP标记在动物遗传育种及人类疾病动物模型研究中的应用

2019-01-08 15:19王晨阳张锐虎余婧婧宋国华陈朝阳
中国比较医学杂志 2019年4期
关键词:动物模型分型基因组

王晨阳,王 璐,张锐虎,余婧婧,宋国华,陈朝阳*

(1.山西医科大学实验动物中心,太原 030001;2.山西省实验动物与人类疾病动物模型重点实验室,太原 030001)

单核苷酸多态性(single nucleotide polymorphism,SNP)是指由单个核苷酸在基因组水平发生变异造成DNA序列多态性,这种变异包括单个碱基的转换、颠换、缺失、插入共四种情况,但主要以转换和颠换为主,二者出现的比例为2∶1[1]。转换指嘌呤碱基A与G、嘧啶碱基T与C之间相互替代,颠换则是嘌呤和嘧啶碱基之间(C A,G T,C G,A T)的替换,当这种变异在群体中所占比例大于等于1%时即为SNP[2]。常见的SNP基本上属于二等位多态性,即DNA序列中的4类碱基中某2类碱基之间的变异,其既可以出现在基因编码区,也可以出现在非编码区,虽然发生在编码区的概率相对较小,但会影响基因的功能,导致生物性状改变,在遗传性疾病的研究中具有非常重要的意义。全基因组关联分析(GWAS)以整个基因组的SNP为分子标记,在全基因组水平上进行相关性分析,从中找到影响某一性状的变异基因或SNP关键位点[3]。SNP作为第三代遗传标记,其分布密度高,遍布于整个动物和人类基因组中;与功能基因具有高度关联性;突变率低,遗传稳定性强;检测通量高便于自动化分析[4]。因此广泛应用于生物学、农学、医学、生物进化等众多领域,同时在分子遗传学、药物遗传学、法医学以及疾病的预测、诊断和治疗等方面也发挥着重要作用。某些SNP位点并不直接与疾病基因的表达相关联,但因为它与某些致病基因相邻,所以成为重要的遗传标记。本文旨在介绍SNP标记位点在动物遗传育种以及人类疾病动物模型中的应用。

1 SNP标记位点在动物遗传学研究中的应用

1.1 群体遗传结构及遗传多样性分析

在分子层面研究物种遗传多样性主要基于物种基因组之间结构变异的检测,基因组之间的结构变异主要在遗传变异上体现,其中最重要的遗传变异是SNP。李银银等[5]采用基质辅助激光解吸电离飞行时间质谱(MALDI-TOF-MS) 技术对来自国家啮齿类实验动物种子中心的2个ICR群体(北京、上海)和1个KM封闭群(上海)小鼠样本的45个SNPs进行群体遗传结构分析,这3个群体的遗传多样性杂合度结果为SKM>BICR>SICR,可以认为KM小鼠的遗传多样性高于北京和上海的ICR小鼠群体。赵紫霞等[6]利用57 K SNP芯片检测了来自不同地域的6个虹鳟养殖群体(黑龙江虹鳟、黑龙江金鳟、四川虹鳟、四川金鳟、北京虹鳟和北京金鳟),共获得有效SNP位点50201个,分析得出这6个养殖群体中有显著离群个体存在,即这些群体的遗传背景不均一,为我国虹鳟的种质资源评估、本土化良种培育、制种和引种工作提供了基因组水平的参考信息。Nicoloso等[7]用Goat SNP50 BeadChip对14个意大利山羊群体(VAL、 CAM、SAA、ORO、BIO、VPS、 CGI、TER、ASP、NIC、ARG、GIR、MAL、SAR、SAM)共354个样本进行基因分型,最终得到51136个有效SNP位点,结果显示,Fst值的变化范围为0.013~0.164,其中NIC群体的近交系数(FIS)值有显著性差异,即该群体中有较多的纯合子。 应用SNP标记对不同种群进行群体结构分析,评估群体的遗传多样性,可以为特殊种群的资源培育提供依据,同时也为推测群体的进化关系提供参考。

1.2 遗传图谱构建

遗传图谱即遗传连锁图谱,是通过遗传重组交换结果进行连锁分析所得到的基因在染色体上相对位置的排列图,遗传图谱上SNP位点越多,分布越均匀,性状基因定位就越精确。Du等[8]构建了首张凡纳滨对虾SNPs连锁图谱,该图谱共包含1344个SNPs标记位点,其中45个与性别相关的平均连锁群中含有418个SNPs,同一连锁群平均连锁不平衡程度为0.15,且不平衡水平随着标记间距的减少而增加,有一个数量性状定位(QTL)与性别相关,该遗传图谱为以后虾基因组学的研究奠定了基础。郑先虎等[9]用简单重复序列标记(SSR)和SNP标记构建了鲤鱼的连锁图谱并对体长(SL)、体高(H)、体厚(BT)和体长/体高(SLH)进行了QTL定位分析,发现有14个QTL分布在7个连锁群上,其中3个与体高相关(P<0.01),2个与体厚相关(P<0.05),2个与体长/体高相关(P<0.05)。Xie等[10]首次利用LEP MAP构建了南方鲇(Silurusmeridionalis)RAD-SNP遗传图谱,该图谱包括29个连锁群,26714个SNPs,其中有效位点有6715个,图谱全长5918.31cM,平均标记间隔为0.89 cm,遗传图谱的构建为南方鲇在比较基因组学、QTL、选择性育种等方面的研究提供了重要的依据。SNP遗传稳定性较高,遗传连锁图谱的构建可以将物种中与某一特定性状相关的基因准确定位在染色体上。

1.3 标记辅助选择

遗传标记是指用于区分不同个体和群体并且可以稳定遗传的物质或性状,分子遗传标记稳定性高,信息含量大,受环境因素影响小,其变异只与DNA序列的差异有关,可以监测到形态学上无法发现的差异。

1.3.1 生长性状相关功能标记

SNP标记稳定性好,易于进行基因分型,且不受环境、性别、生长发育等的限制,可以缩短世代间隔、提高选择强度,在一定程度上促进了分子标记辅助育种的发展。梁国明等[11]对3个母猪品种共计328个个体采用直接测序法克隆ZP4基因中的SNP位点,共检测到27个SNPs,其中A268T位点在3个母猪群体中均与总产仔数显著关联(P<0.05),A268T在长白猪和大白猪群体中与产活仔数显著关联(P<0.05),T2950C与A268T紧密连锁但该位点突变与产仔数关联不明显,ZP4基因可以作为猪产仔数的候选标记。陈小明等[12]利用Illumina HiSeqTM2500测序平台对40个大黄鱼样本(20尾耐高温和20尾不耐高温)进行简化基因组测序,共筛选到38个与大黄鱼耐高温性状显著相关的SNPs位点,定位每个SNP位点在大黄鱼基因组中的位置发现38个SNPs附近有26个已知的功能基因,这些基因主要与细胞转录、代谢、免疫等功能相关,该定位可为大黄鱼耐高温分子机制研究及耐高温品种的选育提供标记。齐传翔等[13]从136头大白母猪和47头长白母猪耳组织中提取基因组DNA,通过PCR-测序检测CBR1基因不同拷贝形式的多态位点,分析发现长白猪中的SNPs位点与繁殖性能无相关性,但大白猪中有5个SNPs位点与产仔数呈显著性相关,CBR1基因可以作为大白猪繁殖性能选育的候选基因。胡培丽等[14]在研究SNP与小鼠(615、DBA/2 J、C3H /HeJ、C57BL /6 J、BALB /cJ5和F1(615 ×C3H)共6个品系)生化标记基因Car2、Gpi1多态性关联分析中发现,6个不同品系小鼠中Car2基因DNA、cDNA中有3个SNP可以作为Car2a/b多态相关性标记;Gpil基因cDNA水平有2个SNP可以作为Gpila/b多态性标记。

1.3.2 抗病性相关功能标记

分子遗传标记与动物抗病性育种的结合极大程度地推进了动物疾病的研究,为进一步分离鉴定抗性单基因以及转基因动物的发展奠定了基础。Tan等[15]通过对3个鲶鱼家系进行GWAS,发现了6个与鲶鱼肠道败血症抗病性相关的基因组区域分布在4个连锁群上,在其中3个基因组区域发现了显著的QTL,位于1号和26号连锁群上,此外,Tan S等人在1号连锁群上确定了10个相关基因(asb10,scnn1a,mylk,ccr7,crhr1,nlrc3,adcy2,ptprj,nlrp12和tmeff1)。柴欣等[16]在团头鲂的MHCIIα基因上筛选获得21个抗原结合位点,其中有4个位点发生变异,变异率为19.05%,经分析发现团头鲂MHCIIα基因的多态性和抗细菌性败血症呈显著性关联。王文浩等[17]在京海黄鸡4号和10号染色体上检测到与禽流感抗体滴度相关的SNPs位点,其中10号染色体上的SNPs位点在Nsun7(RNA甲基转移酶家族基因)内部,与细胞增殖分化、蛋白质合成等有关,可作为该鸡禽流感抗病性状的候选基因。Naderi等[18]将6744个荷斯坦—弗里生牛个体分成不同的数据集来研究随机森林(RF)和基因辅助BLUP法对基因组预测的准确性,用50 K SNP对样本基因组分型,通过RF对SNPs进行显著性关联分析发现GPAT3和CYP2R1可作为临床乳房炎的潜在候选基因;SpIK5和SLC26A2是爪病的潜在候选基因,FGF12是子宫内膜炎候选基因。酮症是高产奶牛中常见的代谢疾病,Kroezen等[19]对653头加拿大荷斯坦奶牛进行单SNP关联分析,发现15个SNPs可作为酮症遗传标记,6个易感基因发生突变造成该牛酮症易感性。

SNP标记辅助选择是从分子遗传层面发现性状的遗传差异或与QTL连锁的遗传标记,从核酸水平研究遗传物质,鉴定基因功能并进行相关通路机制的分析。生长性状和抗病性相关功能标记是目前动物研究中应用最广的遗传标记,可以精确定位到单个碱基的变异与表型性状的关联性分析。

1.4 亲缘关系鉴定

准确判定个体间的亲缘关系在育种实践中具有重要作用。余国春[20]用Illumina Porcine SNP60芯片对杜洛克猪、长白猪和约克夏猪三个家猪品种和一个野猪品种(藏猪)及其杂种后代长大二杂猪、杜长大三杂猪、杜藏二杂猪共24个个体进行SNP分型及全基因组扫描,用SNP标记对全部24个样本进行亲缘鉴定,得到2个三代的血缘关系和1个两代的血缘关系系谱,置信度可达99.99%。郭立平[21]筛选了50个SNPs位点对西门塔尔牛群体进行亲子鉴定,该标记组合的MAF为0.4818、预期杂合度(He)为0.4998、多态信息含量(PIC)的平均值为0.3748,当母本基因型不确定时其累计排除概率为0.9989,该结果可以纠正系谱图,提高遗传评定的准确性。Edea等[22]采用绵羊Infinium HD SNP (600 K)芯片对埃塞尔比亚五种不同表型(Arsi-Bale,Horro,Adilo,Menz和Blackhead Somali)的绵羊群体进行基因分型,最小等位基因频率分别为(0.19±0.16),(0.21±0.16),(0.20±0.16),(0.21±0.16),(0.20±0.16);观测杂合度(Ho)分比为0.30,0.30,0.30,0.33,0.31; He分别为0.29,0.31,0.30,0.31,0.30;筛选40770个SNP位点构建系统发育树,结果表明Arsi-Bale和Horro这两个群体的亲缘关系最近。对于动物而言,亲缘关系代表演化关系,通过SNP分型技术可以较直观地分析同一物种中不同品种的进化程度以及品种间的演化关系。在物种的育种实践中亲缘关系的鉴定对于系谱划分意义重大。

1.5 杂种优势预测

杂种优势指不同种群的个体间杂交所培育的后代在生长、繁殖、环境适应等方面在一定程度上优于其亲本纯繁殖群体的现象,优势效应作为杂种优势的遗传机制之一,是由同一位点的等位基因相互作用后产生,其广泛应用于动物杂交育种中。Akanno等[23]结合Illumina Bovine SNP50芯片基因分型数据,采用两种不同的方法对6794个加拿大杂交肉牛样本的生长性状和胴体性状进行杂种优势预测,这两种方法与杂种优势成线性关系,结果显示,肉牛生长性状遗传力范围为0.30~0.64,胴体性状遗传力范围为0.26~0.45(遗传力值在0.1左右时表示低遗传力,0.2~0.3表示中等遗传力,0.4以上则称为高遗传力),生长性状表现出明显的杂交优势,而胴体性状杂交优势不明显。Amuzu-Aweh等[24]利用白来航鸡全基因组SNP数据,同时结合表型数据(统计产蛋数和蛋重)预测该鸡杂交后代产蛋性状的杂种优势理论期望,杂种优势的预测在个体水平取得了突破。通过分子标记来估计群体之间的遗传距离,然后根据遗传距离预测两个群体杂交后F1代杂种优势程度,在预测结果的基础上改进育种手段后可以使农畜产品获得显著增长。

2 SNP关联分析在动物疾病模型中的应用

常见的遗传性大都由多个致病基因共同作用引起,同时受环境因素影响。对这类疾病用简单的家系研究的方法无法在家族中精确定位患病个体和正常个体,而利用生物信息学对正常个体和患病个体的相关数据进行SNP特征分类才可以确定各个基因对疾病的影响程度[25]。近年来虽然发现了许多与疾病相关联的变异基因,但基因多态性与疾病发生的关系及基因间相互作用机制尚未明确,因此,在动物模型中进行相关研究已成为当前的热点。

2.1 糖尿病模型

糖尿病属于慢性非感染性疾病,该疾病的发生与机体内分泌代谢紊乱有关,可严重影响心脑血管系统、泌尿系统以及神经系统的正常功能[26]。柳明玉等[27]以37个人类2型糖尿病易感位点为基础,采用GWAS在食蟹猴基因组相应的同源区域筛查出食蟹猴2型糖尿病遗传标记,以提高动物模型构建的成功率,最后共鉴定出13个在对照组和模型组中存在显著性差异的SNPs位点。LEW.1AR1-iddm大鼠是自发性1型糖尿病动物模型,该鼠1号染色体上存在易感位点iddm,Arndt等[28]对iddm位点进行SNP分析,发现该位点第一个区域的Dock8基因44号位发生外显子突变,导致谷氨酰胺突变成谷氨酸;第二个区域Vwa2基因11号位发生外显子突变导致该位点翻译的蛋白质由精氨酸突变为色氨酸。Dock8基因突变与人类1型糖尿病发病机制极其相似,从基因角度为1型糖尿病的临床研究提供了基础。SNP遗传标记可以直接监测到与糖尿病相关的致病基因的某些位点的变异情况,对糖尿病发病机制的进一步深入研究提供了有力的支撑。

2.2 肥胖疾病模型

目前营养过剩和肥胖已经成为全球性健康问题,5~12岁是儿童和青少年肥胖发病率最高的阶段,幼时肥胖可增加成年后患慢性疾病的风险,国际癌症机构研究报告显示:在成年人群体中肥胖可诱导食管腺癌、胃贲门癌、结肠癌、直肠癌,肝癌、胆囊癌、胰腺癌等癌症的发生[29-30]。Stachowiak等[31]报道了在不同品种的猪肥胖模型中,众多肥胖相关标记基因中只有FTO和MC4R基因与人类肥胖显著性相关。FTO基因负责编码核蛋白α-酮戊二酸依赖的双加氧酶,该基因中的一些连锁不平衡SNPs位点与人类BMI指数升高密切相关;MC4R基因编码G蛋白偶联的跨膜蛋白,负责机体食欲控制、能量稳态和体重调节。Mankowska等[32]首次在拉布拉多犬肥胖模型中对TNF、RITN和IL6基因的多态性进行研究,发现在TNF基因中有12个SNPs,RITN基因中有8个SNPs,IL6基因中有4个SNPs,TNF基因中的其中两个SNPs与人类肥胖易感性关联性极高。肥胖相关基因SNP位点关联性标记从基因本质出发,可将突变精确到点,以射线的方式对肥胖疾病进行探索研究。

2.3 其他疾病模型

Smyth line (SL)鸡是自身免疫性白癜风唯一的疾病动物模型,这种动物模型可以表现出人类自身免疫性白癜风所有的临床表现和生物学特征。Jang等[33]应用Illumina测序技术结合Red Jungle Fowl基因组序列组装对SL鸡进行重测序,在SL鸡中发现ADAMTS13、ASPM、ATP6V0A2、BRCA2、COL12A1、GRM5、LRP2、OBSCN、PLAU、RNF168、STAB2和XIRP1等156个与白癜风易感性相关的SNPs标记,这些位点主要在蛋白激酶、磷酸酶、泛素化等介导的通路机制中发挥作用,揭示了氨基酸突变与白癜风发生发展的潜在联系。原发性开角型青光眼(POAG)是造成人类失明的主要原因,眼压升高是该病发生的主要因素, Gelatt等[34]发现比格犬患POAG的概率很高,Kuchtey等[35]将比格犬作为疾病动物模型,通过全基因组SNPs分型后在比格犬20号染色体长4 Mb的单基因座上定位了疾病基因,该定位与之前报道的人类19号染色体上眼内压基因的QTL同源,在发现的与疾病关联的54个SNPs中有8个位点发生突变,最终鉴定金属蛋白酶ADAMTS10中的Gly661Arg突变体(甘氨酸突变成精氨酸)是POAG的重要候选基因。低钾血症会造成人肌无力、胃肠道平滑肌张力下降、心脏功能异常、代谢性碱中毒等,临床上最常见的是人低钾性周期性麻痹, Lantinga[36]在一只24月龄大的缅甸猫身上发现了低钾血症,是一种纯合隐性遗传病。Gandolfi等[37]使用猫Illumina 63 K ISEVITY DNA芯片在缅甸猫E1染色体上发现了低钾血症候选基因KCNH4和WNK4,并且揭示由于蛋白质翻译过程中的无义突变使WNK4中终止密码子提前出现,导致所编码蛋白质C末端缺乏卷曲螺旋结构和Akt1/SGK磷酸化位点,影响K+的调节。

在动物模型中利用SNP标记发现疾病候选基因,然后经过验证分析和功能分析,可以准确的认识疾病的发生发展规律。

3 结语

SNP筛选标记的应用将动物遗传育种推向一个新的层次和高度,其克服了传统育种的局限性,极大程度的提高了动物定向育种的效率。此外,SNP常与复杂性遗传病致病基因相关联,对临床疾病的预测、诊断以及治疗有重大意义。首先建立人类疾病动物模型,然后对群体基础上的大量DNA样本进行基因分型,应用SNP分型技术找出致病基因,在动物模型中进行基因验证,最后将结果应用于临床研究中。目前SNP分型技术有测序法、酶学检测法、杂交检测法、液相质谱法以及MALDI-TOF-MS,其中杂交检测法中基因芯片技术的应用最广泛,徐伟等[38]结合全基因组扩增技术和RCR-LDR分型技术,建立了小鼠冷冻物SNP遗传鉴定方法,可更加快速准确的鉴定SNP位点的基因型。SNP分子标记多态性高、密度大、遗传稳定性高、易于实现自动化高通量基因分型,在表型与基因型关联性研究中起重要作用。但现阶段仍存在一些不足,现有的SNP分型技术不能同时满足高程度自动化分析、反应灵敏精确、费用适度等要求,不过随着SNP分型技术的不断改进,各种疾病数据库的逐步完善,SNP在动物资源遗传育种和人类疾病动物模型中研究应用的广度和深度将不断推进。

猜你喜欢
动物模型分型基因组
“植物界大熊猫”完整基因组图谱首次发布
甘麦大枣汤对ADHD动物模型SHR大鼠DRD1、DRD2与肠道菌群分布的影响
牛参考基因组中发现被忽视基因
CT在早期预测新型冠状病毒肺炎不同临床分型的应用
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
溃疡性结肠炎动物模型研究进展
针刀治疗不同分型腰椎间盘突出症的研究进展
类风湿关节炎动物模型研究进展
复杂分型面的分型技巧