康彦东, 王兴东, 郭韶珂, 曹梦丽, 郭 宪
(中国农业科学院兰州畜牧与兽药研究所,农业农村部青藏高原畜禽遗传育种重点实验室,甘肃省牦牛繁育工程重点实验室,兰州 730050)
细胞是构成生命体的基本单位,即便来自同一个体、同一组织、同一细胞系,可能也会因为不同细胞亚群、在基因组、转录组、表观遗传组发挥不同的作用[1]。单细胞测序的基本原理是将分离得到的单个细胞进行微量RNA扩增,然后通过高通量测序得到单个细胞的表达量,鉴定细胞类型,分析细胞发育的时空历程[2]。第1个单细胞RNA测序结果于2009年,由北京大学的汤富酬教授[3]发表在NatureMethods上,首次探索了小鼠单细胞转录范围的异质性。此后,单细胞测序技术不断应用于各种科学研究中。Navin等[4]在2011年发表了第1篇关于单细胞核测序(SNS,一种单细胞测序)在乳腺癌中应用的文章。Kim等人[5]分析了来源于肺腺癌患者的异种移植物(PDX)肿瘤组织的单细胞转录组,使用跨细胞的高度异质性基因的集合,包括KRASG12D,揭示了肿瘤内SNV和表达异质性。随着单细胞测序的快速发展,单细胞测序不仅在干细胞、免疫、生殖等医学领域发挥出重要的作用,在畜牧科学领域也开始应用,并提供了有效的研究手段。
单细胞测序技术以单个细胞作为研究对象,对单个细胞的遗传物质进行扩增,标记构建文库后进行测序,最后对单个细胞基因组或转录组开展数据分析,其技术原理主要包括单细胞分离、扩增测序和数据分析3个方面[6]。单细胞测序(SCS)主要包括单细胞基因组测序(single cell DNA sequencing,scDNA-seq)、单细胞转录组测序(single cell RNA sequencing,scRNA-seq)、单细胞表观基因组测序(single cell epigenome sequencing),这三类测序可以从不同角度揭示细胞各个阶段的功能和特性[7]。
单细胞基因组测序是在单细胞分离技术基础之上,获取单个细胞全基因组DNA,并对其进行扩增和测序,从而获取单个细胞的全部基因组信息。Guo等人[8]通过scDNA-seq分析,CNA积累遵循双阶段拷贝数进化模型,即一个标点阶段,然后是一个渐进阶段,渐进期延长的肝癌患者显示出更高的肿瘤异质性和更差的无病生存率。该技术通常用于研究细胞间异质性信息和细胞群体之间的关系[9]。
单细胞转录组测序是一种在单个细胞水平上利用RNA测序对特定细胞群体进行基因表达谱定量的高通量实验技术[10]。Vu等[11]通过scRNA-seq识别乳腺癌中一个复发性细胞水平突变与PDGFRA基因中的框内缺失高度相关。
单细胞表观基因组测序是基于表观基因组学对表观遗传学改变的研究[12],利用单细胞测序技术可以构建详细的表观基因组图谱,并用来描述DNA甲基化或染色质状态[13]。Nagano等[14]通过引入单细胞Hi-C结合全基因组统计分析和单拷贝X染色体的结构建模,显示可变的细胞间染色体结构,首次描述了表观基因组测序。
单细胞测序首先是要对所研究的细胞进行分离。通常先将目标组织进行剪碎并用消化酶消化成单细胞悬液。单细胞样本的回收则需要根据实验的需要进行选择不同的回收方式,单细胞分离的方法主要有连续稀释法[15]、显微操作法[16]、荧光激活流式分选(FACS)[17]、激光捕获显微切割(LCM)[18]、微流控芯片[19]。不同的单细胞分离技术各有优缺点,可以在面对不同试验需求时提供相应的选择。
2.1.1 连续稀释法 连续稀释法分离细胞比较简单,成本较低,但是分离效率低且成功率不高,耗时长,通量低[15]。
2.1.2 显微操作法 显微操作法用于目标细胞量比较少的样本,可以直接在显微镜下观察到细胞,比较直观,回收单细胞的成功率比较高。但由于是人工操作,对操作人员的技术要求比较高,回收通量比较低[20]。
2.1.3 荧光激活流式细胞分选技术 荧光激活流式细胞分选技术(fluorescence-activated cell sorting,FACS)是基于预先用荧光标记的细胞表面特异性分子标志或细胞光散射的特性,通过流式细胞仪分选出单个细胞或某些特殊细胞群的技术。FACS具有全自动、低成本、高精度和高通量的特点,还可以根据目标细胞特异性筛选细胞。不适用于细胞量少且比较珍贵的细胞[21]。
2.1.4 激光捕获显微切割技术 激光捕获显微切割技术(laser capture microdissection,LCM)是利用激光从固定组织切片上进行显微切割并且分离出单个细胞,优点是保留了细胞原有的空间位置信息、能够快速准确地获取单一细胞或者细胞亚群,有效解决了细胞异质性的问题。LCM不用对组织进行酶解,不过组织切片制作难度较大,容易造成细胞丢失或被破坏,通量低,比较费时费力,对于设备要求较高,且由于激光温度较高,容易造成RNA等的降解[18]。
2.1.5 微流控装置 微流控装置利用微流孔道将细胞分离到微滴或微孔中,可对微量样品进行处理,具有自动化、通量高、检测速度快、成本低的特点。由于微流控芯片中的精准微阀操控,对于一些稀有样本以提高效率和质量[22]。
单细胞测序首先需要分离单个细胞,其次需要进行将mRNA逆转录成cDNA。随后,扩增的cDNA用于测序文库的制备。常用的测序平台有SMART-seq2[23]、Fluidigm C1[24]、10X Genomics[25]、BD Rhapsody[26]、MARS-seq[24]等;不同方法在工作流程、灵敏度、数据质量和成本方面的优势和局限性都不同。目前主流的scRNA-Seq平台是基于微流体设计的,其中10X Genomics开发的Chromium系统由于高通量、低成本的优势使用较为广泛[27];10X基因组学平台只能检测转录本的3’或5’端,并且需要单个样品中丰富的细胞,不适合检测含有少量细胞的稀有样本[28]。SMART-seq2在对转录本的整个长度进行描述时,仍然被认为是“黄金标准”,因为它的灵敏度、精度、低成本、可扩展性和易于在自动化平台上安装的优点[29]。单细胞标记逆转录测序(STAT-C1)就是基于Fluidigm C1的一种灵活的scRNA-seq方法,在微流体芯片上进行并引入UMI,允许在单细胞水平精确、敏感和高效的对转录本分子计数[30]。BD Rhapsody是基于微孔的技术,在重力作用下,单个细胞被随机沉淀到微孔阵列中,将带有细胞条形码和UMI的珠子饱和组合在微孔阵列,mRNAs与珠子杂交并用于逆转录、扩增和测序。BD Rhapsody对于RNA的捕获机制使得其可以容忍更少的细胞活力,更适用于不易获取的样本[26]。MARS-seq采用3’末端技术的mRNA测序方法,产生cDNA转录物(非全长),在扩增之前用条形码和唯一的分子标识符(UMI)对cDNAs进行标记,UMI能定量单个细胞内单个基因的表达水平,从而减少扩增技术中的技术偏差[27]。
单细胞测序数据分析中,由于研究目的不同,采用的数据分析流程也不同。单细胞基因组测序和单细胞表观组测序与传统的高通量测序数据分析方法类似[31]。单细胞转录组数据分析流程一般包括序列比对、质控、修正批次效应、降维、细胞分群等[32],其分析内容有基因表达、可变剪切、T细胞受体谱或B细胞受体谱、细胞聚类、拟时序分析等[33]。
种公畜在种群性能改良和生产当中发挥着巨大的作用。因为种公畜需要提供优质的精液,以保证优秀的遗传性状可以稳定地遗传,所以繁殖性能对于种公畜至关重要。利用单细胞测序技术探究公畜睾丸发育及精子发生的遗传机理和分子调控机制,对于选育高产优质种畜具有重要意义。
高源[34]利用scRNA-seq技术对性成熟前后牛睾丸细胞进行转录组测序,通过聚类分析将睾丸细胞分为12个类群。包括9种体细胞和3种生殖细胞;并鉴定出一些牛睾丸不同类群细胞的特异标记基因,如ARSE、CLEC12B、GAS1、KRT8、LOC101908015、HIGD1B、CCL21、ESX1、MEIOB、SPATA19等;这为解释牛睾丸发育和精子生产的机制提供了理论依据。雷佩佩等[35]通过对150日龄猪睾丸细胞scRNA-seq技术分析,通过降维聚类将细胞进行分类,并筛选出CDH1和CD99为未分化精原细胞的潜在分子标记,PODXL2为分化精原细胞的潜在分子标记;为深入探究猪精原细胞分化和精子发生提供了理论基础。于秀伟[36]在研究中筛选并鉴定了关中奶山羊精原细胞的特异性表达基因TKTL1和AES,并在绵羊数据中验证了TKTL1和AES的表达。利用scRNA-seq技术首次对关中奶山羊精子发生过程进行解析,从单细胞水平对主要细胞类型进行了鉴定,阐明了精子发生过程中基因表达变化情况及青春期关中奶山羊体细胞发育情况,为关中奶山羊育种研究提供了有力的理论和技术支撑。牦牛性成熟较晚,繁殖效率较低[37,49]。单细胞测序技术应用于牦牛繁殖性能的研究,主要集中在睾丸组织[38-39]。但由于细胞异质性,阻碍了在不同发育阶段对不同细胞类型的研究,使其研究更具有挑战性[40],因此利用单细胞测序技术对牦牛繁殖性能进行探究就显得十分必要。
王俊杰[41]通过单细胞转录组测序研究济宁青山羊卵泡发育过程中,卵母细胞与颗粒细胞的基因表达和调控网络,通过分析,揭示产羔数差异个体的生殖细胞发育规律。石仙[42]通过单细胞转录组研究首次获得了牦牛卵母细胞成熟过程中其颗粒细胞的基因表达谱,并且进一步证实了细胞周期蛋白CCND1和CCND2可以通过影响颗粒细胞的增殖分化而影响卵母细胞的发育,为筛选优质卵母细胞、改善体外成熟体系以及牦牛细胞发育机制研究奠定基础。
邓瑞之[43]通过单细胞转录组测序探究山羊在体内植入前胚胎基因表达模式,以及对不同发育阶段胚胎基因模式进行分类注释获得合子基因组激活关键基因,为验证山羊转座子元件在胚胎发育中的作用提供了帮助。张恒等[44]通过对猪体内早期胚胎单卵裂球进行转录组测序,并进行生物信息学分析,揭示了相比于小鼠,猪等大动物早期胚胎发育调控网络可能与小型动物存在巨大的差别。李斐然[45]对不同来源绵羊早期胚胎发育的3个阶段利用单细胞RNA体系Smart-seq V4建立了cDNA文库,构建了转录组,通过GO富集分析发现,同一发育时期的SCNT胚胎、IVF胚胎与IVO胚胎的区别在于其差异基因表现在代谢进程、发育进程以及环状大分子代谢、氮代谢等分子功能;通过KEGG分析发现3种胚胎的差异基因表达主要分布在ATP结合盒式蛋白、氧化磷酸化、cAMP通路等细胞通路上。
张悫[46]利用scRNA-seq技术,对猪皮下和肌内前体脂肪细胞的异质性进行了系统分析,筛选出一些潜在的特异性标记基因,例如猪皮下脂肪多能干细胞的THY1、SFRP4和PI15,前体脂肪细胞的VCAM1、CD36和TXNIP,脂肪形成调节细胞的F3、SERPINE1和LMCD1等,揭示了猪皮下和肌内前体脂肪细胞中的共同细胞类型。叶娜[47]在单细胞分辨率水平构建了天祝白牦牛生长期毛囊的单细胞转录图谱。基于t-SNE聚类分析,成功鉴定了生长期毛囊发育过程中涉及的表皮细胞(KRT14、KRT15),上皮分化细胞(SBSN、KRTDAP、KRT1、KRT10)、毛干细胞(LHX2、SHH)、DP细胞(LEF1、MSX1)、真皮细胞(VIM、COL3A1)、漏洞样细胞(TOP2A、UBE2C)、伴随层细胞(KRT79、APOE)以及内跟鞘细胞(KRT28、KRT71),阐述了牦牛毛囊发育过程中涉及的不同类型细胞的基因表达谱以及功能富集分析。吴天戈[48]在研究中对湖羊小花和直毛两种花纹类型的皮肤组织进行了单细胞测序与分析,通过对差异表达基因PAPPA2的深入研究,发现其能够通过调节IGFBP5促进DPCs增值,最终影响湖羊羔皮性状。
单细胞测序能够获取单个细胞完整的全基因组,克服了大样本量和细胞异质性的问题。目前,单细胞测序技术主要应用于人的肿瘤、免疫、生殖等生物医学领域,在畜牧科学中研究较少,主要集中在提高动物繁殖性能、促进胚胎发育等方面。因此在育种方面,可以利用单细胞测序技术探索畜禽生殖细胞异质性,挖掘良种繁殖潜力,探究相关分子发生机制;在品种资源开发利用方面,可以利用单细胞测序技术为相关性状的分子育种提供理论基础。随着单细胞测序技术的深入发展,在畜牧科学中的研究将会有很大的应用空间,促进畜牧产业发展。