基于GEO数据库的胎儿发育异常时羊水游离RNA中组织特异性差异表达基因分析

2021-03-05 08:16任建宇司艳梅杨树法
国际检验医学杂志 2021年4期
关键词:差异基因羊水游离

任建宇,司艳梅,刘 欣,杨树法△

1.首都医科大学附属北京妇产医院产前诊断中心,北京 100026;2.首都医科大学基础医学院医学遗传学与发育生物学系,北京 100069

出生缺陷是胎儿出生前发生的身体结构、功能或代谢异常,严重影响患儿和患儿家庭的生活质量,产前诊断是预防出生缺陷的主要手段。染色体微阵列分析技术、全基因组测序及全外显子测序等分子生物学技术在产前诊断中的应用,极大地提高了致病性变异检出率,同时也检出大量可疑致病性、不确定性、可疑良性的基因组结构性变异[1-3]。如何获取更多胎儿发育信息,结合B超等影像学检查,综合判断胎儿发育情况,对胎儿做出合理的诊治,成为产前诊断中亟待解决的问题。羊水是产前诊断的主要标本,羊水上清液通常作为医疗废物处理。研究发现羊水上清液中包含各种游离RNA,并且羊水游离RNA比羊水脱落细胞中RNA有代表性,更能反映胎儿全身的发育状态[4-5]。胎儿发育异常能够影响羊水游离RNA中的基因表达,羊水游离RNA基因变化与器官组织发育异常密切相关[6]。本研究通过对比分析发育异常胎儿和正常胎儿羊水游离RNA的芯片检测结果,获取差异表达基因,进而分析这些差异表达基因的组织表达特点,以期发现能够反映胎儿发育异常的组织特异性基因。

1 资料与方法

1.1一般资料 以唐氏综合征(DS)及爱德华综合征(ES)胎儿作为系统发育异常的研究对象。从GEO数据库中下载GSE16176[7]和GSE25634[8]芯片检测数据。GSE16176中包括7例正常胎儿和7例DS胎儿;GSE25634包括6例正常胎儿和5例ES胎儿。所用的芯片为Affymetrix Human Genome U133 Plus 2.0 Array。

1.2方法

1.2.1组织特异性基因的筛选 正常组织的基因表达量数据来源于Human Protein Atlas数据库[9],下载基因表达数据表(https://www.proteinatlas.org/download/rna_tissue_consensus.tsv.zip)到本地。编写R脚本统计该数据表所涵盖的组织类型及所包括的基因种类,生成不同器官来源的组织列表。按照组织特异性基因的定义筛选神经相关组织的特异性基因。组织特异性基因定义:基因在某个组织中的表达量,高于该基因在所有组织中表达量均值的8倍以上,则该基因为这个组织的特异性表达基因。

1.2.2差异表达基因的筛选 对芯片结果进行背景校正、归一化,获取基因表达量数据。利用limma程序包对异常胎儿和正常胎儿的芯片检测结果进行差异表达分析,获取胎儿发育异常时发生变化的差异表达基因。以表达量变化倍数的log2转化值(logFC)>0.5和P<0.05作为阈值筛选差异表达基因。

1.2.3组织特异性差异表达基因的表达特性分析 取组织特异性基因集及差异性基因集得交集,获取组织特异性差异表达基因。统计组织特异性差异表达基因在正常胎儿羊水游离RNA中的变异系数(CV)值和均值,同时计算芯片检测基因在正常胎儿羊水游离RNA中的CV值和均值。

1.3统计学处理 数据的分析和处理借助R语言完成。使用olgio程序包读取芯片原始结果,并对结果进行背景校正、归一化。差异基因的筛选使用limma程序包,通过t检验完成,根据设定阈值筛选差异有统计学意义的差异表达基因。CV值为基因在正常胎儿表达量的标准差除以均值乘以100%得到。

2 结 果

2.1组织特异性基因的筛选 在组织表达量数据表中记录了62种组织的19 651个基因的表达量。62种组织涵盖了神经系统、免疫和血液系统、生殖系统、腺体、泌尿系统及消化道等人体的几乎所有组织,见表1。以基因表达量高于所有组织中表达量均值的8倍以上作为组织特异性基因的筛选标准,共筛选到7 548个基因。

表1 各系统中包含的组织

2.2DS和ES差异表达的组织特异性基因 将DS与正常胎儿的羊水游离RNA中基因表达量进行比较,共发现717个差异表达基因,差异表达基因的火山图见图1A。将ES与正常胎儿进行比较,共发现1 038个差异基因,差异基因的火山图见图1B。将DS差异基因、ES差异基因及组织特异性基因进行比较发现,71个基因为DS与ES共同差异基因,9个基因既是DS与ES共同差异基因又是组织特异性基因,见图1C。

注:A、B分别表示DS胎儿(A)、ES胎儿(B)与正常胎儿羊水游离RNA中差异表达基因的火山图,纵轴代表limma程序包基因差异分析P值经-log10转化得到的值,灰色点代表logFC>0.5和P<0.05的差异表达基因;C为DS差异基因、ES差异基因及组织特异性基因比较的维恩图,Specific gene代表组织特应性基因集合,DS代表DS胎儿与正常胎儿差异表达基因集,ES代表ES胎儿与正常胎儿差异表达基因集。

2.3组织特异性差异表达基因 将正常胎儿的标本,进行背景校正和归一化,不同芯片的检测值的中位数以及上下四分位数值基本一致,所有芯片的结果具有可比性。统计分析13例正常胎儿标本的芯片检测结果,所有检测基因的相对表达量均值为3.11,CV为19.90%。9个组织特异性差异表达基因(DOK7、ARHGEF39、FAM111B、CCHCR1、R3HDML、WNK3、FIBCD1、SMIM10L2B及SMIM10L2A)中,5个基因(CCHCR1、FAM111B、FIBCD1、ARHGEF39及SMIM10L2B)的表达量高于芯片所有检测基因的平均表达量并低于所有检测基因的CV,3个基因(DOK7、WNK3及R3HDML)的表达量低于芯片所有检测基因的平均表达量并低于所有检测基因的CV,见图2。在组织表达数据库中,9个组织特异性差异表达基因特异对应的特异表达组织包括大脑皮质、海马、睾丸、小肠、十二指肠、肾上腺、心肌、骨骼肌、甲状腺、睾丸及附睾等。基因在这些组织的表达量,高于基因在所有组织中表达量均值的8倍以上。

注:垂直虚线为基因游离RNA水平在正常胎儿羊水标本中的平均值;横向虚线为所有检测变异系数。

3 讨 论

羊水游离RNA的变化受到胎儿状态的影响,孕期内胎儿是一个变化的过程;这种变化包括正常的胎儿发育和异常发育[5-6,10-11]。区分是胎儿正常生长还是病理性发育导致的羊水游离RNA中基因的变化,是其临床应用的根本。孕中期是行羊水穿刺检测的主要阶段,也是能够获取羊水上清液的主要阶段。分析这一阶段羊水游离RNA中基因变化特点,将是利用羊水游离RNA进行产前诊断的基础。利用每个基因在孕中期的CV可以对该基因在孕中期的表达稳定性进行有效的区分。通过对筛选到的9个组织特异性差异表达基因的CV分析发现,8个基因的CV均低于基因整体的CV的中位数,结果表明,这些基因在孕中期具有较好的稳定性,较少受到了胎儿正常发育的影响。

羊水游离RNA来源于胎儿细胞的凋亡或死亡,凋亡细胞释放的RNA可以通过胎儿血液经由肾脏排泄入羊水。皮肤也是RNA进入羊水的重要途径,研究表明,在孕20周前胎儿皮肤尚未角质化,胎儿和羊水间可以通过皮肤进行物质双向交换[12]。作为能够反映胎儿发育状态的基因,其在羊水游离RNA中应具备一定的表达量,许多研究通过制订筛选阈值来筛选羊水游离RNA中“表达的”基因[13],另外,还有利用芯片进行自身判定的方法[14]。本研究将筛选到的组织特异性差异表达基因与芯片所有基因的均值进行比较,结果表明,5个基因的表达量在平均表达量之上。通过对基因在孕中期CV和平均表达量进行分析,CCHCR1、FAM111B、FIBCD1、ARHGEF39及SMIM10L2B的游离RNA在羊水中具有可靠的水平,同时在孕中期表达稳定,具备作为特异性组织差异基因的条件。

筛选到的组织性特异性差异表达基因涉及大脑、睾丸、甲状腺、心肌、骨骼肌及消化道等多个器官组织,这些组织在ES和DS患儿中存在不同程度的发育异常[15]。CCHCR1在睾丸高表达,定位于细胞质、细胞核、线粒体或中心体等,可以调节细胞的各种功能,是精子生成和雄性配子发育过程中的重要分子[16-17],结果表明,CCHCR1在DS和ES患儿中的表达水平变化与患儿生殖功能障碍密切相关。DOK7的突变与先天性肌无力综合征密切相关[18];肌张力异常是ES和DS患儿共同症状,这也解释了DOK7游离RNA在羊水中的异常表达。表明研究中筛选到的组织特异性差异表达基因的功能与DS和ES的临床症状存在较好的相关性。

基因的特异表达类型与目前研究不一致的情况,例如,FIBCD1在Human Protein Atlas数据库中是海马组织特异性基因,而目前关于神经系统中FIBCD1的研究较少,现有文献表明FIBCD1可以位于胃肠道上皮细胞,参与皮肤及胃肠黏膜的固有免疫,与肝癌的预后密切相关[19-20]。ARHGEF39在Human Protein Atlas数据库中是甲状腺的组织特异性基因,但目前对该基因的研究集中在肺癌与肝癌领域[21-22]。出现这种现象的可能原因与胚胎发育中的基因表达与成年人存在差异有关,也可能与基因研究历史短有关。由于发育中的人类胚胎组织难以获取,缺少胎儿发育过程中的组织表达数据集,研究中多采用成人的组织表达数据集替代[23]。

本研究利用基因在组织中的表达量对变异基因进行解释,发现了与组织异常发育密切相关的组织特异性基因,为利用羊水游离RNA判定胎儿发育异常提供了思路。

猜你喜欢
差异基因羊水游离
游离股前外侧穿支皮瓣修复足踝部软组织缺损
莫须有、蜿蜒、夜游离
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
46 例羊水过少的临床分析
妊娠晚期羊水过少临床分析
游离血红蛋白室内质控物的制备及应用
可怕的羊水栓塞你了解多少
SSH技术在丝状真菌功能基因筛选中的应用
游离于翻译的精确与模糊之间——兼评第八届CASIO杯翻译竞赛获奖译文