周春娥
(河南师范大学 生命科学学院,河南 新乡453007)
在人类基因组中只有不到2%的基因组序列编码蛋白质,而至少90%被转录成非编码RNA(ncRNA)。这些ncRNA 没有编码蛋白质的潜力,它们最初被认为是转录噪声,被标注为垃圾转录[1,2]。近年来,越来越多的证据表明它们在广泛的 生 物 学 过 程 中 起 着 重 要 的 作 用[3~5]。目 前,ncRNA 在许多生物学过程中和人类疾病中的基因调控作用越来越受到广泛关注。这些ncRNA 根据其在细胞中的功能大致分为2 类:管家ncRNA和调节ncRNA[6~8]。调节ncRNA 又可以进一步划分为2 个亚类:小的ncRNA,包括研究最好的microRNA 和其它小于200 个核苷酸(nt)的ncRNA,以及长于200 个核苷酸的长链非编码RNA(lncRNA)[9]。虽然lncRNA 具有5’帽子、剪切变异、poly-A 等与mRNA 类似的特征并表现出时空表达特性,但其功能还有待进一步阐明。
斑马鱼(Danio rerio)已经成为一种非常流行的研究 基因和ncRNAs 功能 的模式 生物[10~14]。最近,3 项独立的研究发现了一系列在斑马鱼早期发育 阶 段 和 成 体 组 织中 表 达 的lncRNAs[13~15]。研究表明,lncRNAs 转录本在脊椎动物胚胎发生和组织维护与修复中具有潜在作用。Kaushik 等[15]从成年斑马鱼5 种组织中预测到442 条lncRNAs,其中342 条在多种组织中都有表达,而77 条主要在其中一个组织特异性表达,其中47 条在大脑中特异性表达,12 条在心脏中特异性表达,其中包括lnc_H007 和lnc_H001,12 条是血液中特异性表达,4 条是在肌肉中特异性表达,2 条是在肝脏中特异性表达。Ulitsky 等[13]从斑马鱼的3 个不同的发育阶段中鉴定出550 条lincRNAs(long interveining noncoding RNAs),发现只有29 条在哺乳动物中存在序列保守性。Pauli 等[14]鉴定了一系列在斑马鱼胚胎发育过程中表达的1 133 条lncRNA。随后,另一项研究鉴定了813 条心脏lincRNA,其中423条是新的,564 条表达于胚胎心脏,730 条表达于成体心脏[16]。这些研究表明,lncRNAs 在胚胎发生以及组织和器官的维护中发挥着深远的作用,但大部分lncRNAs 的功能仍不清楚。
为了研究斑马鱼成体组织中特异表达lncRNA 在斑马鱼胚胎发育不同时期是否有表达并发挥一定作用,本研究选择了3 个在成鱼心脏中表达的lncRNAs 来研究其在斑马鱼胚胎发育过程中的时空表达谱,以进一步推测其在胚胎发生、组织建成与修复中的潜在功能。
本研究所用野生型斑马鱼(AB 系)购自中国斑马鱼资源中心(CZRC)。斑马鱼养殖在河南师范大学藻类研究室斑马鱼自动养殖系统中,水温严格控制在28.5 °C,光周期为10 h 暗周期14 h 的光照周期。水的pH 控制在7.0~8.0,每天2 次喂食丰年虫,对鱼的一切实验处理严格遵循《中华人民共和国动物卫生法》和《动物科学实验许可证管理办法》(批准文号:SCXK(YU)2005-0001)。
本研究中选择的3 种lncRNAs,其中lnc_H007和lnc_H001 是Kaushik 等[15]报道为心脏 特 异性表达lncRNAs,TCONS_00028652 是Wang 等[16]报道为成鱼和胚胎心脏富集lncRNA。 lnc_H001、lnc_H007 和TCONS_00028652 在斑马鱼基因组上的位点分别为:chr22:38857701-38860155、chr4(reverse strand):7407840-7407310 和chr16(reverse strand):15786804-15786237,而且均为单外显子,其外显子长分别为341、531、568 bp。其中lnc_H001 在斑马鱼lncRNA 数据库ZFLNC[17]和zflncRNApedia[18]有收录 ,ID 号分别为ZFLNCT18991 和 ZF_lnc001202。 TCONS_00028652 在lncRNA 数据库NOCODE 中有收录,ID 号为NONDRET003276。与人lncRNA 相比,斑马鱼lncRNA 研究还比较少,因此在lncRNA 数据库收录的寥寥无几。
通 过CPAT[19](http://lilab. research. bcm.edu/cpat/)和CPC[20](http://cpc2. cbi. pku. edu.cn/)2 个 在 线 软 件 以 及NCBI 上ORFfinder 对lncRNAs 的蛋白编码潜能进行预测。另外根据lncRNAs 在基因组的位点通过Ensemble 网站分析其与蛋白编码基因的关系(图1)。
收集胚胎的前1 天,在光照期结束前1~2 h 喂斑马鱼。把1 条雌斑马鱼和2 条雄斑马鱼转移到塑料孵化盒中。第2 天从塑料孵化盒中收集受精卵。将胚胎转移到胚胎孵化液中(19.3 mM NaCl,0.23 mM KCl,0.13 mM MgSO47H2O,0.2 mM Ca(NO3)2,1.67 mM Hepes[pH7.2])在28.5 °C 条件下进行孵化,胚胎发育按照Kimmel 等[21]描述的方法通过受精后小时数(hpf)来分期,并按照Westerfield 等[22]所描述 程序来收集8 个阶段的胚胎(2、6、12、24、36、48、60、72 hpf)。选取2~3 月大的成体斑马鱼,通过解剖获得8 种组织(大脑、心脏、肝脏、脾、肾、肌肉、鳃和眼),并把各时期的胚胎和不同组织储存在-80 °C 冰箱中备用。
利 用RNAiso Plus(TaKaRa Biotechnology Co.,Ltd. 中国)从每个阶段的50 个胚胎以及不同组织提取总RNA。 用Nanodrop-2000 测定总RNA 的浓度和纯度。总RNA 含量由260 nm 处的吸光度计算,RNA 纯度由A260/A280 的比值(>1.8)进行验证。
用HIFIScript cDNA 第一链合成试剂盒(Cwbiotich,中国)把1 μg 总RNA 反录成cDNA,具体操作根据产品说明书进行。3 个lncRNAs 在胚胎不同发育时期以及不同组织中的相对表达水平通过qPCR 进行检测,以β-actin 作为内参。qPCR 的反应条件如下:95 °C 预变性10 min,95 °C 变性10 s,54~60 °C 退火30 s,共40 个循环。采用熔融曲线法进行PCR 鉴定。使用2-ΔΔCt计算方法[23]进行分析。所有引物均由中国金唯智生物公司合成,引物如表1 所示。
表1 qPCR 和原位杂交所用到的LncRNAs 引物Table 1 The primers of lncRNAs in qPCR and in situ hybridization assays
为研究这3 个lncRNAs 在不同胚胎发育时期的空间表达模式,用4%多聚甲醛固定胚胎。通过PCR 从cDNA 中扩增出3 个lncRNAs 序列(Cwbiotich,China),并克隆到TA 载体(Invitrogen,USA)。lncRNA 用ApaI 或NsiI 线性化,用sp6 或T7 RNA 聚合酶体外转录制备用地高辛(DIG)标记的反义RNA 探针(DIG RNA 标记试剂盒,罗氏,德国),进行全胚原位杂交,具体操作方法如Thisse 等[24]所述。
数据分析采用单因素方差分析,采用spss13.0进行最小显著性差异测定。
根据2 个在线软件CPAT 和CPC 预测蛋白编码能力发现,它们都没有编码能力,在NCBI 的ORFFinder 也确定它们不编码蛋白质。根据它们在基因组上的位置发现,TCONS_00028652 没有与任何蛋白编码基因重合,它是非蛋白基因si:dkey-111b4.2 的产物,根据lncRNA 的起源以及与蛋白基因的关系[25]进行分类的方法,其属于基因间lncRNA(lincRNA)(图1A),其只有一个568 bp外显子,通过在外显子两侧的侧翼序列设计引物,通过PCR 克隆出1 092 bp 的片段,将得到的PCR产物送往金维智测序并将序列通过NCBI blast 进行比对,进一步证明此长链非编码RNA 确实存在。Lnc_H001 在基因组的位点与蛋白编码基因LO016987.1 的第5 个外显子和第6 个外显子之间的内含子重叠,且转录方向相同,并与蛋白编码基因LO016987.2 的第44 和45 外显子之间的内含子重叠,且转录方向相反(图1B)。根据LncRNA 的分类方法H001 属于内含子型。H007 所在的基因位点与Tnni4a-206 的第7 个外显子的非编码区重叠,第7 个外显子共长4 012 bp,有87 bp 为编码区,3 925 bp 为非编码区,并与之转录方向相反(图1C),因此根据lncRNA 的分类方法H007 为反义lncRNA 或3’UTR 型。
图1 LncRNAs 与蛋白编码基因的关系Fig.1 The correlation between lncRNAs and protein genes
为研究3 种lncRNAs 在胚胎发育过程中和不同组织中的表达模式,选择8 个不同发育阶段的胚胎和从成鱼解剖获得的8 个不同的组织进行qPCR。结果3 个lncRNAs 在不同胚胎发育阶段都有表达(图2A~图2C),它们同时在不同的组织也都有表达(图2D~图2F)。其中TCONS_00028652在大脑和肝脏中的表达高于其它组织,lnc_H001则在大脑中的表达高于其它组织,而lnc_H007 是在心脏中的表达高于其它组织。因此,尽管这些lncRNA 是从成鱼心脏中鉴定出来的,但是它们在其它组织中也有一定的表达,并且在不同的胚胎发育阶段也都有表达,可以推测这些lncRNAs 不仅在心脏建成和修复中发挥一定的作用,可能在其它组织的建成和修复过程中,以及斑马鱼胚胎发育过程也起着非常重要的作用。
为确定这些lncRNAs 在胚胎不同发育阶段中的空间表达模式,使用地高辛标记的反义RNA 探针对lncRNAs 进行了全胚原位杂交。结果表明,TCONS_00028652 在各个阶段的表达水平均高于lnc_H001 和lnc_H007(胚胎被染颜色为深蓝),与qPCR 结果一致(与内参基因的表达比较可知)。TCONS_00028652 从0 hpf 就有表达,到后期主要在大脑和尾部表达(图3)。同样,lnc_H007 和lnc_H001 则主要在大脑中表达(图4、图5)。这3种lncRNAs 都在大脑中有表达,可能在胚胎神经发育中发挥一定的作用。
图2 qPCR 检测3 个长链lncRNAs 在斑马鱼不同发育时期和不同组织中的表达Fig.2 LncRNAs expression during differential developmental stages and different tissues
图3 全胚原位杂交检测TCONS_00028652 在斑马鱼不同发育时期的表达Fig.3 TCONS_00028652 expression during differential embryonic developmental stages
图4 全胚原位杂交检测lnc_H001 在斑马鱼不同发育时期的表达Fig.4 Lnc_H001 expression during differential embryonic developmental stages
与有关lncRNA 在疾病尤其是癌症中的作用和分子调控机制的研究有大量文献报道相比,发育中的lncRNA 的作用尚缺乏相关的证据。了解lncRNA 在发育过程中的功能和调控机制有利于揭示疾病的分子机制,可为探索疾病的治疗开辟道路。最近,在斑马鱼和小鼠中发现了一些与发育 相 关 的lncRNA[26,27],表 明lncRNA 在 发 育 相 关的生物学过程中对基因调控产生了实质性的影响。其中包括一些在参与心血管发育的lncRNAs,例如tie-AS参与了血管发育过程中基因表达的转录调控[28],并通过体内外核糖核酸蛋白结合实验研究发现,tie-AS通过与RNA 结合蛋白Elavl1结合来进行调控tie1mRNA 水平[29]。心血管发育需要bvht,bvht激活心脏血管基因调控网络[30]。Fendrr在小鼠体内表现出组织特异性表达,对小鼠心脏和体腔壁的正常发育至关重要[31]。其它3 种与心血管相关的lncRNAs(TERMINATOR、ALIEN和PUNISHER)也被发现,分别在未分化多能干细胞、心血管祖细胞和分化内皮细胞中特异表达,它们参与了脊椎动物和人类心血管的发育[32]。还有一些与神经发育相关的lncRNAs 也 相继被证 实,如cyrano[33,34],durga[35]等。还有研究证明malat1对斑马鱼胚胎汞化合物污染做出应答,并有望作为斑马鱼胚胎汞化合物污染的lncRNA 标志物[36]。
图5 全胚原位杂交检测lnc_H007 在斑马鱼不同发育时期的表达Fig.5 Lnc_H007 expression during differential embryonic developmental stages
本研究首先对3 个lncRNAs 的蛋白编码潜能进行了预测,它们都没有编码能力,然后通过Ensemble 网站,根据它们所在的基因组位点分析它们与蛋白基因的关系,发现TCONS_00028652 没有与任何蛋白基因重叠,为基因间lncRNA。lnc_H001 位于蛋白编码基因LO016987.1和LO016987.2的内含子区,为内含子lncRNA。lnc_H007 则与蛋白编码基因tnni4a-206的第7 个外显子的非编码区重叠,定义为反义型lncRNA 或3’UTR。通过定量PCR 和全胚原位杂交ISH 结果均表明,这3 种lncRNAs 在斑马鱼胚胎发育过程中按照一定的时空模式表达,推测它们可能参与胚胎的发育,通过不同组织qPCR 结果证明它们不仅在心脏中有表达,在其它组织也或多或少的有表达。Kaushik 等[15]报 道lnc_H001 是在成体心脏中特异性表达,但本研究在胚胎早期中的不同结果表明,在大脑中表达最高,提示lnc_H001 在胚胎期神经发育中过程发挥一定的作用,而在成体斑马鱼中则主要在心脏建成与修复中发挥功能。lnc_H007 的表达结果与Kaushik 的结果一致,TCONS_00028652 则在大脑和肝脏中的表达要高于在心脏及其它组织,而Wang 等[16]报道其为心脏富集lncRNA,原因可能是Wang 所用的材料为胚胎心脏,成鱼心脏和成鱼的肌肉,并没有选择大脑和肝脏作为材料。这样的结果正如Kaushik 的推测,在胚胎发育过程中表达的lncRNAs 在成鱼组织中也存在差异表达,反之亦然,一些预测组织限制性表达的lncRNAs 在胚胎发生过程中各发育器官也略有表达。例如,WISH 数据还显示,预测的大脑限制性表达的lncRNAs,如lncBrHM_035 和lncBrM_002 在斑马鱼24 hpf 胚胎的眼睛、中脑和后脑中均表现出明显的定位。这些证据表明,大多数lncRNA 可能在不同的生物学过程中发挥多种功能,大多数lncRNAs 更倾向于在多个组织中表达,而不是局限在一个组织中表达,暗示同一个lncRNA 可能在多个生物学过程中起调节基因表达的作用,但其分子功能和机制有待进一步研究。
本研究表明,这3 种在成鱼心脏中发现的lncRNAs 在多个胚胎发育阶段以及包括成体大脑、心脏在内的多个器官中均有表达。这一结果可以推测它们可能在斑马鱼胚胎发育过程中、心脏及其它器官的建成及修复中发挥重要作用,但是它们的分子功能和机制还需进一步的研究。