超基因:基因表达的“多面手”

2021-03-29 01:47王树森沈中阳
中国医学科学院学报 2021年2期
关键词:产物位点编码

刘 涛,王树森,3,4,杨 磊,时 乔,沈中阳,3,4

天津市第一中心医院 1中国医学科学院移植医学重点实验室 2国家卫生健康委员会危重病急救医学重点实验室3天津市器官移植临床医学研究中心 4器官移植中心 5检验科,天津 300192 6天津中医药大学研究生院,天津 301617

在生物体中,将遗传密码体现为生物的性状及各种生理活动过程,都离不开基因的表达,即基因组DNA转录生成信使RNA(messenger RNA,mRNA)等,并参与翻译生成蛋白质。在基因表达过程中,早期的观点主要集中在“中心法则”,即遗传信息按照“DNA-RNA-蛋白”的方向进行表达。然而,在庞大的基因组中,编码蛋白的序列所占的比例不足全部序列的2%[1],这一现象曾令科学家感到困惑。近年来,发现基因组的转录产物中不仅有可编码蛋白的RNA,还有很多非编码RNA,主要包括微RNA(microRNA,miRNA)、环状RNA(circular RNA,circRNA)、长链非编码RNA(long non-coding RNA,lncRNA)等。据估计,人类细胞中约有60%的序列能够被转录[2]。这些非编码RNA的功能虽已有一定的研究,但相对于编码RNA来说,非编码RNA的转录模式和功能还远未完全阐明。

非编码RNA的转录模式较为复杂。有些非编码RNA可能依靠其独立的启动子起始转录,但更多的非编码RNA转录元件与编码RNA具有一定的联系。一些非编码RNA可与邻近的编码RNA共同转录[3- 4],或转录自蛋白编码基因的启动子区域[5- 6]或增强子区域[7- 8]。另一些非编码RNA可能由编码RNA前体的可变剪接生成[9]。此外,非编码RNA的转录还存在细胞和组织特异性[10]。如果一个转录位点在特定的条件下,可转录生成一个以上的RNA产物(包括编码RNA和非编码RNA),则该基因位点被称为“超基因”。超基因共分为3种类型,分别为Ⅰ型、Ⅱ型和Ⅲ型,本文分别介绍各型超基因的转录特征,并以实例的方式阐述其在细胞中的调控作用,特别是在肿瘤细胞中的生物学活性。

Ⅰ型超基因

Ⅰ型超基因是指同一个基因位点在不同的条件下,能够生成不同起止位点的RNA转录本,且这些不同的RNA可能分别作为编码RNA或非编码RNA。这类超基因的数量较少,常见的发生条件是细胞遭受紫外线照射等应激过程。例如,活化信号合成物复合体亚单位3(activating signal cointegrator 1 complex subunit 3,ASCC3)是一个较为典型的Ⅰ型超基因,该基因在细胞遭受紫外线照射损伤后的不同阶段,能够生成不同的转录产物。具体来说,当细胞被紫外线照射后,细胞将启动损伤修复过程,同时细胞中大多数基因的转录过程被抑制,避免生成错误的转录产物。在这一过程中,ASCC3主要生成编码mRNA,其蛋白产物是维持细胞转录抑制状态的关键因子。而在DNA损伤修复的后期,ASCC3改为转录生成一段较短的非编码RNA,该RNA能够对抗ASCC3蛋白的转录抑制作用,从而使细胞内的RNA转录过程逐渐恢复正常[11]。类似地,整合因子复合体亚单位(identified integrator complex subunit,INTS)6也具有Ⅰ型超基因的调控特点。在正常情况下,INTS6转录并编码生成由887个氨基酸构成的蛋白产物。而在细胞遭受紫外线照射后,INTS6转录生成一段较短的RNA,编码仅115个氨基酸的蛋白片段。INTS6与INTS3等因子相互作用,构成单链DNA结合蛋白1复合物,参与DNA同源重组形式的损伤修复过程[12]。通过 Ⅰ 型超基因这种精巧的调节机制,ASCC3、INTS6等基因位点在DNA受到紫外线损伤的不同阶段生成具有不同长度和功能的转录产物,在DNA损伤修复过程中发挥重要的调节作用。

Ⅱ型超基因

与Ⅰ型超基因不同,Ⅱ型超基因转录生成单一的RNA产物,但通过转录后剪接和加工等过程,可生成不同序列和不同功能的两种或多种RNA。可变剪接在真核细胞的转录后加工过程中较为普遍,因此这类超基因的种类较多。根据生成RNA的种类不同,Ⅱ型超基因可分为以下几种类型。

源于编码基因内含子的小片段非编码RNA一些miRNA的转录生成过程,是随其“宿主”基因一同转录后,通过转录后的剪接过程,产生miRNA的前体,进而生成成熟的miRNA。那些随着真核细胞mRNA的加工成熟过程,由内含子生成的miRNA前体,被称为“mitron”[13]。例如,心脏特异性的miR- 208源于编码α肌球蛋白重链(α-myosin heavy chain,αMHC)基因的内含子,该基因除了编码αMHC蛋白,参与心肌收缩功能之外,还由其内含子生成miR- 208,该miRNA能够调控应激和激素反应时的心肌收缩性[14],从而使这两种转录产物实现协同作用。类似地,miR- 483- 3p源于胰岛素样生长因子2(insulin-like growth factor 2,IGF2)的内含子,其在多种肿瘤中发挥抗凋亡的活性。然而,miR- 483- 3p和其宿主基因IGF2的表达水平并无明显的一致性,该miRNA与IGF2编码产物是否存在协同作用有待进一步研究[15]。此外,一些环状RNA也来源于编码基因的内含子,这类环状RNA伴随内含子的剪接过程而生成,并能够促进相应宿主基因的表达[16]。

由编码基因位点生成的内源性小干扰RNA小干扰RNA(small interfering RNA,siRNA)是一种外源合成后导入细胞,对目的基因的表达进行抑制的短片段双链RNA,常作为基因功能研究的工具。然而,细胞也会产生内源性的siRNA(endo-siRNA,esiRNA)。Mg2+/Mn2+依赖性蛋白磷酸酶1K(protein phosphatase,Mg2+/Mn2+dependent 1K,PPM1K)基因的逆向转录产物,即假基因ψPPM1K中包含反向重复序列,能够产生发夹结构,并加工生成esiRNA,该esiRNA可靶定并抑制非有丝分裂基因A相关激酶8(never in mitosis gene A related expressed kinase 8,NEK8)的表达。在人肝癌细胞中,PPM1K蛋白及ψPPM1K生成的esiRNA表达减低,导致esiRNA对NEK8的抑制作用减弱,引起NEK8的表达升高。NEK8能够对抗ψPPM1K对细胞生长的抑制作用,这一过程是肝癌细胞增殖加速的机制之一[17]。

由长链非编码RNA加工生成的小片段非编码RNA短片段的非编码RNA除了可以在编码基因的mRNA加工成熟过程中产生,有时也能由lncRNA的转录后加工过程产生。例如,lncRNA转移相关肺腺癌转录本1(metastasis associated lung adenocarcinoma transcript 1,MALAT1)在转录后,即被RNA酶P切割成两条非编码RNA,其中位于5’端较长的RNA链为MALAT1的成熟序列,位于3’端较短的RNA链具有和转运RNA(transfer RNA,tRNA)相似的“三叶草”样二级结构,最终生成一段61 nt的非编码RNA。和MALAT1主要定位于细胞核不同,这段短链的RNA主要定位于细胞浆,因此被命名为MALAT1相关小胞浆RNA(MALAT1-associated small cytoplasmic RNA,mascRNA)。mascRNA作为tRNA的类似物,可能参与翻译过程[18],并影响单核-巨噬细胞系统,参与心血管系统的免疫调节过程[19]。

源于tRNA的小片段非编码RNAtRNA的前体或成熟体也能够在5’端或3’端进行剪切,生成与miRNA长度类似的小片段非编码RNA,这类RNA被称为tRNA来源的RNA片段(tRNA-derived RNA fragments,tRF)[20]。这些小片段RNA并非tRNA加工过程产生的“废物”,而是在细胞功能调控中发挥作用。例如,tRF- 1001即为一条来源于丝氨酸tRNA前体的tRF,由核酸内切酶elaC Z2切割tRNA前体生成。功能研究表明,tRF- 1001能够促进多种肿瘤细胞的增殖[20]。

值得注意的是,tRF分子无论是加工成熟过程还是作用机制,都和miRNA存在相似之处。有些在前期被确认为miRNA的分子,在后续研究中发现其来源于tRNA,被称为tRNA来源的小RNA(tRNA-derived small RNA,tsRNA),其本质仍为tRF。在慢性淋巴细胞白血病、肺癌、前列腺癌等肿瘤中,tsRNA发生特征性的表达谱改变,提示tRF在功能上也和miRNA类似,具有癌基因或抑癌基因的活性[21- 22]。例如,CU1276是一条从人类成熟B细胞中克隆到的tRF分子,长度为22 nt,其被证实来源于多个tRNA的3’端序列。CU1276不仅长度和miRNA相似,其加工成熟过程也和miRNA类似,需要依赖Argonaute蛋白和DICER1蛋白。CU1276的作用机制也与miRNA相似,其通过序列特异性结合于mRNA 3’非翻译区的方式,抑制复制蛋白A1的表达。在功能调控方面,CU1276抑制细胞的增殖,参与DNA复制和损伤修复过程。在生发中心淋巴瘤细胞中发现CU1276表达缺失,造成细胞增殖加速及DNA代谢动力学的紊乱[23]。作为tRF的另一个实例是miR- 3676和miR- 4521,这两条miRNA来源于苏氨酸tRNA的前体,属于3’tRF,其序列在慢性淋巴细胞白血病和肺癌中发生突变[21]。tRF在mRNA上的结合位点序列与一种RNA结合蛋白,即YBX1的结合位点序列相同。在乳腺癌细胞遭受缺氧等应激条件下,细胞内tRF被诱导而大量生成,并与YBX1竞争性结合癌基因mRNA的3’非翻译区位点,导致mRNA上的YBX1被tRF取代,其结果是癌基因mRNA加速降解。如果这类抑癌性的tRF生成减少,会导致该抑癌通路效应减低,乳腺癌细胞的转移活性增强[24]。

有些tRF也可能在非恶性肿瘤的病理情况下大量生成,如呼吸道合胞病毒感染后的人肺癌细胞系中,产生大量长度约30 nt的tRF分子,其中一条来源于tRNA-Glu-CTC的tRF能够促进呼吸道合胞病毒的复制[25]。此外,tRF也能干扰真核细胞的翻译起始因子,从而抑制蛋白的翻译[26]。

Ⅲ型超基因

一些基因位点既能直接生成不同的转录产物,其部分转录产物也能加工生成不同的RNA分子,即同时具备Ⅰ型和Ⅱ型超基因的特点,这类基因称为Ⅲ型超基因。该类型超基因的典型实例是H19基因位点,该位点的两个方向均可被转录,生成4种不同的RNA分子。其正向转录产物除lncRNA H19外,在人和小鼠细胞中,H19可作为miR- 675的前体,进一步加工生成成熟的miR- 675[27]。此外,H19基因反向转录亦可生成两条RNA,其中一条为lncRNA,作为H19的反向互补序列,该lncRNA被形象地命名为91H,即H19的反向拼写。另一条RNA可编码蛋白,被命名为H19反向肿瘤抑制基因(H19 opposite tumor suppressor,HOTS)。

H19基因位点的正向转录产物—H19/miR- 675H19基因启动子序列存在单核苷酸多态性(single-nucleotide polymorphism,SNP)位点,其中3个SNP位点与结直肠癌的风险和预后相关[28]。但这一调控机制对基因位点自身转录过程的影响还不明确。

该基因位点的转录产物lncRNA H19可在转录水平上对其他基因进行调控。H19与S腺苷蛋氨酸水解酶结合并抑制其功能,H19基因表达被抑制后,可使S腺苷蛋氨酸的水解加速,导致DNA甲基转移酶3β介导的多个基因的甲基化作用增强,从而影响细胞的功能[29]。

H19/miR- 675对细胞功能的调控更多发生在转录后水平。在不同的组织和细胞中,H19/miR- 675发挥的作用不同甚至可能相反[30- 31]。一方面,H19/miR- 675在畸胎瘤、结肠癌和肝癌等多种肿瘤细胞中具有抑癌基因的活性[32]。在前列腺癌细胞系中过表达H19可使miR- 675水平升高,导致miR- 675的直接靶基因TGFBI的表达被抑制,从而抑制前列腺癌的转移[33]。在非小细胞肺癌中,miR- 675的抑癌活性则是通过调控其靶基因GPR55实现的[34]。此外,在胚胎发育过程中,H19能够减缓细胞增殖,这一效应与伴随生成的miR- 675相关。在胚胎细胞中过表达miR- 675能够使增殖减慢,相关靶基因是胰岛素样生长因子1受体[35]。

另一方面,在乳腺癌等肿瘤中,H19/miR- 675具有癌基因活性。过表达H19/miR- 675能够促进乳腺癌细胞的增殖和转移,miR- 675靶定并调控c-Cbl和Cbl-b的表达,导致Akt和Erk通路持续活化,细胞的恶性程度增加[36]。在非小细胞肺癌中,H19诱导miR- 675表达升高,使miR- 675的靶基因p53过度抑制,导致肿瘤进程加速[37]。H19也可作为miRNA的吸附物,以竞争性内源RNA[38- 39]的方式调控其他基因的表达。例如,H19作为let- 7家族的生理性吸附物,能够调控肌组织的分化[40]。在乳腺癌细胞中,H19能够竞争性吸附miR- 200b/c和let- 7b,并促进这些miRNA的靶基因如Git2和Cyth3的表达,引起下游一系列细胞信号途径的改变,最终导致癌细胞的转移加速[41]。H19在食管癌细胞中也作为miR- 22- 3p的吸附物,抑制H19可使miR- 22- 3p的靶基因WNT1表达降低,从而抑制食管癌细胞的增殖和迁移,并增强癌细胞对放疗的敏感性[42]。

H19基因位点的反向转录产物—91H和HOTS蛋白根据目前的研究结果,作为H19的反向互补序列,lncRNA 91H在肿瘤中主要表现出癌基因的活性。例如在结肠癌细胞中,91H的表达水平上调,其通过调控靶基因HNRNPK促进癌细胞的转移,且91H在血清中的表达水平能够作为结肠癌预后的预测指标[43- 44]。在乳腺癌细胞中,91H促进细胞增殖、迁移和侵袭,其作用机制是抑制H19基因位点的甲基化,从而上调lncRNA H19的表达水平[45]。这一过程提示,该基因位点不同转录产物之间可能存在协同作用。H19基因位点的另一个反向转录产物HOTS是蛋白编码基因,值得注意的是,其编码产物具有抑癌活性,能够抑制横纹肌肉瘤、绒毛膜癌、肾母细胞瘤(Wilms瘤)等肿瘤细胞的生长[46]。

综上,H19基因位点的各转录产物在肿瘤细胞中的作用并不一致,各产物之间可能存在协同作用或拮抗作用,但其相互作用的具体机制目前还不十分清楚,有待进一步研究。

总 结

传统观点认为,原核生物的基因为多顺反子,即多数基因根据功能的相关性,成簇串联形成操纵子,受到统一的调控。与之对应,真核生物的基因为单顺反子,即一个基因通过转录仅生成一条RNA分子,并编码一条多肽链。但近年来的研究表明,真核生物的一个基因也可能通过不同的转录起止位点,或经过转录后剪切过程,生成不止一个RNA转录本,即所谓的超基因。这一观点的提出对真核生物单顺反子的理论进行了挑战,这是因为早期对非编码RNA的研究很少,主要关注编码基因,而编码基因大多数符合单顺反子的特征。近年随着非编码RNA的逐渐深入,越来越多的非编码RNA的转录特征被明确,发现很多非编码RNA是伴随编码基因的转录而生成的,甚至有些超基因位点并不包含编码基因,仅由长链非编码RNA(如lncRNA)和短链非编码RNA(如miRNA)构成。尽管如此,目前对于超基因的研究还处于初级阶段,在未来的研究中需要关注的不仅是超基因各RNA是如何转录的,而应该探索各转录本的表达如何进行协同调控,以及RNA转录本通过何种调控机制剪接生成多个RNA产物。超基因这种转录模式在细胞功能学调控方面的意义,也需要进一步阐明。随着研究的深入,超基因这种基因表达的“多面手”将更多地被阐释,隐藏在生物遗传密码当中的奥秘也将越来越多地被揭示。

猜你喜欢
产物位点编码
镍基单晶高温合金多组元置换的第一性原理研究
球形三氧化钼还原产物形貌
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
《天然产物研究与开发》青年编委会
二项式通项公式在遗传学计算中的运用*
Genome and healthcare
一种改进的多聚腺苷酸化位点提取方法