汤静思,杨明耀,李英
四川农业大学,畜禽遗传资源发掘与创新利用四川省重点实验室,成都 611130
1977年,Jacq等[1]在非洲爪蟾(Xenopus laevis D.)基因组中发现了一段不转录的核苷酸序列,并且这段序列与编码5S rRNA的功能基因高度相似,因此被定义为假基因(Pseudogene)。目前普遍认为具有以下两种特征的核苷酸序列称为假基因:一是与功能基因的核苷酸序列具有高度相似性;二是不具有转录功能或者转录但不能翻译成蛋白质,这主要归因于核苷酸序列中终止密码子的提前出现(Premature stop codon)或者存在移码突变(Frame shift)[2]。因此假基因被认为是没有功能的核苷酸序列,而且不受选择压力束缚[3]。然而,在过去的20年里,人们发现假基因广泛分布于各个物种的基因组中,尤其在哺乳动物中最多[4]。同时,一些假基因被证明具有重要的功能[5~9]。这说明假基因不仅仅是基因组进化的遗骸,还可能具有重要的功能。由于假基因与功能基因的密切关系以及假基因在基因组进化过程中的重要性,假基因的研究也就越来越多。本文从假基因的分类、假基因的识别、假基因的功能和假基因与癌症疾病的关系等方面综述了假基因研究的最新进展。
根据假基因的形成机理,可划分为3种类型的假基因,即复制型假基因(Duplicated pseudogene)、单一型假基因(Unitary pseudogene)和加工型假基因(Processed pseudogene)。复制型假基因是基因组DNA串联复制或者染色体不均等交换过程中基因编码区或调控区发生突变,导致复制后的基因失去正常功能而成为假基因[10];单一型假基因是原本具有功能的单一拷贝基因在编码区或调控区发生自发突变(Spontaneous mutations),导致该基因无法转录和翻译而成为假基因[11];复制型假基因和单一型假基因又被称为未加工型假基因(Unprocessed pseudogene),因为它们都是直接由DNA序列演化而来,具有内含子-外显子的结构和调控元件。加工型假基因是由mRNA转录本逆转录成cDNA后随机整合到基因组,由于插入位点不合适或者序列发生突变而失去正常功能而形成的假基因[12,13]。这种类型的假基因通常包含mRNA的特征是:(1)没有内含子和5'端调控序列;(2)具有3'端聚腺苷酸化信号序列;(3)侧翼区一般存在正向重复序列。加工型假基因在基因组的位置是随机的,而复制型假基因是在亲本功能基因(Parent gene)附近[14]。
在基因组中区分假基因与功能基因具有重要的意义,因此,假基因的识别是假基因相关研究的基础。由于假基因与功能基因具有高度的序列相似性,并且假基因积累的突变属于中性或者近中性突变。因此,1981年 Li等[15]提出通过计算核苷酸非同义替换与同义替换的比率(Dn/Ds)来识别假基因。理论上,由于假基因不编码蛋白质,不受正选择 (Positive selection)或者纯化选择(Purifying selection)束缚,那么处于近中性选择压力下的假基因的非同义替换与同义替换的比率应该等于或接近1[16,17]。通过这种方法已经在多个物种中识别出假基因,其中在人类基因组中发现8000多个加工型假基因[18]。然而,2003年Balakirev等[19]在果蝇中发现假基因Est-6(Esterase 6)的非同义替换与同义替换比率小于1,即相比非同义替换,同义替换发生更频繁,说明该基因可能具有功能。2002年 Betran等[20]发现假基因 PGAM3(Phosphoglycerate mutase processed gene)不支持中性选择模型,而是受正向选择压力限制,说明该假基因可能正在进化成新的功能基因,所以会受正选择作用。另外针对假基因的特征及与同源功能基因的关系可用于识别假基因。对于复制型假基因和加工型假基因而言,由于基因组中存在亲本功能基因,所以可在基因组中利用亲本功能基因序列比对搜索,继而通过这两类假基因的特征来区分:复制型假基因有内含子和调控元件;加工型假基因无内含子,有多聚腺苷酸化信号序列等特征。根据单一型假基因的定义,可知该类型假基因在基因组中只有一个拷贝,所以可利用其他物种的基因组作为参考基因组进行比对识别[11]。
针对全基因组内大规模的识别假基因,可采用生物信息学的方法解决。鉴定假基因的主要生物信息方法有3种:PseudoPipe,RetroFinder和Pseudo-Finder。PseudoPipe是一种基于基因组数据利用同源性搜索鉴定假基因的方法,可区分假基因类型[21]。PseudoFinder是一种利用同源匹配(Homologous mapping) 鉴定假基因的方法,而RetroFinder是一种专注于加工假基因的注释的方法[22];以上两种方法都需要物种的基因组和转录组信息,适用于模式生物。对于非模式生物,Molineris等[23]提出Retrotransposed Gene EXPlorer(REGEXP)方法,该方法主要利用加工型假基因无内含子的特点鉴定加工型假基因,仅依赖物种的DNA序列信息。以人类基因组为例,Jennifer等[24]采用不同的方法鉴定出的假基因数量均不同:利用PseudoPipe方法鉴定出18046个假基因;利用RetroFinder方法鉴定出13644个假基因;利用HAVANA(Human and Vertebrate Analysis and Annotation)小组的方法鉴定出11224个假基因。Pei等[25]结合以上方法在人类基因组中鉴定出11216个假基因以及 138个单一型假基因;同时,通过实验发现一些如核糖体蛋白(Ribosomal protein L21,RPL21)有 143个假基因,甘油醛-3-磷酸盐脱氢酶(Glyceraldehyde-3-phosphate dehydrogenase,GAPDH)有68个假基因。这与之前的研究一致,说明管家基因(House-keeping genes)有更多的假基因[26]。
在20世纪80~90年代,虽然假基因与亲本功能基因具有高度相似性,但由于物种基因组信息匮乏,假基因被认为缺乏生物学功能和不受选择压力束缚,因此常被理解为基因组里的遗迹,仅作为中性进化的经典材料,研究基因的演化过程和物种基因组的进化方向[4]。随着二代测序技术的广泛应用和人类基因组计划的完结,使得对于假基因的研究越来越多。近年来的研究发现,一些假基因在调控生物体生长发育和癌症疾病方面具有重要的功能。本文将假基因分为转录的假基因、不转录的假基因及编码蛋白质的假基因来阐述其重要功能。
自假基因被发现后,其功能研究也逐渐成为研究的热点。目前已报道的大多数有功能的假基因均是通过其转录本行使功能,如假基因的转录本作为反义RNA(Antisense RNA)抑制亲本功能基因的表达;假基因转录本竞争性地结合miRNA(MircoRNA);假基因的转录本产生内源性小干扰 RNA(Endogenous small interfering RNA,endo-siRNA)等。转录的假基因可通过以上途径达到调控其他功能基因的作用。
1992年 Zhou等[5]发现在人类基因组中的加工型假基因TOPI(Topoisomerase I)能产生反义RNA,并且该反义RNA可与亲本功能基因TOPI的转录本互补配对。尽管这项研究并未说明假基因产生的反义RNA具有功能,但在随后的研究中证明了假基因转录的反义RNA在细胞水平上扮演的重要角色。如Korneev等[6]在蜗牛里发现假基因 NOS(Nitric oxide synthase)的转录本同样也是反义 RNA,并证明了假基因NOS的转录本能与亲本功能基因的转录本形成RNA双链,从而抑制了功能基因NOS在蜗牛神经细胞中的表达。2013年,Korneev等[27]通过实验进一步证明了假基因NOS转录的反义RNA在蜗牛记忆形成的关键时期抑制了一氧化氮(NO)合成,该研究说明假基因转录的反义RNA在细胞中的重要作用。
编码磷酸张力同源物蛋白质的基因 PTEN(Phosphatase and tensin homolog)是一个抑癌基因,通过抑制 PI3K/AKT信号通路达到抑制肿瘤生长的功能。2010年,Poliseno等[8]发现假基因 PTENP1(Phosphatase and tensin homolog pseudogene)是一个能转录的加工型假基因,并与 PTEN具有高度的同源性。其中,在PTEN与PTENP1的3′UTR (Untranslated region)上有一段具有高相似度的 DNA片段,并发现在该DNA片段上享有共同的miRNA结合位点。同时,证明了PTENP1的3′UTR可竞争性结合miRNA,并阻挡了miRNA结合亲本功能基因PTEN的3′UTR,从而确保了PTEN的正常表达。2013年,Per Johnsson等[9]发现假基因PTENP1既能转录正义RNA(Sense RNA),又可转录反义 RNA。其中,PTENP1转录的反义RNA又分为3个亚型,即未剪切的α、剪切的α和剪切的β亚型。未剪切的α亚型反义转录本与正义转录本的 3′端均没有被多聚腺苷酸化(Polyadenylated,PolyA),且发现未剪切的α亚型反义转录本出现在细胞核内。而剪切的α亚型转录本和β亚型转录本的3′端都被多聚腺苷酸化,且在细胞质中检测到高水平的表达。随后的实验证明了剪切的α亚型反义转录本和未剪切的α亚型反义转录本能与 PTEN的启动子结合,以反式调控的方式抑制PTEN的转录;虽然PTENP1的正义转录本缺少多聚腺苷酸尾,但是可通过剪切的 β亚型反义转录本与正义转录本结合,以顺式调控的方式保证正义转录本顺利地由细胞核运输到细胞质中,使得正义转录本能与miRNA结合从而确保PTEN正常表达。随后 Zina等[28]发现另一个抑癌候选基因TUSC2(Tumor suppressor candidate-2)的假基因TUSC2P(Tumor suppressor candidate-2 pseudogene)也是通过 3′UTR竞争性地结合 miRNA 来保护TUSC2正常表达。另外,Chiefari等[29]发现假基因HMGA1-p(High mobility group A1 pseudogene)的转录本可降解功能基因 HMGA1(High mobility group A1)的转录本,其主要机制是假基因的转录本和亲本功能基因的转录本在3′UTR上共享一个重要的转录后调控元件,随后的实验证明了这个假基因的转录本可竞争性地结合反式作用因子 αCP1(Cytoplasmic protein)[30]。
假基因的转录本还可形成内源性小干扰 RNA来调控基因的表达。如 Tam等[7]在小鼠卵母细胞中发现假基因可产生内源性小干扰 RNA,通过 RNA干扰(RNA interference,RNAi)的机制来调控亲本功能基因的表达。同时,假基因产生的内源性小干扰RNA是通过以下两种方式:一是由假基因的反义转录本与亲本功能基因的正义转录本杂合形成双链RNA,或者由假基因的反义转录本与假基因的正义转录本杂合形成双链 RNA,随后双链RNA经加工形成小干扰RNA;二是直接由具有反向重复序列的假基因转录本加工形成[31]。2013年,Chan等[32]发现转录的假基因 ψPPM1K(Protein phosphatase,Mg2+/Mn2+dependent,1K pseudogene)通过上述第二种方式形成了小干扰RNA,并且在转染了这种小干扰 RNA的细胞中功能基因 NEK8(NIMA-related kinase 8)和 PPM1K(Protein phosphatase,Mg2+/Mn2+dependent,1K)的表达量下降。其中,相对于正常细胞,NEK8在肿瘤细胞中的表达量增加,而由假基因ψPPM1K产生的小干扰RNA抑制了NEK8的表达,说明这些小干扰 RNA具有抑制肿瘤的活性和调控人类细胞生长的功能。
关于假基因的功能研究主要对象是能转录的假基因,然而对于不转录的假基因的功能却鲜为人知或者被默认为没有功能。2011年,Michael等[33]在分析硬骨鱼类的基因组时,首次发现3段DNA序列ttc29、dock9和ccdc46是新产生(Do novo generation)的、具有活性的增强子。硬骨鱼类的祖先在 3.5亿年前发生了一次全基因组复制(Whole genome duplication,WGD),而75%的复制基因积累突变而失去了编码功能成为假基因。其中,一些假基因在选择压力的驱使下进化成具有功能的基因或调控元件,如ttc29、dock9和ccdc46。在硬骨鱼类基因组中,dock9和ccdc46各有一个旁系同源基因,ttc29没有旁系同源基因。同时,这 3个假基因与它们的旁系同源基因和直系同源基因都具有高度的相似性,而且在哺乳动物和硬骨鱼类中的同源基因都是具有能编码蛋白质的功能基因。ttc29、dock9和ccdc46的核苷酸序列在哺乳动物中非常保守。尽管它们的同源基因都具有编码蛋白质的功能,但却没有增强子的调节功能。研究证明,这 3个假基因是有活性的增强子,它们能调控邻近基因的表达,说明不转录的假基因可能也具有重要的调控功能。
最早定义的假基因是不具有编码蛋白质的功能,可是近年的研究却指出一些假基因也可编码短链肽或者截短的蛋白质,即相比亲本功能基因编码的蛋白质要短一些。在灵长目中非常保守的加工型假基因PGAM3(Phosphoglycerate mutase family 3)是首次被发现的具有编码能力的假基因。1977年,Dierick等[34]发现假基因 PGAM3是通过亲本功能基因PGAM1的 mRNA反转录整合到基因组中形成,并且假基因 PGAM3有完整的开放阅读框,同时还在开放阅读框上游发现了具有启动子特征的区域,但是通过 RT-PCR和限制性内切酶酶切实验没有发现假基因PGAM3在任何组织里转录。2002年,Betran等[20]以人的cDNA文库作为模板进行PCR扩增和限制性内切酶酶切实验,发现假基因 PGAM3不仅能转录,而且证明了在正向选择压力的驱使下还进化出具有编码蛋白质的能力。1991年,Fishman等[35]发现了另外一个加工型假基因Cx43(Connexin 43)具有完整的开放阅读框。2004年,Kandouz等[36]在癌细胞中发现假基因Cx43的转录本,并证明了假基因Cx43是编码一个43 kDa的蛋白质;同时,证明该蛋白质具有与亲本功能基因 Cx43编码的蛋白质一样的功能,即抑制细胞生长。2014年,Porter等[37]发现假基因 NLRP2P(NLR family,pyrin domain containing 2 pseudogene)是高等灵长目特有的加工型假基因,具有与功能基因 POP2(Pyrin-only protein 2)相似的功能。假基因NLRP2P具有完整的开放阅读框,并且编码45个氨基酸。其中,这些氨基酸构成了类似脓素结构域(Pyrin-domain)的蛋白质。同时,假基因 NLRP2P的编码区与功能基因 POP2相似度达 80%以上。通过选择压力分析,在旧大陆猴中该基因的编码区受纯化选择压力限制。研究证明,在人类单细胞中假基因NLRP2P转录本受脂多糖上调,并且该假基因具有调控细胞因子生成、细胞周期和细胞死亡的功能[37]。
这些例子说明了假基因并不是无功能的 DNA,有些假基因在选择压力的作用下不断进化,为了生物体更好的生存而具有各种各样的功能。因此,假基因是生物体的基因贮备库,是原基因(Protogene)[38]。
随着新一代高通量测序技术的成熟,Kalyana-Sundaram等[26]通过分析 RNA-Seq数据检测假基因的转录和评估假基因在肿瘤细胞中的表达量。他们发现在肿瘤转录组中有大量假基因表达,其中包含了已注释的1500个假基因和400个新的假基因。他们鉴定了218个具有癌症特异性的假基因,其中178个假基因在多种肿瘤细胞类型中均有表达,如功能基因PTMA(Prothymosin alpha)产生的5个加工型假基因,这些假基因在30多种癌细胞中均有表达,但却不在正常细胞中表达。另外,40个假基因只在一种肿瘤细胞类型中高度特异表达。他们发现假基因的表达不仅具有癌症特异性,还具有组织特异性。在前列腺癌细胞中,识别了多个特异性表达的假基因,如加工型假基因CXADR-Ψ(Coxsackie virus and adenovirus receptor pseudogene),该假基因在大约25%的前列腺癌细胞中表达上调,而在正常的前列腺细胞和非前列腺细胞中基本不表达。另外,他们发现假基因 ATP8A2P1(ATPase, aminophospholipid transporter, class I, type 8A, member 2 pseudogene)在大约 25%的乳腺癌细胞中大量表达,并且指出该假基因具有调控细胞生长和致癌的功能。
2014年,Han等[39]分析了 2808个癌症患者样品的假基因表达谱,其中包含了 7种类型的癌症。他们发现在这些癌细胞样本中共有 9925个假基因表达。其中,547个假基因在乳腺侵润性癌细胞中表达,138个假基因在肺鳞状细胞癌中表达。同时,他们指出在多种癌细胞类型中假基因的表达与癌细胞分子亚型具有高度的一致性,且大部分假基因的表达与对应的亲本功能基因无关。随后他们发现在102个可表达的假基因中,64个假基因可能通过竞争性结合miRNA来调控功能基因表达,4个假基因可能作为反义RNA抑制功能基因的表达。
目前,越来越多的证据(表1)表明,假基因在人类癌症等疾病方面扮演着重要的角色。首先,假基因通过编码具有功能的蛋白质行驶功能,如八聚体结合转录因子4(Octamer-binding transcription factor 4,Oct4)的假基因 Oct4-pg1。2007年,Lin等[40]发现假基因Oct4-pg1可抑制间充质干细胞的生长与分化,并且该假基因能促进细胞的增殖。同时,有研究指出,在人类胶质瘤、乳腺癌等细胞中没有发现功能基因 Oct4的表达,却观察到其假基因的表达,并且这些假基因可以转录并翻译成蛋白质,但该蛋白质缺乏相应的生物学功能[41~43]。2010年,Kastler等[44,45]在前列腺癌细胞中发现假基因 Oct4-pg1是Oct4家族成员中有且仅有的一个能表达的成员,并且该假基因可编码一个含有 359个氨基酸的蛋白质,可能具有类似亲本功能基因的功能,即维持癌细胞的无限增殖和自我更新的能力。
假基因可通过竞争性地结合 miRNA调控功能基因的表达,从而抑制或者促进肿瘤的发生。如假基因TUSC2P1通过竞争性地结合miRNA的方式保护抑癌基因TUSC2的表达,从而抑制乳腺癌细胞的增殖[28]。2013年,Wang等[46]在肝癌细胞中发现假基因Oct4-pg4可竞争性地结合miR-145,从而确保了亲本功能基因的表达,并促进了肝癌细胞的生长和致瘤性。假基因KRASP1(Kirsten rat sarcoma viral oncogene homolog pseudogene)通过竞争性地结合miRNA保护致癌基因KRAS(Kirsten rat sarcoma viral oncogene homolog)的表达,从而促进前列腺癌细胞的增殖[8]。另外,假基因不仅通过竞争性地结合miRNA保护功能基因的表达,还可产生反义 RNA抑制功能基因的转录,从而调控肿瘤细胞的生长、增殖、迁移和凋亡,如假基因PTENP1[8,20]。假基因Xist(X inactive-specific transcript)可产生反义RNA,通过与其正义转录本结合而抑制了正义转录本的功能,使X染色体异常,该现象不仅出现在乳腺癌细胞和前列腺癌细胞,还发生在其他癌症细胞中[47]。
表1 已报道的假基因在相关癌症等疾病中的作用机制
假基因还可产生小干扰RNA来抑制功能基因的表达而调控肿瘤的发生。如假基因ψPPM1K 产生小干扰 RNA抑制功能基因 NEK8及其亲本功能基因PPM1K的表达,从而抑制肝癌细胞的生长[32]。假基因还可通过一些其他的方式调控肿瘤的发生。如假基因MYLKP1(Myosin light chain kinase pseudogene)在癌细胞中特异表达,并在转录后水平降低了功能基因MYLK(Myosin light chain kinase)的表达,促进癌细胞的增殖[48]。另外,假基因也参与一些疾病的发生过程,如在二型糖尿病中,假基因 HMGA1-P可与其亲本功能基因 HMGA1竞争性地结合反式作用因子,从而抑制功能基因的转录,以致 HMGA1无法正常行使其调节胰岛素受体的功能[30]。
在很长的一段时间,进化的基础理论认为所有试图保留下来的随机遗传变化都是具有某种优势,而随后提出的中性学说则认为通过进化产生的 DNA片段对生物体不造成任何优势或劣势[49]。没有功能的假基因则被人们认为是研究中性选择的经典材料,然而随着研究的深入,越来越多的研究发现一些假基因并不适合中性选择模型,而且这些假基因还具有某些生物功能,尤其表现在癌症疾病方面。如今,假基因的研究不仅是进化生物学的热点,也成为了生物医学和临床医学的新起点。
[1]Jacq C, Miller JR, Brownlee GG.A pseudogene structure in 5S DNA of Xenopus laevis.Cell, 1977, 12(1): 109–120.
[2]Proudfoot N.Pseudogenes.Nature, 1980, 286(5776):840–841.
[3]Petrov DA, Hartl DL.Pseudogene evolution and natural selection for a compact genome.J Hered, 2000, 91(3):221–227.
[4]Podlaha O, Zhang JZ.Pseudogenes and their evolution.Chichester: John Wiley & Sons, 2001.
[5]Zhou BS, Beidler DR, Cheng YC.Identification of antisense RNA transcripts from a human DNA topoisomeraseⅠ pseudogene 1.Cancer Res, 1992, 52(15):4280–4285.
[6]Korneev SA, Park JH, O'shea M.Neuronal expression of neural nitric oxide synthase (nNOS) protein is suppressed by an antisense RNA transcribed from an NOS pseudogene.J Neurosci, 1999, 19(18): 7711–7720.
[7]Tam OH, Aravin AA, Stein P, Girard A, Murchison EP,Cheloufi S, Hodges E, Anger M, Sachidanandam R,Schultz RM, Hannon GJ.Pseudogene-derived small interfering RNAs regulate gene expression in mouse oocytes.Nature, 2008, 453(7194): 534–538.
[8]Poliseno L, Salmena L, Zhang JW, Carver B, Haveman WJ, Pandolfi PP.A coding-independent function of gene and pseudogene mRNAs regulates tumour biology.Nature,2010, 465(7301): 1033–1038.
[9]Johnsson P, Ackley A, Vidarsdottir L, Lui WO, Corcoran M,Grandér D, Morris KV.A pseudogene long-noncoding-RNA network regulates PTEN transcription and translation in human cells.Nat Struct Mol Biol, 2013, 20(4): 440–446.
[10]Mighell AJ, Smith NR, Robinson PA, Markham AF.Vertebrate pseudogenes.FEBS Lett, 2000, 468(2–3):109–114.
[11]Zhang ZD, Frankish A, Hunt T, Harrow J, Gerstein M.Identification and analysis of unitary pseudogenes:historic and contemporary gene losses in humans and other primates.Genome Biol, 2010, 11(3): R26.
[12]Maestre J, Tchenio T, Dhellin O, Heidmann T.mRNA retroposition in human cells: processed pseudogene formation.EMBO J, 1995, 14(24): 6333–6338.
[13]D'errico I, Gadaleta G, Saccone C.Pseudogenes in metazoa: origin and features.Brief Funct Genom Proteom,2004, 3(2): 157–167.
[14]Vanin EF.Processed pseudogenes: Characteristics and evolution.Annu Rev Genet, 1985, 19(1): 253–272.
[15]Li WH, Gojobori T, Nei M.Pseudogenes as a paradigm of neutral evolution.Nature, 1981, 292(5820): 237–239.
[16]Wang W, Zhang JM, Alvarez C, Llopart A, Long MY.The origin of the Jingwei gene and the complex modular structure of its parental gene, Yellow emperor, in Drosophila melanogaster.Mol Biol Evol, 2000, 17(9):1294–1301.
[17]Torrents D, Suyama M, Zdobnov E, Bork P.A genome-wide survey of human pseudogenes.Genome Res,2003, 13(12): 2559–2567.
[18]Li W, Yang W, Wang XJ.Pseudogenes: pseudo or real functional elements? J Genet Genomics, 2013, 40(4):171–177.
[19]Balakirev ES, Ayala FJ.PSEUDOGENES: Are they “Junk”or functional DNA? Annu Rev Genet, 2003, 37(1):123–151.
[20]Betrán E, Wang W, Jin L, Long MY.Evolution of the Phosphoglycerate mutase processed gene in human and chimpanzee revealing the origin of a new primate gene.Mol Biol Evol, 2002, 19(5): 654–663.
[21]Zheng DY, Gerstein MB.A computational approach for identifying pseudogenes in the ENCODE regions.Genome Biol, 2006, 7(Suppl.1): S13.
[22]Zheng DY, Frankish A, Baertsch R, Kapranov P, Reymond A, Choo SW, Lu Y, Denoeud F, Antonarakis SE, Snyder M,Ruan YJ, Wei CL, Gingeras TR, Guigó R, Harrow J,Gerstein MB. Pseudogenes in the ENCODE regions: consensus annotation, analysis of transcription,and evolution.Genome Res, 2007, 17(6): 839–851.
[23]Molineris I, Sales G, Bianchi F, Di Cunto F, Caselle M.A new approach for the identification of processed pseudogenes.J Comput Biol, 2010, 17(5): 755–765.
[24]Harrow J, Frankish A, Gonzalez JM, Tapanari E, Diekhans M, Kokocinski F, Aken BL, Barrell D, Zadissa A, Searle S,Barnes I, Bignell A, Boychenko V, Hunt T, Kay M,Mukherjee G, Rajan J, Despacio-Reyes G, Saunders G,Steward C, Harte R, Lin M, Howald C, Tanzer A, Derrien T, Chrast J, Walters N, Balasubramanian S, Pei BK, Tress M, Rodriguez JM, Ezkurdia I, Van Baren J, Brent M,Haussler D, Kellis M, Valencia A, Reymond A, Gerstein M, Guigó R, Hubbard TJ.GENCODE: the reference human genome annotation for The ENCODE Project.Genome Res, 2012, 22(9): 1760–1774.
[25]Pei BK, Sisu C, Frankish A, Howald C, Habegger L, Mu XJ, Harte R, Balasubramanian S, Tanzer A, Diekhans M,Reymond A, Hubbard TJ, Harrow J, Gerstein MB.The GENCODE pseudogene resource.Genome Biol, 2012,13(9): R51.
[26]Kalyana-Sundaram S, Kumar-Sinha C, Shankar S,Robinson DR, Wu YM, Cao XH, Asangani IA, Kothari V,Prensner JR, Lonigro RJ, Iyer MK, Barrette T,Shanmugam A, Dhanasekaran SM, Palanisamy N,Chinnaiyan AM. Expressed pseudogenes in the transcriptional landscape of human cancers.Cell, 2012,149(7): 1622–1634.
[27]Korneev SA, Kemenes I, Bettini NL, Kemenes G, Staras K,Benjamin PR, O'shea M.Axonal trafficking of an antisense RNA transcribed from a pseudogene is regulated by classical conditioning.Sci Rep, 2013, 3:1027.
[28]Rutnam ZJ, Du WW, Yang WN, Yang XL, Yang BB.The pseudogene TUSC2P promotes TUSC2 function by binding multiple microRNAs.Nat Commun, 2014, 5: 2914.
[29]Borrmann L, Wilkening S, Bullerdiek J.The expression of HMGA genes is regulated by their 3 ' UTR.Oncogene,2001, 20(33): 4537–4541.
[30]Chiefari E, Iiritano S, Paonessa F, Le Pera I, Arcidiacono B, Filocamo M, Foti D, Liebhaber SA, Brunetti A.Pseudogene-mediated posttranscriptional silencing of HMGA1 can result in insulin resistance and type 2 diabetes.Nat Commun, 2010, 1: 40.
[31]Watanabe T, Totoki Y, Toyoda A, Kaneda M,Kuramochi-Miyagawa S, Obata Y, Chiba H, Kohara Y,Kono T, Nakano T, Surani MA, Sakaki Y, Sasaki H.Endogenous siRNAs from naturally formed dsRNAs regulate transcripts in mouse oocytes.Nature, 2008,453(7194): 539–543.
[32]Chan WL, Yuo CY, Yang WK, Hung SY, Chang YS, Chiu CC, Yeh KT, Huang HD, Chang JG.Transcribed pseudogene ψPPM1K generates endogenous siRNA to suppress oncogenic cell growth in hepatocellular carcinoma.Nucleic Acids Res, 2013, 41(6): 3734–3747.
[33]Eichenlaub MP, Ettwiller L.De novo genesis of enhancers in vertebrates.PLoS Biol, 2011, 9(11): e1001188.
[34]Dierick HA, Mercer JFB, Glover TW.A phosphoglycerate mutase brain isoform (PGAM1) pseudogene is localized within the human Menkes disease gene (ATP7A).Gene,1997, 198(1–2): 37–41.
[35]Fishman GI, Eddy RL, Shows TB, Rosenthal L, Leinwand LA.The human connexin gene family of gap junction proteins: distinct chromosomal locations but similar structures.Genomics, 1991, 10(1): 250–256.
[36]Kandouz M, Bier A, Carystinos GD, Alaoui-Jamali MA,Batist G.Connexin43 pseudogene is expressed in tumor cells and inhibits growth.Oncogene, 2004, 23(27):4763–4770.
[37]Porter KA, Duffy EB, Nyland P, Atianand MK, Sharifi H,Harton JA. The CLRX. 1/NOD24 (NLRP2P)pseudogene codes a functional negative regulator of NF-κB,pyrin-only protein 4.Genes Immun, 2014, 15(6): 392–403.
[38]Zheng DY, Gerstein MB.The ambiguous boundary between genes and pseudogenes: the dead rise up, or do they? Trends Genet, 2007, 23(5): 219–224.
[39]Han L, Yuan Y, Zheng SY, Yang Y, Li J, Edgerton ME,Diao LX, Xu YX, Verhaak RGW, Liang H.The Pan-Cancer analysis of pseudogene expression reveals biologically and clinically relevant tumour subtypes.Nat Commun, 2014, 5: 3963.
[40]Lin H, Shabbir A, Molnar M, Lee T.Stem cell regulatory function mediated by expression of a novel mouse Oct4 pseudogene.Biochem Biophys Res Commun, 2007, 355(1):111–116.
[41]Zhao SD, Yuan QH, Hao HB, Guo YJ, Liu SM, Zhang YM,Wang JL, Liu HJ, Wang FW, Liu K, Ling EA, Hao AJ.Expression of OCT4 pseudogenes in human tumours:lessons from glioma and breast carcinoma.J Pathol, 2011,223(5): 672–682.
[42]Redshaw Z, Strain AJ.Human haematopoietic stem cells express Oct4 pseudogenes and lack the ability to initiate Oct4 promoter-driven gene expression.J Negat Results Biomed, 2010, 9(1): 2.
[43]Guo XP, Tang YM.OCT4 pseudogenes present in human leukemia cells.Clin Exp Med, 2012, 12(4): 207–216.
[44]Kastler S, Honold L, Luedeke M, Kuefer R, Möller P,Hoegel J, Vogel W, Maier C, Assum G.POU5F1P1, a putative cancer susceptibility gene, is overexpressed in prostatic carcinoma.Prostate, 2010, 70(6): 666–674.
[45]Poliseno L.Pseudogenes: Newly discovered players in human cancer.Sci Signal, 2012, 5(242): re5.
[46]Wang L, Guo ZY, Zhang R, Xin B, Chen R, Zhao J, Wang T, Wen WH, Jia LT, Yao LB, Yang AG.Pseudogene OCT4-pg4 functions as a natural micro RNA sponge to regulate OCT4 expression by competing for miR-145 in hepatocellular carcinoma.Carcinogenesis, 2013, 34(8):1773–1781.
[47]Prensner JR, Chinnaiyan AM.The emergence of lncRNAs in cancer biology.Cancer Discov, 2011, 1(5): 391–407.
[48]Han YJ, Ma SF, Yourek G, Park YD, Garcia JGN.A transcribed pseudogene of MYLK promotes cell proliferation.FASEB J, 2011, 25(7): 2305–2312.
[49]Gherman A, Chen PE, Teslovich TM, Stankiewicz P,Withers M, Kashuk CS, Chakravarti A, Lupski JR, Cutler DJ, Katsanis N.Population bottlenecks as a potential major shaping force of human genome architecture.PLoS Genet, 2007, 3(7): e119.
[50]Samaan S, Lichner Z, Ding Q, Saleh C, Samuel J,Streutker C, Yousef GM.Kallikreins are involved in an miRNA network that contributes to prostate cancer progression.Biol Chem, 2014, 395(9): 991–1001.
[51]Poliseno L, Haimovic A, Christos PJ, Vega YSDMEC,Shapiro R, Pavlick A, Berman RS, Darvishian F, Osman I.Deletion of PTENP1 pseudogene in human melanoma.J Invest Dermatol, 2011, 131(12): 2497–2500.
[52]Liu L, Liu Y, Liu JB, Zhai XJ, Wen J, Xie KP, Shen HB, Hu ZB, Fan ZN.Genetic variants in pseudogene E2F3P1 confer risk for HBV-related hepatocellular carcinoma in a Chinese population.J Biomedical Res, 2013, 27(3): 215–219.
[53]Pan Y, Sun CQ, Huang MD, Liu Y, Qi FZ, Liu L, Wen J,Liu JB, Xie KP, Ma HX, Hu ZB, Shen HB.A genetic variant in pseudogene E2F3P1 contributes to prognosis of hepatocellular carcinoma.J Biomedical Res, 2014, 28(3):194–200.
[54]Zhang JY, Wang X, Li MX, Han J, Chen B, Wang B, Dai JW.NANOGP8 is a retrogene expressed in cancers.FEBS J, 2006, 273(8): 1723–1730.
[55]Jeter CR, Badeaux M, Choy G, Chandra D, Patrawala L,Liu C, Calhoun-Davis T, Zaehres H, Daley GQ, Tang DG.Functional evidence that the self-renewal gene NANOG regulates human tumor development.Stem Cells, 2009,27(5): 993–1005.
[56]Bier A, Oviedo-Landaverde I, Zhao J, Mamane Y,Kandouz M, Batist G.Connexin43 pseudogene in breast cancer cells offers a novel therapeutic target.Mol Cancer Therapeutics, 2009, 8(4): 786–793.
[57]Liu Y, Wang ZQ, Li HM, Wu ZP, Wei F, Wang HP.Role of the ERas gene in gastric cancer cells.Oncol Rep, 2013,30(1): 50–56.
[58]Piehler AP, Hellum M, Wenzel JJ, Kaminski E, Haug KB,Kierulf P, Kaminski WE.The human ABC transporter pseudogene family: Evidence for transcription and gene-pseudogene interference.BMC Genomics, 2008, 9:165.
[59]Zou M, Baitei EY, Alzahrani AS, Al-Mohanna F, Farid NR,Meyer B, Shi Y.Oncogenic activation of MAP kinase by BRAF pseudogene in thyroid tumors.Neoplasia, 2009,11(1): 57–65.
[60]Weakley SM, Wang H, Yao QZ, Chen CY.Expression and function of a large non-coding RNA gene XIST in human cancer.World J Surg, 2011, 35(8): 1751–1756.
[61]Duret L, Chureau C, Samain S, Weissenbach J, Avner P.The Xist RNA gene evolved in eutherians by pseudogenization of a protein-coding gene.Science, 2006,312(5780): 1653–1655.