王晰,文朝朝,魏艳,王海龙,郭睿,赵虹,张栋,弓韬,于保锋
山西医科大学基础医学院生物化学与分子生物学教研室,山西太原030000
N6-甲基腺苷(N6-methyladenosine,m6A)甲基化是mRNA最常见的内部修饰,有研究表明,m6A修饰异常参与肿瘤的发生发展[1]。YTH N6-甲基腺苷(m6A)RNA结合蛋白1[YTHN6-methyladenosine(m6A)RNA binding protein 1,YTHDF1]是一种可与转录后经m6A修饰的RNA结合,从而提高mRNA翻译效率的蛋白质[2]。有研究发现,通过抑制YTHDF1的表达可显著抑制结直肠癌细胞的体外致瘤性和小鼠异种移植瘤的体内生长[3]。另外,HAN等[4]发现,YTHDF1蛋白缺失可减缓小鼠肿瘤的生长,这种抗癌机制是通过增强T细胞对肿瘤抗原提呈和CD8+T细胞反应来实现的。有研究显示,YTHDF1蛋白缺失导致树突细胞(dendritic cell,DC)中m6A无法被识别,使溶酶体组织蛋白酶合成减少,肿瘤抗原分解减少,肿瘤抗原呈递增加,从而抑制肿瘤发生。因此,本研究对YTHDF1的理化性质、结构等方面进行分析,旨在为以YTHDF1作为靶点的肿瘤治疗提供新的思路。
1.1 YTH D F1蛋白序列获取及其理化性质分析 通过美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)的蛋白质数据库(https://www.ncbi.nlm.nih.gov)/搜索获得人YTHDF1蛋白氨基酸序列。应用ExPASy的ProtParam工具(https://web.expasy.org/protparam/)分析YTHDF1的相对分子质量、等电点、氨基酸组成、分子式及酸碱性。
1.2 YTH D F1的亲疏水性分析 应用ExPASy的Protscale工具(https://web.expasy.org/protscale/)分析YTHDF1的亲疏水性。
1.3 YTH D F1的信号肽及跨膜区域预测 应用SignalP 4.0 Serve(rhttp://www.cbs.dtu.dk/services/SignalP-4.0/)软件分析YTHDF1蛋白是否含有信号肽。应用TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/TMHMM/)软件对YTHDF1的跨膜区域进行预测。
1.4 YTH D F1组织表达特异性分析 应用NCBI的UniGene库检索YTHDF1,应用EST了解人YTHDF1在组织中的表达情况,以TPM(Transcripts Per Million)值进行评价。
1.5 YTH D F1的亚细胞定位分析 应用PSORTⅡ(https://psort.hgc.jp/form2.html)对YTHDF1的亚细胞定位进行分析。
1.6 YTH D F1的二级结构及高级结构预测 应用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)软件分析YTHDF1的二级结构。应用SWISS-MODEL(https://swissmodel.ex pasy.org/)软件分析YTHDF1的高级结构。
1.7 与YTH D F1相互作用的蛋白质预测 应用STRING数据库(https://string-db.org/),设置高置信度0.7,蛋白数量少于20个,可得到与YTHDF1相互作用的蛋白质。并通过GO分析YTHDF1的生物学过程、分子功能及Reactome通路。
1.8 YTH D F1蛋白进化树的构建 将YTHDF1蛋白氨基酸序列的FASTA格式输入至BLAST,通过BLAST比对,获得不同物种的YTHDF1蛋白氨基酸序列比对,并应用MEGA 7软件,通过Neighbor-joining统计方法及Bootstrap(自展法)检测方法构建YTHDF1蛋白系统进化树。
2.1 YTH D F1的基本理化性质 YTHDF1的基因位于20号染色体(20q13.33),含有6个外显子,在甲状腺、骨髓等25个组织中普遍表达,人YTHDF1相对分子质量为60 873 610,分子式为C2687H411-0N758O837S14,原子总数为8 406,是由559个氨基酸组成的多肽,其中丝氨酸所占的比例最高(11.8%)。YTHDF1的等电点为8.86,在序列中带负电荷的酸性氨基酸(Asp+Glu)总数为46,带正电荷的碱性氨基酸(Arg+Lys)总数为52,可见YTHDF1为碱性蛋白质。YTHDF1在体外哺乳动物网织红细胞中估计半衰期为30 h,不稳定指数为54.56,为不稳定蛋白质,脂肪族指数为55.80。
2.2 YTH D F1的亲疏水性 YTHDF1的亲水区域多于疏水区域,亲水性总平均值为-0.741,为亲水蛋白。其中,第207位的缬氨酸疏水性最强,为1.756;第554位的谷氨酰胺亲水性最强,为-3.622。见图1。
图1 YTHDF1的亲疏水性分析Fig.1 Hydrophilic-hydrophobic analysis of YTHDF1
2.3 YTH D F1的信号肽及跨膜区域预测 YTHDF1蛋白不具有信号肽序列,第14位氨基酸处C值达最高,为0.111;第57位氨基酸处Y值达最高,为0.103;第51位氨基酸处信号肽S值达最高,为0.108;1~56位氨基酸的平均信号肽值为0.093,D值为0.097。按平均S值>0.5为信号肽的标准判断,YTHDF1蛋白1~56位氨基酸平均S值为0.093,因此判断YTHDF1无信号肽序列及信号肽切割位点。见图2。YTHDF1蛋白位于膜外的概率几乎为100%,位于跨膜区和膜内的概率基本为0,预测无跨膜结构,见图3。
图2 YTHDF1蛋白的信号肽分析Fig.2 Analysis of signal peptide of TYTHDF1
图3 YTHDF1蛋白的跨膜区域分析Fig.3 Analysis of transmembrane domain of YTHDF1
2.4 YTH D F1组织表达特异性 YTHDF1在正常和肿瘤组织中均有表达。在正常组织中的TPM值分别为:胃135、淋巴135、心脏78、骨69、肺62、皮肤56、脑40、胸腺25、血管19;在肿瘤组织中的TPM值分别为:胃肠道肿瘤168、胶质瘤139、白血病137、淋巴瘤96、软骨肉瘤72、食管癌57、结直肠肿瘤35、肝癌10。其中在胃肠道肿瘤TPM值最高。
2.5 YTH D F1的亚细胞定位 YTHDF1定位于细胞核的概率最高,为60.9%,定位于细胞质的概率为17.4%,定位于线粒体的概率均为17.4%,定位于液泡膜的概率为4.3%。
2.6 YTH D F1的二级及三级结构预测 YTHDF1蛋白的二级结构含12.88%的α-螺旋、3.58%的β-转角、12.70%的延伸链、70.84%的无规卷曲,其中无规卷曲是主要结构,见图4。YTHDF1蛋白的GMQE(Global Model Quality Estimation)为0.25,QMEAN(Qualitative Model Energy Analysis)为0.18,该三维结构是365~539位氨基酸的部分蛋白质结构,大部分为α-螺旋,与二级结构预测相符。YTHDF1蛋白无规卷曲所占比例较大,具体空间结构建模较困难,因此只构建了部分蛋白结构,见图5。
图4 YTHDF1的二级结构分析Fig.4 Analysis of secondary structure of YTHDF1
2.7 与YTH D F1相互作用的蛋白质分析 与YTHDF1相互作用的蛋白质包括WTAP、METTL3、FTO、METTL14、ALKBH5,见图6。YTHDF1蛋白主要参与RNA的转录后修饰等生物学过程,促进mRNA甲基转移酶活性等分子功能,Reactome通路显示,涉及前体mRNA的加工修饰及互作蛋白基因参与细胞对DNA损伤刺激的反应和DNA损伤修复。且生物学过程也显示,互作蛋白基因参与细胞对DNA损伤刺激的反应和DNA损伤修复,推测YTHDF1可能通过此种方式促进肿瘤生长。见表1。
表1 GO分析结果Tab.1 GObiological process
图6 YTHDF1相互作用蛋白分析Fig.6 Protein-protein interaction network of YTHDF1
2.8 YTH D F1蛋白进化树的构建 人与猕猴的YTHDF1之间差异最小,而与黑猩猩YTHDF1之间差异最大。除象外,其他物种之间自展值均大于50%。通过NCBI比对人与黑猩猩、猕猴、狨猴、马、小鼠、河狸、象、刺猬的YTHDF1蛋白氨基酸序列,相似度分别为99.61%、98.39%、97.32%、94%、93.92%、92.82%、91.77%、90.52%,符合物种进化程度,证明YTHDF1蛋白在进化过程中高度保守,见图7。
图7 YTHDF1蛋白的系统进化树Fig.7 Phylogenetic tree of YTHDF1
RNA甲基化是转录产物表达的关键调节因子,最常见的RNA甲基化为m6A修饰,发生在约25%全基因组的转录过程中,且在终止密码子、5′-和3′-非编码区域及长内部外显子内富集,可调节RNA剪接、易位、稳定性和翻译过程。m6A由RNA甲基转移酶METTL3、METTL14和METTL16催化,被去甲基化酶FTO和ALKBH5降解,并与m6A结合蛋白(如YTHDF1和IGF2BP1)相互作用[5]。近年研究发现,m6A修饰在肿瘤发生发展中发挥一定作用,其中LIN等[6]发现,在肿瘤细胞转移的重要步骤上皮-间质转化(epithelial-mesenchymal transition,EMT)过程中,m6A修饰的mRNA在癌细胞中数量增加,而METTL3缺失降低了m6A的表达,影响癌细胞在体内外的迁移、侵袭和EMT。作为识别m6A的关键因子,YTHDF1促进肿瘤发生的一种机制是其能够促进树突状细胞组织蛋白酶的翻译,造成肿瘤抗原被降解,从而限制树突状细胞抗原呈递[7]。
YTHDF1蛋白与肿瘤的高度相关性及其促进肿瘤发生的机制尚未明确。本研究对YTHDF1蛋白的理化性质、结构、表达模式、细胞定位、相互作用蛋白及分子功能进行了分析,结果发现,YTHDF1蛋白是一种不稳定的碱性亲水蛋白质,无信号肽,无跨膜区;二级结构主要由无规卷曲构成;在多种肿瘤中高表达,在胃肠道肿瘤中表达最高。有研究表明,YTHDF1可在细胞质中促进蛋白翻译[2],与本研究结果一致。但通过细胞定位分析发现,YTHDF1可能部分或更多定位在细胞核中,而预测YTHDF1的跨膜区域结果显示,YTHDF1定位于膜外概率最大,推测YTHDF1能通过某种方式进入胞质与胞核。YTHDF1的功能分析发现,YTHDF1参与mRNA剪接,推断YTHDF1在细胞质中可通过促进蛋白翻译促进肿瘤发生,可能在细胞核中通过其他机制促进肿瘤发生。研究发现,YTHDF1可能参与DNA损伤修复反应,DNA修复能力降低可使肿瘤细胞对药物产生超敏反应,增加化疗药物的疗效[8]。目前化疗仍是治疗肿瘤的重要手段之一,大部分化疗药物通过阻断肿瘤细胞的DNA复制,导致DNA损伤,诱导肿瘤细胞凋亡,达到杀死肿瘤细胞的目的。而肿瘤可进化出更高效的DNA复制和DNA损伤修复系统,能够修复化疗药物造成的损害,导致耐药性的产生[9-10],推测YTHDF1可通过促进DNA损伤修复来减小化疗药物的作用。用STRING数据库找到的YTHDF1的相互作用蛋白,在BioGRID数据库中找不到,通过STRING数据库更多找到的是与YTHDF功能上的相互关联,且可能相互结合的蛋白,而BioGRID数据库中列出的是已有相关实验证实的相互作用蛋白。因此认为基于功能的预测更有意义。
本研究表明,YTHDF1蛋白参与了多种肿瘤的发生发展,但本研究并未通过过表达或敲除YTHDF1确认其对某种肿瘤发生的影响,YTHDF1是如何促进蛋白的翻译,如何调节mRNA的剪切及DNA损伤修复,均需今后进一步深入研究。