甲状腺乳头状癌预后不良相关基因的生物信息学分析

2020-08-31 01:35高建张国烈林元美章国亮陈一钧
右江医学 2020年7期
关键词:生物信息学

高建 张国烈 林元美 章国亮 陈一钧

【摘要】 目的 通过甲状腺乳头状癌(papillary thyroid carcinoma,PTC)生物信息学分析,获取与PTC预后显著相关的基因,为PTC的发病机制提供理论依据。方法 从NCBI的GEO Databases数据库检索PTC的芯片数据GSE3678、GSE33630和GSE82208,三组基因芯片共包含94例PTC及77例癌旁组织基因表达谱。使用GEO2R工具分析PTC与癌旁组织差异表达的基因;将共表达的基因导入可视化数据库(the database for annotation,visualization and integrated discovery,DAVID)进行基因富集分析(gene ontology,GO)和信號通路分析(kyoto encyclopedia of genes and genomes,KEGG);使用STRING和Cytoscape进行蛋白质互作网络分析(protein-protein interaction,PPI);使用GEPIA分析核心基因的生存信息。随后培养PTC细胞株,收集52例临床组织样本,分别验证FN1在PTC组织样本和细胞中的表达情况。结果 GSE3678、GSE33630和GSE82208共有152个共表达基因,其中24个上调表达,128个下调表达。这152个异常表达基因(different expression genes,DEGs)在PTC细胞组分、分子功能、生物学行为上主要集中于影响细胞正常分化及富集于甲状腺激素合成信号通路等。PPI显示,基因AGTR1、AVPR1A、EGR2、FGFR2、FN1、FOSB、GNA14、JUN、EDN、IRS1、SPP1相互之间紧密相关。进一步的生存分析显示,AGTR1、AVPR1A、EGR2、FGFR2、FN1、FOSB、GNA14、JUN与无病生存时间相关,但总体生存时间无差异。FN1在31例(59.61%)PTC组织中呈上调表达,平均表达倍数变化为(3.75±5.90)倍。与Nthy-ori 3-1细胞相比,BCPAP和TPC-1中FN1的表达水平分别提高了(475±1.12)倍、(11.89±3.53)倍(P<0.01)。结论 AGTR1、AVPR1A、EGR2、FGFR2、FN1、FOSB、GNA14、JUN在PTC中异常表达且预示着较差的临床预后;FN1基因在PTC组织和细胞株中表达增高。

【关键词】 甲状腺乳头状癌;生物信息学;异常表达基因;FN1;临床预后

中图分类号:R736.1   文献标志码:A   DOI:10.3969/j.issn.1003-1383.2020.07.003

【Abstract】 Objective To obtain genes significantly associated with papillary thyroid carcinoma(PTC) by bioinformatics analysis of PTC,so as to provide theoretical basis for the pathogenesis of PTC.Methods The data of PTC chip (GSE3678,GSE33630 and GSE82208) were retrieved from the GEO databases of NCBI.The gene expression profiles of 94 PTCs and 77 paracancerous tissues were included in the three gene chips.GEO2R tool was used to analyze genes differentially expressed in PTC and adjacent tissues.The co-expressed genes were introduced into the visual database (the database for annotation,visualization and integrated discovery,DAVID) for gene enrichment analysis (gene ontology,GO) and signal pathway analysis(kyoto encyclopedia of genes and genomes,KEGG).The network analysis of protein-protein interaction(PPI) was performed by STRING and Cytoscape.GEPIA was used to analyze survival information of core genes.PTC cell lines were cultured and 52 clinical tissue samples were collected,and the expressions of FN1 in PTC tissue samples and cells were verified,respectively.Results There were 152 co-expressed genes in GSE3678,GSE33630 and GSE82208,of which 24 were up-regulated and 128 were down-regulated.In PTC cell components, molecular functions and biological behavior,these 152 abnormal expression genes(DEGs) mainly focused on affecting the normal differentiation of PTC cells and enriching in the signal pathway of thyroid hormone synthesis.PPI showed that AGTR1,AVPR1A,EGR2,FGFR2,FN1,FOSB,GNA14,JUN,EDN,IRS1 and SPP1 were closely related to each other.Further survival analysis showed that AGTR1,AVPR1A,EGR2,FGFR2,FN1,FOSB,GNA14 and JUN were related to disease-free survival time,but there was no difference in overall survival time.FN1 was up-regulated in PTC tissues of 31 cases (59.61%),and the average expression multiple was (3.75±5.90) times.Compared with Nthy-ori 3-1 cells,the expression levels of FN1 in BCPA and TPC-1 increased by(4.75±1.12) times and (11.89±3.53) times,respectively(P<0.01).Conclusion AGTR1,AVPR1A,EGR2,FGFR2,FN1,FOSB,GNA14 and JUN are abnormally expressed in PTC and predicted poor clinical prognosis.And FN1 gene expression is increased in PTC tissues and cell lines.

【Key words】 PTC;bioinformatic;differentially expressed gene;FN1;clinical prognosis

甲状腺乳头状癌(papillary thyroid carcinoma,PTC)的患病率在全国范围内每年以20%的速度增长,已成为第四位高发肿瘤[1~2]。大多数PTC分化类型良好,10年生存率超过90%,但由于不断增加的确诊案例,即使总体死亡率没有变化,复发的案例逐年增多[3~5]。促甲状腺激素(thyroid stimulating hormone,TSH)抑制治疗、131I放射治疗是PTC患者术后预防复发的重要手段。但即使经过规范化治疗,仍有部分患者出现不明原因复发。PTC术后复发机制的不明确,影响着甲状腺外科医师对患者的术后个体化管理。生物信息学(bioinformatic)是一门交叉学科,它包含基础生物学、信息科学及临床医学,有助于我们揭示肿瘤发生发展的病理机制等[6]。本研究的目的在于借助生物信息学的大数据,准确筛选出与PTC相关的基因表达情况,分析异常表达基因与PTC患者的临床预后的相关性,为PTC的分子机制研究及临床医师术后个体化管理提供理论依据。

1 材料与方法1.1 基因芯片数据素材的检索 基因表达谱芯片数据源于NCBI的GEO数据库,检索条件为“papillary thyroid carcinoma”或“papillary thyroid cancer”,将GSE3678、GSE33630和GSE 82208三组基因芯片表达谱芯片数据纳入研究,三组基因芯片表達谱均基于GPL570平台,共包含94例PTC和77例癌旁组织。

1.2 基因芯片表达数据的分析 基因芯片表达谱数据使用GEO Databases的在线工具GEO2R (https://www.ncbi.nlm.nih.gov/geo/geo2r)进行R语言处理,下载后的基因芯片表达谱数据的筛选标准为:与癌旁组织相比,差异表达倍数|logFC|>2,P<0.05。随后使用Bioinformatics & Evolutionary Genomics 工具对筛选出的DEGs进行韦恩(Venn)分析,筛选出共表达基因。

1.3 GO、KEGG富集及PPI网络分析 将上述共表达基因导入DAVID生物信息数据库进行生物信息注释、GO分析等,涵盖生物学的细胞组分(BP)、分子功能(CC)、生物过程(MF)。KEGG(kyoto encyclopedia of genes and genomes)分析用于处理异常表达基因在生物信号通路方面的富集情况及程度(FDR<0.05)。PPI分析使用STRING工具,分析各蛋白质靶点之间的联系。随后使用Cytoscape的MCODE插件进行PPI网络可视化,分析蛋白质之间的潜在关联,并筛选出与PTC发展相关的关键基因。

1.4 与PTC相关关键基因的临床预后分析 GEPIA数据库整合了TCGA和GTEx,可满足单基因或多基因与癌症之间关联的分析。我们使用GEPIA分析上述关键基因与THCA临床预后之间的关系(P<0.05)。

1.5 FN1基因在PTC组织及细胞株中表达的验证 选取2018年9月至2019年8月在莆田学院附属医院就诊,病理诊断为PTC的组织样本作为实验材料,共52例PTC及配对癌旁组织在手术后被立刻收集并浸泡于RNA later中,储存于-80℃冰箱备用。BCPAP和TPC-1两株甲状腺癌细胞株以及Nthy-ori 3-1正常甲状腺细胞购自中国科学院上海细胞生物研究所,置于含10%胎牛血清的RPMI-1640培养中,在37℃,5% CO2的环境中培养。

1.6 总RNA的提取及qRT-PCR实验 提取甲状腺乳头状癌和配对组织以及甲状腺癌细胞株的总RNA,随后qRT-PCR反转录。内参基因参考国内外文献,选择18S作为内参序列为:上游5-GTAACCCGTTGAACCCCATT-3,下游5-CCATCCAATCGGTAGTAGCG-3;FN1上游5-AGGCAAATCGCAAGAGGCAAGG-3,下游为:5-CACATCAGGCACAGCACTCCAG-3。FN1基因表达量的计算使用ΔCt表示,ΔCt =CtFN1-Ct18sRNA。

1.7 统计学方法 实验数据的统计由SPSS 19.0和Graph Prism 5.0进行,FN1在甲状腺癌组织和细胞株中的表达的比较用独立样本T-test,其表达量采用均数±标准差的形式表示,检验水准:α=0.05。

2 结  果2.1 PTC相关DEGs的筛选与认证 经筛选,GSE3678、GSE33630和GSE82208基因芯片符合入组。GEO2R分析显示,共94例PTC和77例癌旁组织纳入研究,分别筛选出1141个、2100个和860个DEGs。Venn分析显示,三组基因芯片中152个基因为共表达基因,其中24个为上调表达,128个为下调表达基因。见表1及图1、图2。

2.2 GO、KEGG分析显示DEGs与甲状腺细胞的基础代谢相关 上述152个共表达基因的GO分析显示,生物进程(BP)方面:DEGs富集于细胞代谢、上皮细胞迁移的正向调节、轴突延伸的正调控、转化生长因子-β受体信号通路及SMAD蛋白信号转导等;细胞组分(CC)分析显示,DEGs集中在基底外侧质膜和鸟苷酸交换因子复合物等;分子生物功能(MF)显示,DEGs有氧化还原酶活性,主要作用于供硫基团,与信号素受体结合等;KEGG分析表明,DEGs是甲状腺激素合成途径中的优势基因,甲状腺激素合成途径是甲状腺激素、甲状腺球蛋白和甲状腺过氧化物酶的核心调节。见表2,图3。

2.3 PPI蛋白质互作网络分析 PPI蛋白网络分析了152个DEGs,其中86个下调表达和11个上调表达基因在PPI蛋白网络中相关,共有145个蛋白作用节点,156种作用联系。Cytoscape中的MCODE插件分析显示,其中11个基因存在密切关联,分别是:AGTR1、AVPR1A、EGR2、FGFR2、FN1、FOSB、GNA14、JUN、EDN3、IRS1、SPP1,FN1是其中的核心基因。见图4。

2.4 与PTC紧密相关基因的临床预后分析 用GEPIA对上述11个基因的临床预后进行预测,发现这些基因的总体生存率(overall survival,OS)差异无统计学意义(P>0.05),但其中8个基因的无病生存率(disease-free survival,DFS)明显缩短,分别为AGTR1(HR=0.36,P<0.001),AVPR1A(HR=0.47,P=0.013),EGR2(HR=0.38,P=0.002),FGFR2(HR=0.52,P=0.029),FN1(HR=2.0,P=0.024),FOSB(HR=0.51,P=0.023),GNA14(HR=0.45,P=0.011),JUN(HR=0.43,P=0.006)。见图5。

2.5 FN1在PTC组织和细胞株中表达增高 共有52例临床样本纳入研究,FN1在31例(59.61%)PTC组织中呈上调表达,平均表达倍数变化为(3.75±5.90)倍。见图6A、图6C。与Nthy-ori 3-1细胞相比,BCPAP和TPC-1中FN1的表达水平分别提高了(4.75±1.12)倍、(11.89±3.53)倍(均P<0.01)。见图6B。表明FN1在PTC组织和细胞中的表达增加,可能与PTC病情进展相关。

3 讨  论  PTC虽然是最常见的恶性肿瘤之一,却并非是研究得最彻底或最完整的,其发病机制仍然无法完整阐述[7~8]。生物信息技术是一门先进的交叉学科,能将微观视界,比如基因表达差异、蛋白之间的作用等宏观化,有利于我们了解PTC的发病机制[9~10]。因此,從生物信息方面对PTC做进一步研究,不仅有助于我们了解发病机制,还能帮助我们临床决策。

本研究中,通过基因数据库检索了GSE3678、GSE33630和GSE82208三个基因表达谱芯片,筛选出24个上调表达以及128个下调表达的基因。对152个DEGs的基因富集分析、功能分析发现,这些差异表达的基因对细胞代谢、上皮细胞迁移的正向调节、轴突延伸的正调控、转化生长因子-β受体信号通路、SMAD蛋白信号转导有关,而这些影响都能促进癌细胞的增殖或迁移。而对DEGs的传导信号通路的分析发现,这些异常表达的基因主要富集在甲状腺激素合成的信号通路,该信号通路主要调节甲状腺激素、甲状腺球蛋白、甲状腺过氧化物酶等的分泌,与调节甲状腺乳头状癌细胞的增殖、转移有显著相关。肿瘤细胞产生作用的一个关键因素是影响蛋白质的表达,异常表达的基因通常影响蛋白质的结构和功能,从而影响细胞的代谢。因此我们对DEGs做了进一步的PPI分析,结果显示这些基因所表达的蛋白之间作用复杂,共有145个蛋白作用节点,156种作用联系。MCODE分析PPI蛋白网络中相互作用的强关联区域,这对蛋白网络中分子复合体预测很重要。通过MCODE我们发现AGTR1、AVPR1A、EGR2、FGFR2、FN1、FOSB、GNA14、JUN、EDN3、IRS1和SPP1存在强关联,生存预测发现,其中AGTR1、AVPR1A、EGR2、FGFR2、FN1、FOSB、GNA14、JUN与DFS显著相关,OS方面未受影响。根据蛋白质网络分析,我们初步确定FN1为上调表达的核心基因,随后我们进一步在PTC组织样本和细胞株中分析FN1的表达,发现FN1在PTC组织样本和细胞株中都高表达。

查阅相关文献发现,血管紧张素Ⅱ受体1(angiotensin-2 type 1 receptor,AGTR1)在肝癌细胞内低表达,过表达AGTR1能促进肝癌细胞的增殖、转移,抑制AGTR1的表达,能抑制肝癌细胞的增殖、迁移[11~12]。精氨酸血管加压素受体1α(arginine vasopressin receptor 1α,AVPR1A)也是一种下调表达的基因,AVPR1A有助于激活参与前列腺癌中去势抵抗性产生的信号通路,从而影响其预后,而去势抵抗性前列腺癌(castration-resistant prostate cancer,CRPC)是一种致命性的晚期前列腺癌形式[13]。早期生长反应因子2(the early growth responsive-2,EGR2)在肝细胞癌中低表达,是一种反式作用蛋白,参与肿瘤抑制基因PTEN介导的细胞凋亡途径,调控细胞增殖和凋亡[14~15]。纤维细胞生长因子受体2(basic fibroblast growth factor receptor-2,FGFR-2)在胃癌组织中的表达结果显示,在淋巴结转移组表达高于无转移组,浸润程度越深表达越高,胃癌癌周微淋巴管密度高于正常胃组织,FGFR-2可通过促进淋巴管生成参与胃癌浸润转移[16~18]。与胃正常组织相比,纤维连接蛋白1(fibronectin-1,FN1)在胃癌组织中表达增加,其表达量与胃癌患者总体生存率存在相关性,即高表达FN1的患者总体生存率较差[19~20]。甲状腺乳头状癌转移的淋巴结组织中FN1表达显著增高,且其表达随病理分级增加表达升高。高表达FN1的患者无复发生存期显著短于低表达患者,可以作为预测淋巴结转移和判断预后的重要因子[21]。

甲状腺的功能单位是滤泡,由单层甲状腺细胞分隔,滤泡的基底和顶端表面分别面向血流和内腔,本文研究发现DEGs富集在顶膜,DEGs可能影响顶膜及甲状腺激素的代谢。甲状腺细胞合成、储存并分泌甲状腺球蛋白(TG),碘化的TG通过顶膜再吸收并在溶酶体中降解形成T3/T4,然后T3/T4通过基底膜分泌[22~23]。TG是分化型甲状腺乳头状癌(DTC)的肿瘤标志物,可作为分化型甲状腺乳头状癌患者治疗后随访的重要参考指标[24]。因此DEGs可能通过影响甲状腺激素合成信号通路的表达,而对甲状腺乳头状癌的病情进展产生影响。

PTC分化类型良好,术后5年生存率可达97.9%,然而在这类良好分化的肿瘤当中仍有部分患者预后差、无病生存时间短[25~26]。鉴于PTC发病率和复发病例不断上升,寻找一种可靠的复发风险评估方法甄别高危人群指导临床决策显得极为重要[27]。我们PPI蛋白网络分析显示11个核心基因与PTC相关,进一步分析显示,这11个核心中有8个与DFS有显著相关,说明在不影响总体生存的情况下,存在这8个异常表达基因的患者,术后复发的风险显著增高,这有助于我们进行个体化案例术后随访。

本文通过生物信息学方法分析PTC及癌旁组织的基因表达谱芯片数据,发现影响PTC发生、发展的重要通路及关键基因,为阐述PTC的发病机制及诊断提供了全新视角,并为PTC靶向抑制剂的开发提供新的方向。根据大数据预测的PTC相关信号通路及关键基因为FN1,也初步验证了FN1在PTC组织样本和细胞株中都是高表达的,但在PTC病程进展中的作用还有待进一步研究。

参 考 文 献

[1]  孙嘉伟,许晓君,蔡秋茂,等.中国甲状腺癌发病趋势分析[J].中国肿瘤,2013,22(9):690-693.

[2]  陈玉恒,郭兰伟,张玥,等.中国2008年甲状腺癌发病、死亡和患病情况的估计及预测[J].中华疾病控制杂志,2014,18(3):200-203.

[3]  程若川,刘文.中国甲状腺癌术后随访和临床研究现状反思[J].中国普通外科杂志,2017,26(11):1375-1382.

[4]  MAINO F,FORLEO R,PACINI F.Prognostic indicators for papillary thyroid carcinoma[J].Expert Rev Endocrinol Metab,2017,12(2):101-108.

[5]  PAPALEO E,GROMOVA I,GROMOV P.Gaining insights into cancer biology through exploration of the cancer secretome using proteomic and bioinformatic tools[J].Expert Rev Proteomics,2017,14(11):1021-1035.

[6]  ROMAN B R,MORRIS L G,DAVIES L.The thyroid cancer epidemic,2017 perspective[J].Curr Opin Endocrinol Diabetes Obes,2017,24(5):332-336.

[7]  SUZUKI K,SAENKO V,YAMASHITA S,et al.Radiation-induced thyroid cancers:overview of molecular signatures[J].Cancers (Basel),2019,11(9):E1290.

[8]  唐振宁,李璐,张朝林,等.甲状腺乳头状癌组织E-cadherin、vimentin的表达及临床意义[J].海南医学,2020,31(4):425-428.

[9]  FOZZATTI L,ALAMINO V A,PARK S,et al.Interplay of fibroblasts with anaplastic tumor cells promotes follicular thyroid cancer progression[J].Sci Rep,2019,29,9(1):8028.

[10] WEN S S,ZHANG T T,XUE D X,et al.Metabolic reprogramming and its clinical application in thyroid cancer[J].Oncol Lett,2019,18(2):1579-1584.

[11] ITABASHI H,MAESAWA C,OIKAWA H,et al.Angiotensin Ⅱand epidermal growth factor receptor cross-talk mediated by a disintegrin and metalloprotease accelerates tumor cell proliferation of hepatocellular carcinoma cell lines[J].Hepatol Res,2008,38(6):601-613.

[12]  孟令梅,李娟,李小芳,等.AGTR1基因多态性与多系统疾病相关性的研究[J].微量元素与健康研究,2020,37(1):60-63.

[13]  ZHAO N,PEACOCK S O,LO C H,et al.Arginine vasopressin receptor 1a is a therapeutic target for castration-resistant prostate cancer[J].Sci Transl Med,2019,11(498):eaaw4636.

[14]  谭永华,陈军,王睿,等.射频消融联合肝动脉化疗栓塞术对原发性肝癌患者HIF-1α和EGR2水平的影响[J].肝脏,2018,23(8):696-698.

[15]  GHOSH A,GHOSH A,DATTA S,et al.Hepatic miR-126 is a potential plasma biomarker for detection of hepatitis B virus infected hepatocellular carcinoma[J].Int J Cancer,2016,138(11):2732-2744.

[16]  胡成乙,嵇晶晶,王曉菲,等.bFGF及FGFR-2在胃癌组织淋巴管生成中的意义[J].同济大学学报(医学版),2017,38(4):17-20.

[17]  黄志强,刘胜,陈森林,等.胃癌组织中Hpa、bFGF及FGFR-2表达水平的研究[J].现代中西医结合杂志,2008,17(23):3565-3566.

[18]  ZHU D Y,GUO Q S,LI Y L,et al.Twist1 correlates with poor differentiation and progression in gastric adenocarcinoma via elevation of FGFR2 expression[J].World J Gastroenterol,2014,20(48):18306-18315.

[19]  孙阳,赵春临.纤维连接蛋白1在胃癌中的表达及临床意义[J].医学研究生学报,2019,32(6):629-633.

[20]  姚远,李胜昔.FN1在胃癌组织和细胞中的表达及意义[J].现代肿瘤医学,2019,27(16):2831-2835.

[21]  ZHAN S H,LI J M,WANG T X,et al.Quantitative proteomics analysis of sporadic medullary thyroid cancer reveals FN1 as a potential novel candidate prognostic biomarker[J].Oncologist,2018,23(12):1415-1425.

[22]  BATOOL S,AFRIDI M S,KHOJA A,et al.Pre-operative serum TSH levels:a risk factor for advanced metastatic differentiated thyroid carcinoma[J].Pak J Med Sci,2019,35(5):1312-1317.

[23]  GOEMANN I M,ROMITTI M,MEYER E L S,et al.Role of thyroid hormones in the neoplastic process:an overview[J].Endocr Relat Cancer,2017,24(11):R367-R385.

[24]  曾怀震,郑高平,唐玉玲.影响甲状腺乳头状癌颈侧淋巴结转移的高危因素[J].河南外科学杂志,2020,26(1):19-21.

[25]  ESPOSITO R,ESPOSITO D,PALLANTE P,et al.Oncogenic properties of the antisense lncRNA COMET in BRAF-and RET-driven papillary thyroid carcinomas[J].Cancer Res,2019,79(9):2124-2135.

[26]  李伟,孙建伟,安树才,等.单灶性甲状腺乳头状癌中央区淋巴结转移个数与颈侧区淋巴结转移相关性[J].泰山医学院学报,2020,41(2):111-113.

[27]  SASIKUMAR A,BHAN C,JENKINS J T,et al.Systematic review of pelvic exenteration with en bloc sacrectomy for recurrent rectal adenocarcinoma:R0 resection predicts disease-free survival[J].Dis Colon Rectum,2017,60(3):346-352.

(收稿日期:2020-03-12 修回日期:2020-04-22)

(編辑:潘明志)

猜你喜欢
生物信息学
中药蛋白质组学研究策略
浅谈医学院校生物信息学专业青年教师规范培训模式的建立
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
中医大数据下生物信息学的发展及教育模式浅析
生物信息学课堂危机及对策研究
案例教学法在《生物信息学》本科教学中的应用
论生物信息学研究进展及在蛋白质组学研究中的应用
农学类专业《生物信息学》课程教学改革探讨
微生物二元网络作用关系研究