李娜 连续 兰宏伟 许红昕
[摘要] 目的 通過生物信息学的方法分析溶血磷脂酸受体5(LPAR5)在甲状腺乳头状癌(PTC)中的表达及临床意义,为PTC分子生物研究和生物标志物筛选提供理论依据。 方法 2020年5月开始从GEO数据库中筛选数据,最终筛选出编号为GSE3678的基因芯片,并对样本进行规范化处理,筛选出差异表达基因LPAR5。利用TCGA数据库验证LPAR5在甲状腺癌组织和正常甲状腺组织差异表达情况,同时在ulcan数据库分析LPAR5表达与PTC患者临床特征之间的关系。通过GEPIA2分析LPAR5基因与甲状腺癌生存率之间的关系。 结果 共筛选出甲状腺癌差异基因755个,其中表达上调差异基因314个,表达下调差异基因441个,基于TCGA基因表达数据分析得出LPAR5在甲状腺癌中表达高于正常甲状腺组织,LPAR5表达量与甲状腺癌患者的临床分期和N分期密切相关(P<0.05),而与性别、年龄未见相关性(P>0.05),GEPIA2分析显示甲状腺癌患者LPAR5高表达组总生存率高于低表达组(P<0.05),而在甲状腺癌患者无病生存期中LPAR5高表达组与低表达组比较,差异无统计学意义(P>0.05)。 结论 本研究通过生物信息学分析得到了甲状腺癌中的部分差异基因,并通过TCGA数据库分析进一步验证了LPAR5在甲状腺癌中的高表达,且与肿瘤临床分期和N分期密切相关,进一步证明了LPAR5可能参与PTC的发生发展,并影响PTC淋巴结转移。
[关键词] 甲状腺乳头状癌;LPAR5;生物信息学;GEO;TCGA;GEPIA2
[中图分类号] R736.1 [文献标识码] A [文章编号] 1673-9701(2021)09-0001-04
The expression and significance of LPAR5 in papillary thyroid carcinoma based on bioinformatics
LI Na1 LIAN Xu1 LAN Hongwei2 XU Hongxin1
1.Department of Endocrinology, Hongqi Hospital Affiliated to Mudanjiang Medical College, Mudanjiang 157000, China; 2.Department of Oncology, Hongqi Hospital Affiliated to Mudanjiang Medical College, Mudanjiang 157000, China;
[Abstract] Objective To analyze the expression and clinical significance of lysophosphatidic acid receptor 5 (LPAR5) in papillary thyroid carcinoma(PTC) by means of bioinformatics, so as to provide a theoretical basis for PTC molecular biology research and biomarker screening. Methods The data from the GEO database from May 2020 were screened. Finally the gene chip numbered GSE3678 was screened out. The samples were and standardized to screen out the differentially expressed gene LPAR5. The TCGA database was used to verify the differential expression of LPAR5 in thyroid cancer tissues and normal thyroid tissues. The relationship between the LPAR5 expression and clinical characteristics of PTC patients was analyzed in the ulcan database. The relationship between the LPAR5 gene and thyroid cancer survival rate was analyzed by GEPIA2. Results A total of 755 differential genes in thyroid cancer were screened, including 314 upregulated differentially expressed genes and 441 downregulated differentially expressed genes. Based on the analysis of TCGA gene expression data,it was concluded that the expression of LPAR5 in thyroid cancer was higher than that in normal thyroid tissue. The expression of LPAR5 was closely related to the clinical stage and N stage of thyroid cancer patients (P<0.05), but had no correlation with gender and age(P>0.05). GEPIA2 analysis showed that the overall survival rate of patients with thyroid cancer in the LPAR5 high expression group was higher than that in the low expression group(P<0.05), while there was no significant difference between the LPAR5 high expression group and the low expression group in the disease-free survival of patients with thyroid cancer(P>0.05). Conclusion This study obtained some differential genes in thyroid cancer through bioinformatics analysis, and further verified the high expression of LPAR5 in thyroid cancer through TCGA database analysis, and was closely related to the clinical stage and N stage of the tumor, which further proved that LPAR5 might be involved in the occurrence and development of PTC and affect PTC lymph node metastasis.
[Key words] Papillary thyroid carcinoma; LPAR5; Bioinformatics; GEO; TCGA; GEPIA2
甲状腺癌是内分泌最常见的恶性肿瘤,从全球范围来看,过去的30年甲状腺癌的发病率增长了300%[1],是所有实体恶性肿瘤中发病率增长最快的。调查发现在30岁以下的女性中,甲状腺癌发病率位居恶性肿瘤第一位[2]。甲状腺癌主要包括四种病理类型:甲状腺乳头状癌(Papillary thyroid carcinoma,PTC)、甲状腺滤泡状癌(Follicular thyroid carcinoma,FTC)、甲状腺髓样癌(Medullary thyroid carcinoma,MTC)和甲状腺未分化癌(Anaplastic thyroid carcinoma,ATC),其中PTC和FTC起源于甲状腺滤泡上皮细胞统称为分化型甲状腺癌。PTC是最常见的甲状腺癌,约占所有甲状腺癌的85%。甲状腺癌早期起病隐匿,且早期确诊率并不高,致使患者错失了最佳的治疗时期,随着病程进展会侵犯周围神经出现声音嘶哑、吞咽困难和呼吸困难等,并出现颈部淋巴结转移或远处脏器转移。甲状腺癌的治疗方法较为单一,目前大都采取手术切除的方法,但术后还需要进一步的放射碘治疗和终身服药,这在一定程度上增加了患者的心理负担和经济负担。数据显示我国甲状腺癌5年相对生存率为67.5%[3],其死亡率也随着发病率的增加逐年增加。因此,寻找甲状腺癌早期诊断的标志物以及靶向药物开发的潜在基因至关重要。
溶血磷脂酸受体5(Lysophosphatidic acid receptor 5,LPAR5)属于嘌呤能受体家族中的非内皮细胞分化基因受体,它是通过针对独立的G蛋白偶联受体92蛋白抗体的筛选方法被鉴定的第5个溶血磷脂酸(Lysophosphatidic acid,LPA)受体。人类LPAR5位于染色体12p13.31上,并编码一种由372个氨基酸组成的41 kDa的蛋白[4]。LPAR5分布较为广泛,在小肠、皮肤、肝、肺、胸腺中均有表达。在肿瘤组织中,LPAR5常过度表达,例如LPAR5在乳腺癌、胰腺癌中均呈现高表达,且能激活肿瘤并发挥促癌作用[5-6]。LPAR5在甲状腺癌中的报道较少见,但Wu等[7]在实验中证明LPAR5可以促进PTC的转移和肿瘤发生,并且可以影响细胞的侵袭和迁移。在此背景下,本文希望通过生物信息学分析,进一步了解LPAR5在PTC中的表达情况以及LPAR5与PTC临床特征之间的关系,并探讨LPAR5的表达对PTC患者预后的影响,现报道如下。
1 资料与方法
1.1 一般资料
登录公共基因芯片数据库(Gene expression omnibus,GEO)数据库,选取符合条件的基因芯片GSE 3678,获得差异表达基因。登录癌症和肿瘤基因图谱(The cancer genome atlas,TCGA)数据库(https://portal.gdc.cancer.gov/),下载甲状腺癌相关的转录组测序技术RNA-Seq数据, 登录ulcan数据库(http://ualcan.path.uab.edu/index.html)(此数据库没有中英文全称),分析LPAR5与甲状腺癌患者临床特征之间的关系。利用在线网站基因表达谱数据动态分析(Gene Expression Profiling Interactive Analysis 2,GEPIA2)(http://gepia2.cancer-pku.cn/)分析LPAR5与甲状腺癌患者预后的关系。
1.2 方法
1.2.1 GEO数据集的选择 在GEO数据库检索界面中输入筛选条件:(a)thyroid tumor or thyroid cancer;(b)samples containing tumor and normal thyroid tissues;(c)Homo sapiens as the organism;(d)cancer type:Papillary thyroid cancer,在以上筛选条件下,选取含有PTC样本且通过芯片质量要求的基因芯片GSE3678。基因芯片信息:Affymetrix human genome U133 plus 2.0 array,平台为GPL570,共包含7个正常甲状腺组织,7个PTC组织。
1.2.2 数据处理及差异基因的筛选 在GEO中获得芯片GSE3678基因表达矩阵以及平台注释信息,然后用R语言的limma等软件包对测序平台的基因表达谱数据进行二次分析,评估芯片质量并标准化后进行差异基因筛选,设置筛选标准:修正后的P值<0.05,(adjust P.Value<0.05),表达变化倍数大于2(|log2 FOLD CHANGE(FC) |>1),获得差异表达基因(limma)。
1.2.3 TCGA数据集筛选和处理 在TCGA数据库中设定如下筛选条件: Files版块:Data Category:Transcriptome Profiling;Date Type:Gene Expression Quantification;Experimental Strategy:RNA-Seq;Workflow Type:HTSeq-FPKM,其余默認系统选项。CASE版块:Primary Site:Thyroid gland,其余默认系统选项。共获取基因表达样本568例,其中癌组织样本510例,癌旁正常甲状腺组织样本58例。通过R语言及Perl语言整理基因表达数据,并分析LPAR5在甲状腺癌组织和癌旁正常甲状腺组织差异表达情况。
1.2.4 ulcan数据库探讨LPAR5与甲状腺癌患者临床特征之间的关系 在ulcan数据库中设定如下筛选条件:(a)在数据库首页选择TCGA analysis;(b)Enter gene symbol(s):LPAR5;(c)TCGA dataset:Thyroid carcinoma;(d)Links for analysis:Expression。分析甲状腺癌中LPAR5基因在年龄、性别、临床分期和淋巴结转移状态等方面的表达差异。
1.2.5 GEPIA2分析LPAR5与甲状腺癌患者预后的关系 登录GEPIA2设置主要筛选条件如下:(a)Gene symbol:LPAR5;(b)FUNCTIONS:Survival Analysis;(c)Datasets Selection(Cancer name):THCA(d)Methods:Overall Survival、Disease Free Survival;(e)Group Cutoff:Median。設置完毕后,提交检索。
1.3 观察指标
观察甲状腺癌差异基因表达情况,并且比较LPAR5在甲状腺癌组织和正常甲状腺组织中的表达情况及其与临床特征和生存预后之间的关系。
1.4 统计学方法
应用SPSS 20.0统计学软件进行数据分析,计数资料以[n(%)]表示,两组独立样本等级资料比较采用Wilcoxon 两样本秩和检验,P<0.05为差异有统计学意义。
2 结果
2.1 数据的处理结果
利用pheatmap、FactoMineR等R包对基因芯片GSE3678进行评估,并得到芯片样本表达谱箱线图(封三图1A)及全基因表达聚类热图(封三图1C)。结果显示,此数据未经过log2转化处理,且各表达谱芯片中位数不在同一水平,存在差异,不能直接进行数据分析,需要规范化处理。应用R语言的limma软件包对芯片原始数据样本进行二次分析、背景校正和矩阵数据归一化处理后,将各表达谱中位数置于同一水平(封三图 1B),消除分析过程存在的非实验误差(pheatmap、Facto MineR limma)。
2.2 PTC与正常甲状腺组织的差异基因筛选结果
通过limma包进行差异表达基因筛选,共获得755个差异基因,其中314个基因表达上调,包括:突出结合素5(Synaptotagmin like 5,SYTL5)、LDL受体相关蛋白4(LDL receptor related protein 4,LRP4)、二肽基肽酶4(Dipeptidyl peptidase 4,DPP4)、LPAR5等。基因表达下调有441个,包括内皮素3(Endothelin 3,EDN3)、碘甲状腺素脱碘酶1(Iodothyronine deiodinase 1,DIOI)、细胞视黄酸结合蛋白1(Cellular retinoic acid binding protein 1,CRABP1)等。绘制差异基因火山图(封三图 2A)。根据log2FC进行排序后,进一步利用热图呈现变化差异最大的前30个上调及下调的基因(封三图 2B)。选取在甲状腺癌中研究较少的LPAR5做进一步分析。
2.3 TCGA数据库中LPAR5的表达情况
使用 R 语言和Perl语言分析整理数据,并绘制 LPAR5在甲状腺癌与正常甲状腺组织中的表达散点图。与对照组相比,甲状腺癌组织中LPAR5呈显著高表达,差异有统计学意义(P<0.001)。见封三图3A。同时配对的58例甲状腺癌与癌旁正常甲状腺组织中LPAR5表达也有明显的差异,其在甲状腺癌组织中显著高表达(P<0.001)。见封三图3B。
2.4 LPAR5与甲状腺癌患者临床特征之间的关系
根据ulcan数据库检索源自TCGA数据库中的505例甲状腺癌患者的临床资料(由于部分患者临床资料—相对不完整,导致各组间总数具有差异)。见表1。分析甲状腺癌中LPAR5基因在年龄、性别、临床分期和淋巴结转移状态等方面的表达差异(封三图4)。不同临床分期的患者LPAR5表达量不同,且未见淋巴结转移的甲状腺癌患者的LPAR5表达低于淋巴结转移的患者,差异有统计学意义(P<0.05)。在针对不同的性别、年龄的甲状腺癌患者中,LPAR5的表达比较,差异无统计学意义(P>0.05)。
2.5 GEPIA2分析LPAR5与甲状腺癌患者预后的关系
通过在线数据库GEPIA2分析LPAR5表达与甲状腺癌患者预后的关系,以样本中LPAR5表达的中位数作为分界点,分为高表达组及低表达组,我们发现LPAR5高表达组甲状腺癌患者总生存率高于低表达组,差异有统计学意义(P<0.05)。见封三图5A。而在甲状腺癌患者无病生存期中LPAR5高表达组与低表达组,差异无统计学意义(P>0.05)。见封三图5B。
3 讨论
甲状腺癌有多种病理类型,其中PTC是甲状腺癌中最为常见的病理类型,虽然死亡率较低,但是针对PTC分子生物研究,并且有针对性的治疗也是非常必要的。利用生物信息学分析癌症特异性基因表达可能为人类癌症的治疗提供一个新的基础。探索肿瘤的标志物,提高其诊断的准确度及灵敏度,评估病情和肿瘤的预后,进行相关的靶向治疗等,都将会成为今后的研究方向。本研究通过分析LPAR5在PTC中的表达情况及其与临床体征之间的关系,来预测其可能成为未来PTC诊断的分子标志物和治疗的新靶点。
LPA是一种小甘油磷脂,目前已知有6种LPA受体亚型,由于受体亚型、表达模式和效应通路的异质性,LPA的作用也是多样和广泛的,其参与人体多种生物系统如:神经系统、血管系统、免疫系统和生殖系统,同时还参与了一些疾病过程,如呼吸道疾病、癌症、肥胖、神经炎症和神经损伤[8],其在不同的系统和疾病中发挥着不同的生物学功能,调节着许多生物学过程。
LPA信号调节癌细胞的恶性特性主要是通过依赖LPA受体的表达和功能改变所导致的,其在癌症中通过促进血管生成、增殖、存活、侵袭和转移来驱动肿瘤进展[9],但其促肿瘤的作用似乎是在受体表达水平上调控,而不是配体浓度水平上调控。然而每个受体亚型根据不同疾病的癌细胞其表现的生物学特性各不相同。LPA的不同亚型在多种肿瘤中发挥重要作用。研究表明,溶血磷脂酸受体1(Lysophosphatidic acid receptor 1,LPAR1)和溶血磷脂酸受体2(Lysophosphatidic acid receptor 2,LPAR2)通过介导LPA诱导卵巢癌细胞、胃肠道癌症的迁移和侵袭[10-11]。Xia等[12]在实验中证明了溶血磷脂酸受体3(Lysophosphatidic acid receptor 3,LPAR3)可增强甲状腺癌细胞增殖并抑制细胞凋亡,这对甲状腺癌的进展起到促进作用[12]。此外,Pan等[13]还发现,溶血磷脂酸受体4(Lysophosphatidic acid receptor 4,LPAR4)为PTC的驱动基因,并强调LPAR4可以作为PTC潜在的诊断和治疗靶点。此前,也有一些研究表明在不同免疫细胞类型中抑制LPAR5可能会增强抗肿瘤的活性并且抑制癌细胞转移[9],这一点在乳腺癌中得到了很好的验证[5]。然而在鼻咽癌和人类肉瘤细胞中又发现LPAR5起着负向调控的作用,其下调时可以促进癌细胞的迁移[14-15],因此,LPAR5在癌细胞中具体的生物学作用不能一概而论。
本研究通過GEO数据库筛选出755个差异基因,选取其中高表达的LPAR5做进一步分析。通过TCGA数据库分析进一步验证了LPAR5在PTC中的高表达,这与之前Liu等[16]的研究结果一致。本研究还进一步探讨了LPAR5与临床特征间的相关性,发现LPAR5的表达与年龄和性别等因素无直接相关性,但与患者淋巴结转移密切相关(P<0.05),同时还发现,LPAR5与甲状腺癌患者的总生存率呈正相关,但是,这与之前LPAR5在甲状腺癌中对患者生存率影响的结果相矛盾[7]。然而,利用生物信息学分析也存在一定局限性,缺乏相应的实验数据作为支持验证,因此也可以从临床角度进行后续验证LPAR5与甲状腺肿瘤之间的关系,也可以从基础角度分析敲低LPAR5后对甲状腺肿瘤细胞的影响。所以说LPAR5在甲状腺癌发生发展中的具体功能和作用机制仍有待探索,还需要进一步深入研究。
综上所述,通过使用GEO数据库和在线数据库分析平台,不仅在甲状腺癌中识别了一些差异显著的基因,同时还发现LPAR5在甲状腺癌中呈现高表达,证明了LPAR5可能参与PTC的发生发展,并且影响着淋巴结转移,具有预测甲状腺癌风险度的潜能。本研究结果可以在一定程度上为甲状腺癌提供潜在的、可靠的生物标志物,对进一步应用于甲状腺癌的临床诊断、预后和靶向治疗提供了新思路。
[参考文献]
[1] Seib CD,Sosa JA.Evolving understanding of the epidemiology of thyroid cancer[J].Endocrinol Metab Clin North Am,2019,48(1):23-35.
[2] Chen W,Zheng R,Baade PD,et al.Cancer statistics in china,2015[J]. CA Cancer J Clin,2016,66(2):115-132.
[3] Zeng H,Zheng R,Guo Y,et al.Cancer survival in china,2003-2005:A population-based study[J].Int J Cancer,2015, 136(8):1921-1930.
[4] Lee CW,Rivera R,Gardell S,et al.Gpr92 as a new G12/13- and Gq-coupled lysophosphatidic acid receptor that increases camp,LPA5[J].J Biol Chem,2006,281(33):23 589-23 597.
[5] Zheng YQ,Miao X,Li J,et al.Trichostatin a alleviates the process of breast carcinoma by downregulating LPAR5[J].Eur Rev Med Pharmacol Sci,2020,24(11):6417-6425.
[6] Ishii S,Hirane M,Fukushima K,et al.Diverse effects of LPA4, LPA5 and LPA6 on the activation of tumor progression in pancreatic cancer cells[J].Biochem Biophys Res Commun,2015,461(1):59-64.
[7] Wu CY,Zheng C,Xia EJ,et al.Lysophosphatidic acid receptor 5(LPAR5) plays a significance role in papillary thyroid cancer via phosphatidylinositol 3-kinase/akt/mammalian target of rapamycin (mtor) pathway[J].Med Sci Monit, 2020,26:e919 820.
[8] Choi JW,Herr DR,Noguchi K,et al.LPA receptors:Subtypes and biological actions[J].Annu Rev Pharmacol Toxicol,2010,50:157-186.
[9] Lee SC,Dacheux MA,Norman DD,et al.Regulation of tumor immunity by lysophosphatidic acid[J].Cancers (Basel),2020,12(5):1202.
[10] Park J,Jang JH,Oh S,et al.LPA-induced migration of ovarian cancer cells requires activation of erm proteins via LPA and LPA[J].Cell Signal,2018,44:138-147.
[11] Lee SJ,Ritter SL,Zhang H,et al.Magi-3 competes with NHERF-2 to negatively regulate LPA2 receptor signaling in colon cancer cells[J].Gastroenterology,2011,140(3):924-934.
[12] Xia W,Jie W.ZEB1-AS1/miR-133a-3p/LPAR3/EGFR axis promotes the progression of thyroid cancer by regulating PI3k/AKT/mTOR pathway[J].Cancer Cell Int,2020, 20:94.
[13] Pan W,Zhou L,Ge M,et al.Whole exome sequencing identifies lncRNA GAS8-AS1 and LPAR4 as novel papillary thyroid carcinoma driver alternations[J].Hum Mol Genet,2016,25(9):1875-1884.
[14] Yap LF,Velapasamy S,Lee HM,et al.Down-regulation of LPA receptor 5 contributes to aberrant LPA signalling in EBV-associated nasopharyngeal carcinoma[J].J Pathol,2015,235(3):456-465.
[15] Dong Y,Hirane M,Araki M,et al.Lysophosphatidic acid receptor-5 negatively regulates cell motile and invasive activities of human sarcoma cell lines[J].Mol Cell Biochem,2014,393(1-2):17-22.
[16] Liu L,He C,Zhou Q,et al.Identification of key genes and pathways of thyroid cancer by integrated bioinformatics analysis[J].Journal of Cellular Physiology,2019,234(12):23 647-23 657.
(收稿日期:2020-11-06)