胡文良,郑艳秋,孙学威
(内蒙古医科大学附属医院耳鼻咽喉科,内蒙古 呼和浩特 010050)
·论 著·
头颈部鳞癌的基因模块化分析及潜在抗癌药物筛选
胡文良,郑艳秋,孙学威
(内蒙古医科大学附属医院耳鼻咽喉科,内蒙古 呼和浩特 010050)
目的利用生物信息学模块化分析方法,筛选头颈部鳞癌中的功能性基因模块,为头颈部鳞癌的研究和治疗提供新的靶点。方法获取GEO数据库中头颈部鳞癌的全基因组数据(GSE6631)后,利用R语言limma包筛选头颈部鳞癌中差异表达基因。通过STRING数据库,建立头颈部鳞癌中差异表达基因的蛋白-蛋白互作网络。然后,利用Cytoscape软件的MCODE插件筛选头颈部鳞癌中的基因模块。利用DAVID数据库,获得模块功能。最后,挖掘模块基因中的蛋白激酶基因并利用Selleckchem数据库筛选其激酶抑制剂。结果共筛选出头颈部鳞癌中的差异表达基因929个(P<0.05且|Fold Change|≥2)。根据String数据库,发现这些差异基因中共有5 588个蛋白质互作对,并据此建立鼻咽癌中的蛋白质互作网络。利用MCODE方法在蛋白质互作网络中共筛选出3个基因模块。GO分析显示这些模块与头颈部鳞癌的关系十分密切,主要包括参与细胞周期、细胞增殖、细胞黏附、细胞凋亡等重要肿瘤细胞活动。3个模块包含3个蛋白激酶基因,即CDK1、CDK4和CDK5,共筛选出调控它们的39个激酶抑制剂,其中20个对头颈部鳞癌的作用还不清楚,具有成为抗癌新药的潜力。结论头颈部鳞癌中的3个功能性基因模块可能在头颈部鳞癌的发生发展中发挥重要作用,20个激酶抑制剂可能通过调控CDK家族基因来调控头颈部鳞癌的发生发展,这些功能性模块的挖掘和激酶抑制剂的筛选可能为头颈部鳞癌的研究和治疗提供新的靶点。
头颈部鳞癌;基因模块化分析;生物信息;激酶抑制剂
头颈部鳞癌是一类影响鼻腔、口腔和咽喉部的恶性肿瘤。该疾病不仅本身能够危及人类生命而且接受相关治疗的头颈部鳞癌患者还必须承受一些严重的并发症,包括进食、吞咽、呼吸困难和丧失语言能力等[1-2]。每年约有65万人被诊断为头颈部鳞癌,这使其成为世界第6大常见癌症,5年生存率约为60%[1]。研究清楚发病机制是改善头颈部鳞癌诊断和治疗的关键。基因模块化分析作为一种重要的生物信息学方法,能够帮助笔者在包含海量致病基因的网络中挖掘出具有重要致病功能的基因团,即基因模块[3]。此外,研究发现激酶抑制剂在癌症的治疗上取得了显著成效,部分激酶抑制剂被应用于临床[4]。本研究中,笔者利用生物信息学方法筛选GEO数据库中头颈部鳞癌样本中的差异表达基因并建立蛋白互作网络,在网络中筛选具有重要作用的基因模块,并利用相关数据库筛选出能够靶向调控基因模块中激酶基因的激酶抑制剂,以期为头颈部鳞癌的发病机制研究和治疗提供新的参考。
1.1 头颈部鳞癌样本中差异表达基因的筛选GEO数据库中的GSE6631数据集包含22例头颈部鳞癌样本和22例癌旁对照样本的全基因组数据。笔者利用R语言的limma包检测头颈部鳞癌中的差异表达基因[5]。表达倍数(Fold Change)≥2.0且矫正P值<0.05的基因被认为有差异表达。
1.2 头颈部鳞癌中蛋白互作网络的建立 String数据库(http://string-db.org/)是一个收录了大量已知蛋白质之间和预测蛋白质之间互作关系的知名系统。根据String数据库的蛋白质互作关系和头颈部鳞癌中的差异表达基因,笔者建立了头颈部鳞癌中的蛋白质-蛋白质互作(protein-protein interaction,PPI)网络。
1.3 基因模块的筛选 基于上一步建立的头颈部鳞癌PPI网络,笔者利用Cytoscape 3.4(http://www.cytoscape.org/)软件中的MCODE插件挖掘头颈部鳞癌PPI网络中的基因模块,并利用Cytoscape 3.4软件生成基因模块图[6]。
1.4 基因模块的功能分析 为了确定已筛选的模块功能,笔者利用DAVID数据库(The Database for Annotation,Visualization and Integrated Discovery,http://david.ncifcrf.gov/)对这些基因模块分别进行功能Gene Ontology(GO)分析。
1.5 潜在抗癌药物的筛选 首先,在利用上述方法获得头颈部鳞癌的基因模块后,筛选出这些模块中的蛋白激酶基因。然后,利用Selleckchem网站(http://www.selleckchem.com/)筛选出目的激酶的抑制剂。再利用文献挖掘技术(Thomson Data Analyzer软件,http://thomsonreuters.com/thomson-data-analyzer/),在Pubmed数据库中以“激酶抑制剂”和“头颈部鳞癌”为关键词,筛选出目的激酶抑制剂在癌症研究方面的文献数量,以预测潜在的头颈部鳞癌治疗新药物。
1.6 统计学方法 本次实验利用R语言limma软件对GSE6631数据集中头颈部鳞癌组织和癌旁组织中基因的表达量进行t检验[5],P<0.05为差异具有统计学意义,P<0.05且差异表达倍数≥2.0的基因为差异表达基因。利用DAVID数据库对GO功能分析的结果进行Fisher精确检验[3],P<0.05的GO功能具有统计学意义。
2.1 差异表达基因 利用R语言limma包检测44例头颈部鳞癌样本中的差异表达基因,结果显示共有929个基因发生差异表达(矫正P值<0.05且|Fold Change|≥2)。
2.2 蛋白互作网络和基因模块 根据STRING数据库和上述筛选出差异表达基因,发现头颈部鳞癌的929个基因共包含5 588个蛋白质互作关系对。然后,利用Cytoscape软件建立了头颈部鳞癌中的PPI网络,如图1。模块化分析的结果显示头颈部鳞癌的PPI网络中包含3个基因模块,分别命名为模块1~3,如表 1和图 2所示。模块 1由 CDK1、CDC6、CDK14等41个基因构成;模块2包括FN1、CD44、PLK4等45个基因;模块3包含CAD、TAF4、HSPA5等31个基因。
图1 头颈部鳞癌中的PPI网络
表1 模块信息
图2 头颈部鳞癌PPI网络中的基因模块
2.3 基因模块功能 GO分析的结果显示,模块1~3的功能均与头颈部鳞癌的关系十分密切。模块1的功能包括细胞周期(cell cycle)、细胞分裂(cell division)、细胞增殖(cell proliferation)等;模块2的功能包括细胞周期(cell cycle)、细胞黏附(cell adhesion)、血管生成(blood vessel development)、细胞增殖(cell proliferation)等;模块3的功能包括能量代谢过程(GTP biosynthetic process)、基因表达(gene expression)、凋亡调控(negative regulation of apoptotic process)等(P<0.05),见表2。
表2 基因模块功能
2.4 潜在抗癌药物筛选 研究表明,激酶抑制剂具有显著的抗肿瘤作用,已在临床抗肿瘤治疗中取得良好效果。本次实验筛选上述模块中的蛋白激酶及其抑制剂,以期为头颈部鳞癌的分子靶向治疗提供新的切入点。在模块1、2和3中共发现4个蛋白激酶,它们均为周期蛋白依赖性激酶(CDK)家族成员,分别为CDK1、CDK4、CDK5和CDK14。利用Selleckchem数据库筛选出CDK1的激酶抑制剂21个、CDK4的激酶抑制剂10个和CDK5的激酶抑制剂3个,如表3所示。目前,数据库还没有收录CDK14相关的激酶抑制剂。文献挖掘的结果显示,在CDK1、CDK4和CDK5的激酶抑制剂中分别有6个、7个和1个已被发现与头颈部鳞癌关系密切。其他20个激酶抑制剂在头颈部鳞癌中的作用还不清楚。
表3 调控头颈部鳞癌的激酶抑制剂筛选
近年来,随着海量实验数据的产生,生物信息学作为常用的大数据分析手段,能够快速且有效的识别出数据网络中更有价值的信息,例如,基因模块化分析技术能够为笔者呈现在基因网络中可视化和模块化的核心信息。本实验中筛选出在头颈部鳞癌中差异表达的基因并构建其PPI网络,利用MCODE软件识别网络中的基因模块,进而挖掘在头颈部鳞癌中发挥重要调控作用的基因靶点。
笔者在头颈部鳞癌的PPI网络中挖掘出3个重要的基因模块。模块1和模块2的功能均包含对细胞周期和细胞增殖的调控。研究表明,细胞周期紊乱导致细胞发生失控性生长是肿瘤的本质[7]。因此,找出对头颈部鳞癌细胞周期有调控作用的基因靶点对于抑制肿瘤的发生发展至关重要。笔者发现模块1中包含若干周期蛋白依赖性激酶(CDK)家族成员基因,例如:CDK1、CDK4、CDK5等。研究表明,CDK家族对于调节肿瘤细胞周期具有重要作用。Bednarek等[8]发现CDK1在喉癌中高表达且参与早期肿瘤形成;Benerjee等[9]发现CDK4与头颈部癌症患者的生存率呈显著负相关;Sun等[10]发现CDK5能够调节头颈部鳞癌的上皮间质化转变。这些结果说明这些CDK家族基因对头颈部鳞癌具有重要的调控作用。然而,它们之间的互相作用是否在头颈部鳞癌中也发挥作用还不清楚。本次实验结果提示CDK1、CDK4和CDK5等细胞周期调控基因可能在模块1中发挥密切的互相作用并发挥调控细胞周期的作用,同时干预这些CDK靶点可能比调控单一靶点更有意义。此外,模块1和膜块2还对细胞增殖能力具有重要的调控作用,例如模块1中的MCM7和BUB1基因和模块2中的CDC27和BUB1B。Pickhard等[11]发现BUB1可以作为预测头颈部鳞癌预后的潜在靶点;Wang等[12]发现MCM7在头颈部鳞癌中高表达,但它们在头颈部鳞癌中的调控机制还不清楚。本次研究结果提示这些基因发挥作用可能是通过模块1和模块2的基因互作来实现的。功能分析的结果显示模块2参与细胞黏附和血管生成等与肿瘤发生发展密切相关的细胞活动。Baschnagel等[13]发现CD44与头颈部鳞癌的预后密切相关;Jerhammar等[14]发现FN1是头颈部鳞癌预后的重要指标。CD44和FN1均为模块2中的重要基因,它们可能与头颈部鳞癌的关系十分密切,但其作用机制还不清楚。本实验的结果提示它们可能通过与模块2的基因发生互作来调节肿瘤细胞的黏附能力和血管生成能力,从而调节其转移能力,最终影响患者生存率。除模块1和2外,模块3也能够参与重要的肿瘤活动,例如调节肿瘤细胞凋亡。模块3中BARD1被证实在乳腺癌中发生基因突变并且调节肿瘤细胞凋亡[15],但其在头颈部鳞癌中作用尚不清楚。本次实验结果提示模块3中的BARD1可能参与了头颈部鳞癌的凋亡调控过程。综上,模块1~3参与了头颈部鳞癌的多种细胞活动,部分模块基因在头颈部鳞癌中的作用已被证实,但是还有很多基因与头颈部鳞癌的作用还尚不清楚,这些基因可能通过与其他模块基因发生互相作用,从而调节头颈部鳞癌的发生和发展。因此,模块1~3中的基因有潜力成为头颈部鳞癌研究和治疗的新靶点。
近年来,转化医学思想逐渐兴起,实验室成果如何向临床应用转化成为热点问题,激酶抑制剂因其显著的抗肿瘤作用,得到了广泛研究,其在临床中的应用也取得了迅猛发展。本次实验中,笔者筛选出可能通过调控CDK激酶来调控头颈部鳞癌发生发展的激酶抑制剂39个。其中,19个已被发现与头颈部鳞癌关系密切,例如,Mishra等[16]发现CDK4激酶抑制剂P276-00能够通过上调P53和抑制CDK4来抑制头颈部鳞癌的发展。这些结果证明笔者筛选结果的准确性。值得注意的是,其他20个激酶抑制剂在头颈部鳞癌中的作用还不清楚,但是它们可能通过调节CDK激酶来调节头颈部鳞癌的发生发展,具有成为头颈部鳞癌靶向治疗药物的潜力。
[1]Howren MB,Christensen AJ,Karnell LH,et al.Psychological factors associated with head and neck cancer treatment and survivorship:evidence and opportunities for behavioral medicine[J].J Consult Clin Psychol,2013,81(2):299-317.
[2]Chung CH,Guthrie VB,Masica DL,et al.Genomic alterations in head and neck squamous cell carcinoma determined by cancer gene-targeted sequencing[J].Ann Oncol,2015,26(6):1216-1223.
[3]Gao B,Wang Y,Qiu Y,et al.Bioinformatics screening regarding herbal components that targetedly regulate the function of tumour-associated macrophages[J].Oncol Rep,2014,32(1):309-317.
[4]Piirsoo A,Kasak L,Kauts ML,et al.Protein kinase inhibitor SU6668 attenuates positive regulation of Gli proteins in cancer and multipotent progenitor cells[J].Biochim Biophys Acta,2014,1843(4):703-714.
[5]Ritchie ME,Phipson B,Wu D,et al.limma powers differential expression analyses for RNA-sequencing and microarray studies[J].NucleicAcids Res,2015,43(7):e47.
[6]Lubovac Z,Gamalielsson J,Olsson B.Combining functional and topological properties to identify core modules in protein interaction networks[J].Proteins,2006,64(4):948-959.
[7]Aarts M,Linardopoulos S,Turner NC.Tumour selective targeting of cell cycle kinases for cancer treatment[J].Curr Opin Pharmacol,2013,13(4):529-535.
[8]Bednarek K,Kiwerska K,Szaumkessel M,et al.Recurrent CDK1 overexpression in laryngeal squamous cell carcinoma[J].Tumour Biol,2016,37(8):11115-11126.
[9]Banerjee J,Pradhan R,Gupta A,et al.CDK4 in lung,and head and neck cancers in old age:evaluation as a biomarker[J].Clin Transl Oncol,2017,19(5):571-578.
[10]Sun SS,Zhou X,Huang YY,et al.Targeting STAT3/miR-21 axis inhibits epithelial-mesenchymal transition via regulating CDK5 in head and neck squamous cell carcinoma[J].Mol Cancer,2015,14:213.
[11]Pickhard A,Gröber S,Haug AK,et al.Survivin and pAkt as potential prognostic markers in squamous cell carcinoma of the head and neck[J].Oral Surg Oral Med Oral Pathol Oral Radiol,2014,117(6):733-742.
[12]Wang B,Wang T,Cao XL,et al.Critical genes in head and neck squamous cell carcinoma revealed by bioinformatic analysis of gene expression data[J].Genet Mol Res,2015,14(4):17406-17415.
[13]Baschnagel AM,Tonlaar N,Eskandari M,et al.Combined CD44,c-MET,and EGFR expression in p16-positive and p16-negative head and neck squamous cell carcinomas[J].J Oral Pathol Med,2017,46(3):208-213.
[14]Jerhammar F,Ceder R,Garvin S,et al.Fibronectin 1 is a potential biomarker for radioresistance in head and neck squamous cell carcinoma[J].Cancer Biol Ther,2010,10(12):1244-1251.
[15]Marzec KA,Martino-Echarri E,Irminger-Finger I,et al.BARD1 splice variants display mislocalization in breast cancer cells and can alter the apoptotic response to cisplatin[J].Cancer Lett,2016,381(1):149-155.
[16]Mishra PB,Lobo AS,Joshi KS,et al.Molecular mechanisms of anti-tumor properties of P276-00 in head and neck squamous cell carcinoma[J].J Transl Med,2013,11:42.
Functional gene module analysis and screening of potential anticancer drugs for head and neck squamous cell carcinoma.
HU Wen-liang,ZHENG Yan-qiu,SUN Xue-wei.Department of Otolaryngology,the Affiliated Hospital of Inner Mongolia Medical University,Hohhot 010050,Inner Mongolia,CHINA
ObjectiveTo screen the functional gene modules of head and neck squamous cell carcinoma(HNSCC)with protein-protein interaction(PPI)network,and to provide new cut points for research and therapy of HNSCC.MethodsGEO dataset(GSE6631)and R language limma package were employed to screen the differentially expressed genes in HNSCC.PPI network was established by using String database.Based on the network,the gene modules were identified by using bioinformatics gene module analysis method of MCODE plug in of Cytoscape software.Go analysis(DAVID database)was used to analyze the function of gene modules.After screening the kinase genes in the modules,Selleckchem database was used to identify their kinase inhibitors.ResultsIn this study,929 differentially expressed genes were identified in HNSCC(P<0.05 and|Fold Change|≥2).There were 5 588 PPI pairs among the differentially expressed genes based on String database.The PPI network was established based on these pairs.Three gene modules were identified by using bioinformatics methods(MCODE).GO analysis results showed that the function of the gene modules includes regulation of cell cycle,cell adhesion,cell proliferation,cell apoptosis.There were three kinase genes in the 3 gene modules(CDK1,CDK4 and CDK5).A total of 39 kinase inhibitors that inhibit three kinase genes were screened out.Among them,the effect of the 20 inhibitors in the development of HNSCC is still not clear,which have the potential to be the new anti-cancer drugs.ConclusionThere are three gene modules playing the important roles in the progression and development of HNSCC.Moreover,20 kinase inhibitors may regulate HNSCC through regulating CDKs.Our finding can provide the target for the research and therapy of HNSCC.
Head and neck squamous cell carcinoma(HNSCC);Gene module analysis;Bioinformatics;Kinase inhibitor
R739.91
A
1003—6350(2017)22—3613—05
内蒙古医科大学科技百万工程项目(编号:KJbw2013014)
孙学威。E-mail:immu_sunxuewei@163.com
2017-06-12)