非小细胞肺癌是全球最常见的恶性肿瘤之一,肺腺癌和肺鳞癌是其最主要的两种类型。由于肺癌的生物学特性复杂,恶性程度高,加强不同病理亚型肺癌的病因学和发病机制研究,识别高危人群进行精准预防是当前肺癌防治的迫切需求。
遗传因素是肺癌发生的主要危险因素之一。为了筛选特异的遗传标志物用于肺癌高危人群筛查,南京医科大学沈洪兵院士团队和国内外学者在亚洲和欧美人群中开展了一系列肺癌全基因组关联分析(GWAS),共鉴定到位于51 个易感区域的81 个易感变异,但是,目前易感变异的生物学功能解析仍面临以下问题:易感变异仅为标签变异,致病变异未知;易感变异多位于基因组非编码区域,其生物学功能未知;易感区域致病基因未知等。因此,如何明确已知易感区域的致病变异和基因是“后GWAS”时期亟须解决的科学问题。
近年来,生物学技术的快速发展为解析遗传变异、基因、疾病的关联提供了强有力的工具。因此,针对上述问题,沈洪兵院士团队综合运用包括基因组、转录组和功能基因组等多种分子层面来源的高通量组学数据和生物信息学算法,首次建立肺癌易感变异和易感基因致病性的功能评价体系,并明确了相关遗传变异和基因的生物学功能。该研究结果一方面有助于解析不同病理亚型肺癌发病相关的分子生物学机制,为后续功能学研究提供线索;另一方面,该研究鉴定出的致病变异将有助于肺癌的风险预测和诊断,实现从遗传学研究到临床应用的转化。
为了系统解析肺癌易感变异的功能并揭示其影响肺癌发生的潜在易感机制,该研究首先基于27120 例非小细胞肺癌和27355 例健康对照的基因型数据进行荟萃分析,筛选肺癌易感性相关的遗传变异;随后,获取GTEx、TCGA、ENCODE、Roadmap 和FANTOM5 等数据库的基因组、转录组和表观基因组数据,并整合六种生物信息学预测算法,分别对非编码区和编码区的遗传变异进行功能评价。
该研究共纳入3064 易感变异进行分析,其中,39 个(1.27%)位于基因的编码区域;3025 个位于非编码区域,且在启动子和增强子相关的组蛋白修饰区域以及脱氧核糖核酸酶I(DNase I)超敏位点区域存在显著富集。组织病理学亚型特异的转录因子富集分析结果显示,肺腺癌特有的易感变异在转录因子上游刺激因子1(USF1)结合区域富集,而肺鳞癌特有的易感变异则在环磷腺苷效应元件结合蛋白1(CREB1)结合区域富集。变异的功能注释共定位到803 个肺癌的潜在致病基因,包括274 个肺腺癌特异的基因和123 个肺鳞癌特异的基因,提示两者的遗传易感机制存在区别。进一步的通路富集分析结果显示,肺腺癌和肺鳞癌共有的易感基因在尼古丁胆碱受体相关的通路富集,而肺腺癌和肺鳞癌特异的易感基因则分别在免疫和同源重组修复相关的通路富集。
该研究通过整合大样本人群的GWAS 数据和多个分子水平的功能基因组学数据,首次建立了肺癌易感变异和基因的功能评价体系,并揭示了尼古丁成瘾、免疫炎症和DNA 损伤在肺癌发生中的重要作用。该研究为后续肺癌遗传学病因研究提供了新的研究思路,也为解释肺癌的发生机制、筛查高危人群提供了全新的视角。
该研究发表于Frontiers of Medicine,题为Comprehensive functional annotation of susceptibility variants identifies genetic heterogeneity between lung adenocarcinoma and squamous cell carcinoma(《基于系统功能基因组学注释解析肺腺癌与肺鳞癌的遗传异质性》),论文链接为https://journal.hep.com.cn/fmd/EN/10.1007/s11684-021-0848-3。南京医科大学秦娜博士后和李远程博士为该研究的共同第一作者,沈洪兵院士和马红霞教授为该研究的共同通讯作者。(本文转载自“医学前沿FrontMed”微信公众号,有修改。)