蒋洁
【摘要】 流行病学调查显示, 甲状腺癌是人类恶性肿瘤中受遗传因素影响最高的癌症之一, 因此, 遗传学研究对甲状腺癌具有重要的意义。在此, 本文回顾与遗传变异和非家族性分化型甲状腺癌(DTC)易感相关的研究, 着重分析常见单核苷酸多态性(SNPs)的全基因组相关性研究(GWAS)。有一些SNPs位点在数十次对不同种族的平行研究中被重复鉴定出来。尽管有几个SNPs位点的累积效应与癌症风险的增加表现出明显的正相关性, 但SNPs对DTC的总体预测能力似乎非常有限。因此, 目前仅对常见的几个SNPs位点进行基因分型还不能够在临床中作为诊断参考。
【关键词】 疾病遗传易感;单核苷酸多态性;遗传位点;甲状腺癌;肿瘤
DOI:10.14163/j.cnki.11-5547/r.2020.25.091
【Abstract】 Epidemiological investigation shows that thyroid cancer is one of the most affected cancers by genetic factors. Therefore, genetic research is of great significance to thyroid cancer. This paper reviews the studies related to genetic variation and susceptibility to non-familial differentiated thyroid cancer (DTC) susceptibility, and focuses on the analysis of genome-wide association studies (GWAS) of common single nucleotide polymorphisms (SNPs). Some SNPs have been identified repeatedly in dozens of parallel studies of different races. Although the cumulative effect of several SNPs loci shows a significant positive correlation with the increase in cancer risk, the overall predictive power of SNPs for DTC seems to be very limited. Therefore, several SNPs genotypes can not be used as a reference in clinical diagnosis.
【Key words】 Genetic predisposition to disease; Single nucleotide polymorphism; Genetic locus; Thyroid cancer; Tumor
甲狀腺癌是最常见的甲状腺恶性肿瘤, 约占全身恶性肿瘤的1%。以恶性度较低、预后较好的乳头状癌最常见, 除髓样癌外, 绝大部分甲状腺癌起源于滤泡上皮细胞。发病率与地区、种族、性别有一定关系。任何年龄均可发病, 但以青壮年多见。绝大多数甲状腺癌发生于一侧甲状腺腺叶, 常为单个肿瘤。在过去几十年中, 甲状腺癌的全球发病率呈上升趋势。发病率的增加几乎可以完全归因于甲状腺乳头状癌(papillary thyroid carcinoma, PTC), 占70岁以下甲状腺癌患者的80%以上[1]。与PTC类似, 由滤泡上皮细胞癌变引起的滤泡甲状腺癌(follicular thyroid carcinoma, FTC)是第二大最常见的甲状腺恶性肿瘤, 其发病率约为5%。这两种类型的甲状腺癌, PTC和FTC, 被称为分化型甲状腺癌(differentiated thyroid cancer, DTC)。
目前国内甲状腺癌发病率逐年升高, 甲状腺癌发病缓慢, 恶性程度较低, 大多数患者在无意间发现颈前肿块或颈部淋巴结肿大而去医院检查, 部分患者诊断为甲状腺癌晚期。有的患者可带瘤生存数年而无任何症状, 有的却迅速恶化。甲状腺癌并不可怕, 据临床资料证实, 通过定期筛查及早发现, 45岁之前的患者基本都能治愈。甲状腺癌已成为发病率快速上升的恶性肿瘤之一, 尤其好发于中青年女性, 女性和男性比例为3∶1, 已成为近20年来我国癌症谱中女性恶性肿瘤上升速度快的肿瘤。但是早期确诊并及时接受科学规范的治疗, 95% 的甲状腺癌是可以被治愈的[2]。其中分化良好的甲状腺癌患者, 95% 可以较长期存活。同时, 甲状腺癌可以分为四种:PTC、FTC、甲状腺髓样癌(MTC)、甲状腺未分化癌(ATC)。其中PTC和FTC属于恶性程度相对较低的癌, 预后较好;MTC和ATC属于恶性程度相对较高的癌, 预后较差。这四种癌症, 无论良恶性程度高低, 都是存在扩散转移的风险的。只不过PTC扩散转移的风险相对较低, 即便转移了, 往往转移的比较局限, 能够手术切除。对于FTC、MTC、ATC来说, 其转移风险就比较高了, 而且一旦转移, 往往范围十分广泛, 难以进行有效地手术切除。
到目前为止, 有几个增加DTC风险的因素已经被确定。根据其性质的不同, 风险因素大致可分为可改变因素和不可改变因素。可改变因素包括生活方式、低碘饮食、环境因素和频繁的医疗监测等。不可改变因素主要有性别(女性患甲状腺癌的几率是男性的3倍)、年龄(40~70岁)、家族史(良性或恶性甲状腺疾病家族史)、种族、遗传综合征和遗传易感性等。该综述作者回顾了与遗传变异和非家族性见单核苷酸多态性(single-nucleotide polymorphisms, SNPs)与DTC的关系。
1 人类基因组DTC
SNP被定义为个体与个体之间的DNA序列中某一个核苷酸的变化。美国国家生物技术信息中心(NCBI)dbSNP数据库记录了6.608亿个基因突变, 而人类基因组中只有32亿个碱基对, 也就是说平均每5~10个核苷酸中就会出现一次变异, 这显然是不正确的。事实上, dbSNP数据库包含了所有关于短基因变异的全部信息, 而不仅仅是SNPs。有些突变可能是多余的, 或者出现频率非常低的, 因此它们不一定在每个人身上都能找得到, 或者可能仅适用于某一特定的种族。据估计[3], SNPs在个体中出现的频率应该在0.3%~1%。
在数据库中, SNP被指定为“rs1234567890”, 其中“rs”代表“参考SNP(referenceSNP)”, “1234567890”可以是任何两位数或更长的数字。如果SNP在人群中出现的频率为>1%, 通常被称为“常见(common)”, 而那些不太常见的则被称为“罕见(rare)”。SNPs是最常见和最容易检测到的遗传变异类型, 这使它们成为遗传相关性研究的热点之一。
2 遗传相关性研究的类型和方法
遗传变异(如SNPs)可能直接导致某种疾病, 也可能赋予生物体某种新的功能。遗传相关性研究的目的即是鉴定基因突变与某种可定量的性状(如体重、身高、血压等)或某种表现型的出现或消失(如肿瘤, 包括DTC等)之间的相关关系。复杂疾病的遗传学研究目的是探索与发现正常生命过程中某种潜在的病理状态, 通过发现与鉴定某些潜在的治疗靶点和生物标记物指导临床研究, 并最终将其应用于疾病的预防或个性化的疾病诊断和治疗优化, 改善疾病预后。
自2000年以来, 已发表的关于甲状腺癌的遗传学研究总数约为500项, 在遗传变异与DTC易感的相关性研究方面取得了广泛进展。从历史的角度看, 遗传相关性研究已经经历了几代人。最开始在大约100个样本中分析1~2个SNPs, 然后在几百个样本中分析更多的SNPs, 再然后在接近1000个样本中分析更多符合流行病学设计的SNPs。最新的研究已经可以看到投入大量资金, 包括几千个甚至数万或数十万的参与者的列队研究。增加样本量对通过统计学方法来检测中、弱关联信号至关重要的。
一般来说, 遗传相关性研究可以分为基于假设的研究和不基于假设的研究。第一种类型的研究被称为“目标基因方法”, 主要研究有限数量的基因与某一途径或某一功能之间的关系。由于这类研究中的SNP数量从几个到几百个不等, 因此可采用低通量到中通量聚合酶链式反应技术进行基因分型。这一类SNPs与甲状腺癌的相关性研究包括RET基因的3个SNP位点、肿瘤蛋白p53的1个SNP位点、6个DNA损伤相关基因的9个SNP位点、突变型共济失调毛细血管扩张症(ATM)与叉头盒E1(FOXE1)的2个SNP位点、43个切尔诺贝利甲状腺癌患者的DNA修复相关基因的141个SNP位点, 以及在97个涉及甲状腺细胞分化和增殖的基因和在甲状腺癌组织中差异表达的基因中被标记的和有假定功能的768个SNP位点的研究分析[4]。
非假设依赖型研究不对疾病中可能涉及的基因或途径做出假设, 而是在基因组水平进行基因分型, 这种研究方法被称为全基因组相关性研究(gnome-wide association studies, GWAS)。使用现代人类SNP芯片, 如Affymetrix芯片可以同时检测大约100万个SNPs, 而Illumina平台可以同时检测大约400万个SNPs。下一代测序(next-generation sequencing, NGS)技术理论上可以在DNA样本中检测到所有的SNPs。
靶基因研究和GWAS研究通常都有典型的病例对照设计。SNPs与疾病的相关性研究通常有两个或两个以上的阶段。第一阶段, 也称为“发现阶段”, 是在相对较小的样本中对全套SNP进行基因分型(例如SNP芯片), 目的是确定所有有统计学意义的SNP集合。第二阶段, 称为“验证阶段”, 是在一个相对较大的独立样本中采用单轨迹分析方法分析第一阶段中确定的SNPs, 目的是分离并确定具有统计学显著性的SNPs。验证步骤也可以在另一个独立的病例/对照样本中再次重复, 以进一步缩小目标SNP的范围。
研究的每一个阶段都需要进行统计分析, 通常是做卡方检验或Logistic回归分析。对不同阶段的分析结果进行联合分析最终通常以优势比(OR)的置信区间和P值来表示。用于遗传相关性研究的统计方法现在已经很成熟, 分析很精确, 包括多重比较对照、群体分层、相关性分析和技术质控等。一般情况下, P=5×10-8被认为是标准GWAS的合理阈值[5]。
3 DTC的主要GWAS研究结果
大多数靶基因研究都能够鉴别出一个或几个与DTC相关的SNPs(P<0.05)。但是, 这些研究通常关联信号相对较弱, 结果混杂, 重现性差, 或缺乏因果证据。截至目前, 针对DTC的GWAS相关性研究已有7個[6]。样本的数量(包括病例组和对照组)从2000~28万不等, 研究结果的OR值在1.2~2.1的范围内。2q35染色体上的rs966423位点位于DIRC3基因中, 其功能尚未确定, 但被认为是一个假定的肿瘤抑制基因。8p12染色体上的SNP rs2439302位于编码neuregulin 1的NRG1基因的第1个内含子上, neuregulin 1是一种人类表皮生长因子受体3(HER3)的配体。在甲状腺癌细胞中, NRG1在HER2/HER3二聚体存在的条件下可激活MAPK和AKT信号通路。rs966513位于FOXE1基因上游约60 kb处, 是第1个被多个实验室报道, 也是作用最强的与甲状腺癌易感起决定性作用的SNP, 其功能相关性直到最近才被证实[7]。rs966513和其他几个与rs966513连锁不平衡的位于9q22.33染色体上SNPs, 共同构成一种新的甲状腺特异的多基因非编码RNA基因, 其染色体定位与FOXE1启动子序列部分重叠, 能够通过改变远端增强子的活性来调节FOXE1和PTCSC2的转录。rs965513和rs1867277共同参与FOXE1和PTCSC2的转录调控。rs965513与正常甲状腺组织中的FOXE1、未剪接的PTCSC2以及促甲状腺激素受体(TSHR)表达降低相关[8]。因此, FOXE1除了具有甲状腺特异转录因子的作用外, 还可能具有抑癌的作用。在一项功能研究中, 在14q13.3染色体上的rs944289能够调控具有抑癌特性的lincRNA基因PTCSC3在甲状腺癌细胞株中的表达[9]。恢复细胞系中PTCSC3的表达能够抑制细胞生长, 并且影响相应基因的表达, 包括:①DNA复制、重组修复、基因表达、氨基酸代谢[10];②细胞运动、肿瘤形态、细胞死亡;③细胞的装配与组织、细胞功能和组织形态网络[11]。值得注意的是, rs944289 (PTCSC3)和rs2439302 (NRG1)不仅与甲状腺癌相关, 还与滤泡腺瘤相关[12]。这表明PTCSC3和NRG1可能参与甲状腺肿瘤的发生过程。14q13.3染色体可能包含不止一种易诱发甲状腺癌的遗传变异。有研究显示[13], 与血清促甲状腺激素水平和甲状腺恶性肿瘤相关的SNP rs116909374可能与MAP3K12结合抑制蛋白1(MBIP)基因有关, 其产物能调控JNK信号通路, 该通路参与多种人类癌症的细胞内信号转导, 其中就包括甲状腺恶性肿瘤。
4 风险SNPs的累积效应和预测能力
一些主要风险SNPs的累积效应已经在不同的人群群体中被研究。其中最强的有5个SNPs, 包括rs966423(DIRC3)、rs2439302(NRG1)、rs965513(PTCSC2/FOXE1)、rs944289(PTCSC3/NKX2-1)和rs116909374 (MBIP1)[14]。统计学分析认为, 每增加一个等位基因, 甲状腺癌的发生几率在美国俄亥俄州增加1.51倍, 在波兰增加1.35倍。而同时存在7个或者更多的风险等位基因将甲状腺癌的发生几率增加到10倍左右[15]。在一项意大利的DTC研究中, 研究人员测试了12个SNPs, 携带14个或更多风险等位基因的人比携带7个或更少基因的人患癌症的几率高8倍[16]。
然而, 出乎意料的是, 高度显著的SNP对DTC的预测能力非常有限。当对俄亥俄州和波兰的研究群体进行特征分析时, 曲线下面积(area under curve, AUC)分别为71%和61% [17]。一项国内的研究发现AUC比例在54%~60%[18]。此外, 这5个SNPs仅解释了俄亥俄州约11%的DTC家族风险, 而在波兰约6%。在中国人口中, 基于SNPs数据的总体家族相对风险为5.98%。在意大利, 12个SNPs只能解释约4%的DTC风险, 而FOXE1 SNP单独不到1%。这些发现与在家族系列医学流行病学调查中获得的遗传因素对甲状腺癌风险的影响的估计(约20%~50%)形成了强烈的反差。
5 讨论
在对甲状腺癌易感性的遗传学分析方面的显著进展已经鉴定出了几个显示显著关联信号染色体位点。其中rs966423(DIRC3)、rs2439302(NRG1)、rs965513(PTCSC2/FOXE1)、rs944289(PTCSC3/NKX2-1)、rs116909374(MBIP1)的重现性最好。一些研究不断发现新的目标SNPs, 其中一些还可能有种族特异性。虽然尚未完全了解所有遗传变异影响的确切生物学机制, 但相关性信号的高统计学意义清楚地表明它们与甲状腺癌的发生的相关关系。毫无疑问, 还有更多的SNPs可能导致甲状腺癌的遗传易感性, 但除非是非常大的队列研究, 否则它们的影响将很难在统计学上检测出来。
SNP研究结果与DTC易感的多因素多基因模型是一致的。在临床中, 基因分型的目标是能够对甲状腺癌的发生进行风险估计。这些预测需要在统计学上足够有说服力, 从而能够用于患者的咨询, 甚至用于甲状腺癌症患者的个性化治疗或预后, 以及对其他正常个体进行甲状腺癌风险的前瞻性评估。显然, 这一点目前作者还做不到。但这也更加说明作者需要更多更广的甲状腺癌的遗传相关性研究, 从而不断缩小医学流行病学调查和遗传流行病学研究之间对遗传易感估计的差异。
作者认为, 未来在以下两个主要方面需要进行进一步的研究。首先, 应该将不太显著的和罕见的SNP、非SNP的遺传信息、种族和环境等因素纳入研究范畴。NGS技术的进步将会在很大程度上助力这方面的研究。然而, 如果研究设计和计算方法不能并驾齐驱, 大量高通量研究数据也不可能提高作者对复杂疾病遗传学的理解。因此, 第二个主要的研究方向将包括更好地定义疾病的表型(即不仅仅是简单的DTC分型, 还应包括对肿瘤形态和肿瘤侵袭特征的分析), 以及代谢通路、生物网络方向的研究。这些研究将对多因素引起的复杂疾病非常有帮助, 可以用来估计许多个可能协同作用的基因-环境和基因-基因相互作用的影响。总之, 为了更好地进行个性化疾病风险预测, 作者仍有许多有待发现的地方。
参考文献
[1] Hińcza K, Kowalik A, Kowalska A. Current Knowledge of Germline Genetic Risk Factors for the Development of Non-Medullary Thyroid Cancer. Genes (Basel), 2019, 10(7):482.
[2] Hwangbo Y, Park YJ. Genome-Wide Association Studies of Autoimmune Thyroid Diseases, Thyroid Function, and Thyroid Cancer. Endocrinol Metab (Seoul), 2018, 33(2):175-184.
[3] Stephens LA, Powell NG, Grubb J, et al. Investigation of loss of heterozygosity and SNP frequencies in the RET gene in papillary thyroid carcinoma. Thyroid, 2005, 15(15):100-104.
[4] Rogounovitch TI, Saenko VA, Ashizawa K, et al. TP53 codon 72 polymorphism in radiation-associated human papillary thyroid cancer. Oncology Reports, 2006, 15(4):949-956.
[5] Akulevich NM, Saenko VA, Rogounovitch TI, et al. Polymorphisms of DNA damage response genes in radiation-related and sporadic papillary thyroid carcinoma. Endocrine-related cancer, 2009, 16(2):491.
[6] Damiola F, Byrnes G, Moissonnier M, et al. Contribution of ATM and FOXE1 (TTF2) to risk of papillary thyroid carcinoma in Belarusian children exposed to radiation. International Journal of Cancer, 2014, 134(7):1659-1668.
[7] Lonjou C, Damiola F, Moissonnier M, et al. Investigation of DNA repair-related SNPs underlying susceptibility to papillary thyroid carcinoma reveals MGMT as a novel candidate gene in Belarusian children exposed to radiation. Bmc Cancer, 2017, 17(1):328.
[8] Landa I, Ruiz-Llorente S, Montero-Conde C, et al. The variant rs1867277 in FOXE1 gene confers thyroid cancer susceptibility through the recruitment of USF1/USF2 transcription factors. PLoS Genet, 2009, 5(9):e1000637.
[9] Dudbridge F, Gusnanto A. Estimation of significance thresholds for genomewide association scans. Genet Epidemiol, 2008, 32(3):227-234.
[10] Gudmundsson J, Sulem P, Gudbjartsson DF, et al. Common variants on 9q22. 33 and 14q13. 3 predispose to thyroid cancer in European populations. Nat Genet, 2009, 41(4):460-464.
[11] Takahashi M, Saenko VA, Rogounovitch TI, et al. The FOXE1 locus is a major genetic determinant for radiation-related thyroid carcinoma in Chernobyl. Hum Mol Genet, 2010, 19(12):2516-2523.
[12] Gudmundsson J, Sulem P, Gudbjartsson DF, et al. Discovery of common variants associated with low TSH levels and thyroid cancer risk. Nat Genet, 2012, 44(3):319-322.
[13] 殷德涛, 马润声, 李红强, 等. 卷曲螺旋结构域67蛋白和B细胞淋巴瘤/白血病-2蛋白在甲状腺乳头状癌中的表达及临床意义. 中华实验外科杂志, 2017, 34(6):1023-1026.
[14] 王源源, 林向得, 傅星淏, 等. 长链非编码RNA BANCR对甲状腺乳头状癌干性的影响. 中华实验外科杂志, 2019, 36(8):1405.
[15] 包刚, 李兴, 潘卫, 等. 甲状腺癌相关基因1在乳腺癌组织的表达及对乳腺癌细胞增殖凋亡的影响及机制. 中华实验外科杂志, 2018, 35(8):1523-1525.
[16] 李红光, 赵利红, 张振华, 等. 黏蛋白1基因调控酪氨酸蛋白激酶/信号转导与转录激活因子3信号通路抑制甲狀腺癌细胞增殖及促进细胞凋亡机制. 中华实验外科杂志, 2017, 34(11):1889-1891.
[17] 李晓娜, 李玉杰, 董玉科, 等. 微小RNA-451靶向巨噬细胞游走抑制因子调控甲状腺癌细胞增殖、凋亡的机制. 中华实验外科杂志, 2017, 34(6):956-958.
[18] 张利芳, 蔡琳, 王云华, 等. 硒蛋白P基因多态性与乳头状甲状腺癌发病风险的关联性分析. 吉林大学学报(医学版), 2020, 46(2):383-388.
[收稿日期:2020-06-30]