高靓,权磊
(1.天津体育学院,运动与健康研究院,天津 300381;2.天津市和睦家医院 全科门诊,天津 300221)
癌症是严重危害人类健康的世界性问题。预测表明全球癌症发病将呈现迅猛态势增长,2025 年递增至1900 万人,而2035 年将达到2400 万人。加快实现癌症病人的危险性预测以及个体化预防和治疗,具有重大的科学意义和临床价值[1]。
近年来,越来越多的研究表明非家族性癌症在受遗传因素的调控。与家族性癌症不同,非家族性癌症是一种多基因现象,因而并不遵循孟德尔遗传定律。虽然单个易感性基因的作用较弱,但由于数量众多并且基因多态在人群中分布广泛,多个易感性基因可协同对癌症危险性产生巨大的影响[2]。在英国的一项研究中所报道的,人群中易感性最强的20%女性与易感性最弱的20%女性相比,患乳腺癌的危险性高出了近40 倍[3]。显然,对高危人群进行有针对性地监测和预防,对于有效的控制癌症发病具有重要意义。
通过全基因组拷问的方式,GWAS 对常见的DNA变异在癌症患者和相匹配的健康人群中的分布频数进行比较,以发现与癌症危险性相关的遗传位点。许多相邻的DNA片段彼此连锁,基于这种连锁不平衡原理,选取约30 万个标签单核苷酸基因多态(SNP)即可有效地覆盖整个基因组[4]。目前,全基因组关联研究已经对所有常见癌症进行了分析,并发现几百个不同类型癌症的易感性位点。在大肠癌、乳腺癌和前列腺癌中所发现的多个易感性位点的联合作用,已经展示了一定可用于病人风险等级判别的潜力[5]。
然而,目前已知的易感性位点尚不能精确的预测个体的癌症危险性,而新的易感性基因的发现也遇到了瓶颈,这与全基因组关联研究本身的一些局限有关[6]。首先,GWAS 通常采用双阶段研究的方法,这种研究方式在降低基因型鉴定成本的同时,必然会忽略一部分潜在重要的SNP 的信号。其次,随着国际GWAS 联盟组织的成立,许多研究开始使用纯粹的荟萃分析来提升样本数量和统计学威力,整合不同平台产生的基因型数据可能导致错误发现。第三,目前所发现的大部分影响癌症危险性的SNP 并非真正改变蛋白质序列的功能性遗传变异,而是与之相连锁的标签多态。最后,虽然GWAS 实验设计会尽量对癌症患者和健康人群进行年龄、性别和生活习惯等方面的匹配,并不能精确地控制环境因素的影响,并且GWAS 的实验设计很难探测到罕见基因多态、结构性基因多态、或是对基因与基因间的相互作用。
小鼠与人类基因组高度同源,被广泛应用于解读人类基因功能、疾病机理和药物开发等方面的研究[7]。其优势主要在于小鼠的遗传结构相对简单,实验过程中环境因素可控,可以根据需要增加样本数量而提供较强的统计学威力。在小鼠中进行遗传定位一般包括四个步骤(图1),即选取抵抗性和易感性的鼠种进行杂交;将F1 代相互杂交,产生基因分离;在上百只F2 代小鼠中诱发肿瘤并行表型鉴定(肿瘤数量、肿瘤体积等),使用遗传标记对每只F2 小鼠进行基因型鉴定;通过对表型和基因型的连锁研究定位癌症易感性位点,并进行后期的候选基因发现。
图1 小鼠F2 遗传定位的基本原理
利用小鼠模型发现各个器官中的癌症易感性基因,进而验证其人类同源基因对癌症危险性的影响,已有被验证可行。例如,Ptprj 基因是小鼠大肠癌易感性位点Scc1 的候选基因,后被确认同样影响人类大肠癌易感性。有趣的是,后续研究发现Ptprj 的人类同源基因对人类乳腺癌的易感性也有显著影响[8]。这些现象支持了癌症易感性基因多元性(Pleiotropy)理论。
迄今为止,癌症易感性研究多在单一器官中进行。目前国内外关于多器官癌症易感性的研究仅限于个例性的报道。例如,位于8q24.21 位点的几个相互连锁的SNP 可能通过调节MYC 基因的表达来影响前列腺癌和大肠癌等多种癌症的易感性。以5p13.3(TERT)为代表的一些与端粒功能相关的位点同时影响超过10 种不同癌症的危险性[9]。以肺癌和大肠癌为例,我们的前期研究证明这两种癌症的易感性具有显著的相关性。我们将目前在人类、小鼠和大鼠中全基因组关联研究或连锁研究中所发现的全部159 个肺癌和大肠癌易感性基因映射到小鼠染色体上。只有16 个基因单独分布,而其他90%的基因组成了41个短基因簇,其中36 个基因簇同时包含了肺癌和大肠癌易感性基因。这些数据一方面说明癌症易感性基因在人类、小鼠和大鼠中高度保守,证明了这些基因的稳定性和强效性;另一方面揭示了肺癌和大肠癌易感性基因之间高度显著的连锁关系,可能代表相同或功能及物理位置高度相近的基因[10]。
综上所述,癌症的全基因组联锁研究革新性地扩展了我们所知的癌症易感性基因和相关的分子作用机理与通路。利用动物模型作为补充,可以发现更多的易感性基因。我们和其他实验室的证据均支持癌症基因多元性的存在,未来可能产生单一器官和多器官相结合的全新的癌症研究模式。