常 伟,丁明翠,王 威,*
(1.平煤神马医疗集团总医院疾控中心,河南平顶山 467002;2.郑州大学公共卫生学院劳动卫生与职业病学教研室,河南 郑州 450001)
细胞周期蛋白H(cyclin H,CCNH)是细胞周期蛋白大家族的一名成员,普遍存在于真核细胞中,其基因位于染色体5q14.3。CCNH可以催化周期蛋白依赖性激酶2(cyclin-dependent kinases 2,CDK2)等多种CDK活化,并与周期蛋白依赖性激酶7(cyclindependent kinases 7,CDK7)共同对细胞周期和基因转录进行合理调控,从而影响细胞的增殖。CCNH可以与CDK7、辅助蛋白(menage a trois 1,MAT1)组成CDK7/CCNH/MAT1三聚体复合物[1],即人类的细胞周期素依赖性蛋白激酶(CAK)。CAK可以使P53、RNA聚合酶2(RNA polymerase 2,RNA2)、甾体激素受体等磷酸化,从而调节转录和DNA的损伤修复,促使细胞分裂增殖,最终调控恶性肿瘤的发生与发展。从功能而言,CCNH是CAK的调节亚基,也是细胞周期调控蛋白的关键蛋白之一。细胞周期调控的异常与肿瘤的发生密切相关,有研究表明,CCNH基因rs3093816位点与口腔癌的发病密切相关[2];也有研究发现,CCNHVal270Ala(rs2230641)与高分化甲状腺癌发病风险相关,杂合型和突变型基因型频率越高,发病风险越高[3]。越来越多的研究表明,CCNH基因多态性与非小细胞肺癌[4]、骨恶性肿瘤[5]等多种肿瘤的发生发展有关。
目前对于单核苷酸多态性(single nucleotide polymorphism,SNP)的检测有很多方法,包括动态等位基因特异性杂交(dynamic allele-specific hybridization,DASH)[6]、荧光标记探针(fluorescently labeled probes)技术[7]、和聚合酶链式反应-限制性片段长度多态性技术(polymerase chain reaction-restrition fragment length polymorphism,PCR-RFLP)[8]等。尽管上述方法各有其自身的优势,但是由于实验方法复杂,仪器设备比较昂贵,使它们的应用受到了限制。其中,PCR-RFLP技术因其高灵敏度和可靠性而广泛应用于人类基因多态的检测。然而,PCR-RFLP技术不适合高通量筛选,目前仍面临着实用性的挑战。通过查询NEB网站(http://www.neb-china.com/)可知,CCNH基因rs3093816位点没有相应的内切酶可以识别,在本研究中,我们采用一种改进的PCR-RFLP法检测CCNH基因rs3093816位点。应用创造酶切位点(creat restriction site,CRS)原理[9],再结合PCR-RFLP方法设计引物,选择廉价的内切酶CviQ I,对CCNH基因rs3093816位点进行了检测。同时,本研究设计了碱基错配PCR长引物和碱基错配相对短的PCR引物,比较分析碱基错配长PCR引物是否更快速经济。
采集某企业160名职工体检的健康人群外周血,采用DNA提取试剂盒提取基因组DNA后进行CCNH基因型的检测。参与本研究的研究对象均签署了知情同意书。本研究已获得郑州大学公共卫生学院伦理委员会审批(ZZUIRB2021-80)。
1.2.1 试剂DNA提取试剂盒,购于北京百泰克生物技术有限公司;1×PCR mix购于南京诺唯赞生物科技有限公司;限制性内切酶CviQI购于Thermo Scientific公司;引物和琼脂糖购于生工生物工程上海股份有限公司。
1.2.2 仪器9600型PCR仪购于PE公司;微型电泳槽购于Phamacia Biotech,EPS1000;GelDoc2000凝胶成像仪购于Bio-Rad公司。
创造性酶切位点PCR-RFLP(creat restriction site-PCR-RFLP,CRS-PCR-RFLP)是根据引物碱基错配技术设计的检测碱基突变的方法。其原理是根据单碱基突变位点的碱基替代情况设计引物,其中一条引物根据突变位点临近序列设计,人为引入错配碱基,使得引物3′端和单碱基突变的一种突变型在PCR扩增后形成一个酶切位点,然后应用相应的内切酶进行酶切鉴定。
在NCBI网站(http://www.ncbi.nlm.nih.gov)查找CCNH基因及其SNP信息,结合有关文献确定CCNH基因rs3093816位点碱基变异信息,利用Primer Premier 5.0软件分析内切酶识别情况,通过创造性酶切位点的方法引入新的酶切位点来识别变异。
1.4.1 序列搜索与多态位点确定结合网站信息及有关文献可确定CCNH基因rs3093816位点为C/T多态,位于第5号染色体,在基因组中的位置为87401570。
1.4.2 序列分析与引物设计经序列分析可知C/T多态没有相应的内切酶可以识别,如通过碱基错配PCR将多态位点前第3位碱基T替换为G,则该多态可由内切酶RsaI及其同工酶CviQ I识别,本研究选择较便宜的CviQ I内切酶,即C等位基因可被CviQ I内切酶及其同工酶RsaI识别并切开,而T等位基因不能被切开。
本实验根据上述分析应用CRS-PCR-RFLP原理设计引物。首先利用Primer Premier 5.0软件分析内切酶识别情况,根据序列情况确定上游引物的位置与长度,然后搜索合适的下游引物,选定引物见表1。
表1 长引物和短引物基本信息
取50 ng的基因组DNA 1μL,上下游引物各0.3μL(均为0.2μmol/L),1×PCRmix 7.5μL(包括4种dNTP混合物、Taq DNA聚合酶和镁离子),与双蒸水组成15μL反应体系。PCR反应条件为首先94℃预变性5 min,然后94℃变性30 s,Tm(短引物取46℃,长引物取58℃)下退火30 s,72℃延伸30 s,共30个循环后72℃延伸5 min。PCR产物在2%琼脂糖凝胶上进行电泳,用凝胶成像仪观察结果。取PCR产物10μL,加入10 U内切酶和2.5μL 10×酶切缓冲液和ddH2O组成25μL反应体系,37℃水浴中酶切过夜,电泳35 min和55 min后,用凝胶成像仪观察成像。
PCR产物测序采用sanger双脱氧链终止法,委托生工生物工程上海股份有限公司完成。
经知情同意后采集某企业160名职工体检的健康人群外周血,提取基因组DNA后进行CCNH基因rs3093816位点基因型的检测。CCNH基因rs3093816位点野生型TT 59例(36.88%),杂合型CT 76例(47.50%),突变型CC 25例(15.63%)。该基因多态分布经Hardy-Weinberg检验,P=0.949,符合Hardy-Weinberg平衡,说明所选取的样本具有代表性。
CCNH基因rs3093816位点长引物扩增后总长度为164 bp,经CviQ I酶切后可出现164、126、38 bp等3种片段(其中38 bp由于分子量较小,条带弥散,在电泳图中未显示)。酶切后基因型分别为:突变型CC为164、38 bp,杂合型CT为164、126、38 bp,野生型TT为164 bp。CCNH位点短引物扩增后总长度为259 bp,经CviQ I酶切后可出现259、240、19 bp等3种片段(其中19 bp由于分子量较小,条带弥散,在电泳图中未显示)。酶切后基因型分别为:突变型CC为240、19 bp,杂合型CT为259、240、19 bp,野生型TT为259 bp。酶切图谱见图1,表2。
表2 碱基错配长PCR引物和碱基错配相对短PCR引物法比较
图1 CCNH基因rs3093816位点PCR产物经Cvi Q I内切酶酶切后的电泳图
使用碱基错配长PCR引物和碱基错配相对短PCR引物法检测CCNH基因rs3093816位点。使用3%的琼脂糖凝胶电泳35 min后,长引物对应的扩增产物经CviQ I酶切后,3种基因型条带完全分开,清晰可分辨;短引物对应的扩增产物经CviQ I酶切后,3种基因型条带尚未完全区分开,特别是泳道4对应的杂合型基因型尚不能分辨。直到电泳时间达到55 min时,短引物对应的扩增产物经CviQ I酶切后,3种基因型条带才完全分开,清晰可分辨。
琼脂糖凝胶电泳结果发现CCNH基因rs3093816位点出现野生型TT、突变型CC和杂合型CT 3种基因型。对上述3种基因型的PCR产物进行测序鉴定,CCNH基因rs3093816位点3种类型的基因PCR产物测序结果跟预期结果完全一致。测序结果见图2。其中,方框内的字母对应多态碱基,单下划线的碱基为错配碱基,从而与前面的碱基共同形成酶切位点,与预期结果一致。
图2 CCNH基因rs3093816位点测序分析结果
经序列分析可知CCNH基因rs3093816位点没有相应的内切酶可以识别,本研究通过创造性酶切位点PCR-RFLP方法在CCNH基因rs3093816位点扩增产物中引入新的酶切位点,成功建立了碱基错配PCR引物法检测CCNH基因rs3093816位点。常规设计引物长度为15~30 bp,本研究设计的长引物长度为40 bp,两个片段长度差异约占总长引物长度的23%,所占比例高于短引物(8%)。据我们所知,PCR-RFLP方法中几乎没有使用过长PCR引物。本研究同时设计了碱基错配长PCR引物和碱基错配相对短PCR引物,比较分析碱基错配长PCR引物是否更快速经济。与短引物法相比,长引物占扩增总片段的比例越大,酶切产物越容易区分,凝胶电泳需要的时间越短。此外,长引物法的Tm值较高,特异性较好。
通过查询PubMed SNP数据库显示,本研究测得的正常人群的CCNH基因rs3093816位点多态性分布与在亚洲人群中分布一致。有研究显示,CCNH基因rs3093816位点与口腔癌的发病风险升高有关,且GG基因型携带者的发病风险升高两倍[10]。另有研究发现CCNH基因rs3093816位点T等位基因携带者发生肺癌的风险升高[11]。我们可以通过检测基因多态性位点筛选易感人群,因此,SNP的检测也变得越来越重要。SNP常用的检测方法有DNA测序[12],TaqMan分析[12],荧光标记探针技术[13],PCR-RFLP[14]等。DNA测序是一种精确的基因分型方法,但成本较高。TaqMan探针技术最突出的优点是它不需要PCR分离或洗脱等后处理过程,从而提高检出率。但TaqMan探针荧光背景较高,且探针只有一个碱基的差异,结果容易出现假阳性;分子信标被标以不同颜色的荧光染料来实现多个SNP的同时检测。然而,适合荧光标记的染料比较少,这大大限制了检测通量[15]。
因为PCR-RFLP容易掌握,且具有较高的灵敏度和可靠性,所以在SNP检测中得到广泛的应用。本研究采用创造性酶切位点PCR-RFLP法成功建立了碱基错配长引物法检测CCNH基因rs3093816位点,PCR产物纯度比较高,酶切结果也容易分辨,通过测序验证进行验证,结果准确可靠。更加拓宽了该方法的应用范围,具有很大的灵活性和应用前景,特别适用于基层单位的检测。
综上所述,我们成功建立了碱基错配长PCR引物法检测CCNH基因rs3093816位点,此方法具备简经济快速的特点,可广泛用于大规模样本分析。