张荣娟,于颖彦
(上海交通大学医学院附属瑞金医院,上海消化外科研究所,上海200025)
癌相关基因主要包括两大类,即原癌基因与抑癌基因。在自然或实验条件下原癌基因的活化或者抑癌基因的失活具有诱导细胞恶性转化功能。癌相关基因的表达调控异常是细胞癌变中的重要事件。在癌相关基因转录调控中,转录调控蛋白作为反式作用因子(trans acting factors)与基因自身的顺势作用元件(cis acting elements)相互作用,实现对基因转录水平的调控。故深入研究癌相关基因的反式作用因子,有助于我们解析癌相关基因的表达调控机制,从而为以基因干预为目的的靶向治疗提供有价值的理论依据。
酵母单杂交法(Yeast one hybrid,Y1H)是研究DNA与蛋白质相互作用的一种方法,它借助于酵母细胞内的报告基因表达分析,识别与DNA相结合的蛋白。同时,由于酵母属于真核细胞,利用该系统获得的基因表达调控蛋白可以较好的体现真核细胞基因表达调控的真实状况。真核细胞基因表达受转录因子的调控,转录因子具备与DNA相结合的结合域(Binding domain,BD)和转录激活结构域(Active domain,AD)。酵母单杂交的主要原理是:酵母细胞内的GAL4蛋白是一种典型的转录因子,GAL4有DNA结合域和激活酵母半乳糖苷酶的上游激活结构域,而激活结构域又可与RNA聚合酶或转录因子TFIID相互作用,从而增强RNA聚合酶的转录促进活性。研究人员需要将含有目的基因转录调控区DNA的报告质粒整合到酵母基因组,产生带有目的基因的酵母报告株;然后将酵母转录因子GAL4的DNA结合域置换为cDNA文库编码基因,只要文库编码基因表达的蛋白能与目的基因DNA转录调控区相互作用,便可通过转录激活结构域激活RNA聚合酶,启动酵母细胞内报告基因的转录(图略),使该报告酵母株在选择性培养基内得以存活。利用Y1H系统检测到的DNA结合蛋白质是处于自然构象,克服了体外研究时蛋白质通常处于非自然构象的缺点。但该方法也存在插入的靶基因可能会与酵母内源性转录激活因子相互作用的假阳性结果,或者酵母表达的转录激活域融合蛋白(Gal4AD)在酵母内不能稳定地表达或发生错误折叠等假阴性结果。Y1H技术主要用于钓取已知基因的转录调控蛋白,或者鉴定DNA结合蛋白的DNA结合域。Yang等利用酵母单杂交在人乳腺组织cDNA表达文库成功筛选到四个孤儿核受体,发现该类受体在调控人乳腺组织芳香酶的表达中发挥重要作用[1]。NGAL(Neutrophil gelatinase-associated lipocalin)基因是食管癌相关新基因,以该基因的NF-kappa B元件核心序列作为诱饵,在人食管癌细胞系SHEEC的酵母杂交cDNA文库中钓取到5类DNA结合蛋白,为探讨NGAL基因表达调控机制奠定了基础[2]。已有多个研究小组通过酵母单杂交技术筛选到DNA结合蛋白[3,4]。
噬茵体展示技术(Phage display)于1989年由Winter和Lernerd研究组创立。最初主要用于抗体筛选,但亦可以用来鉴定蛋白质-DNA相互结合。噬茵体展示技术的原理是:将外源DNA片段插入合适的噬菌体外壳蛋白基因,由噬菌体表达被修饰后的融合蛋白,但不影响和干扰噬菌体的生活周期,同时可保持外源基因表达蛋白的天然构象。成军课题组应用噬菌体展示技术在人肝细胞cDNA文库中筛选到与cyclin B2和iNOS基因启动子相结合的蛋白,揭示了上述基因的转录调控机制[5,6]。以上研究的成功经验为癌相关基因DNA结合蛋白的筛选提供了可借鉴经验。
生物信息学(Bioinformatics)是通过TRANSFAC或Mat-Inspector等软件平台对基因转录调控序列进行分析,预测可能的DNA结合蛋白。具体作法是:输入靶基因以及转录起始点上游足够长序列(一般需要超过2 000 bp),递交数据库后系统会输出一系列信息,如启动子域、转录起始点、相匹配的转录因子结合域、基因多态性(SNP)等,还可与PubMed链接查看相关研究发表。但该方法只能提供已知蛋白质的信息,无法发现全新的、蛋白质数据库内不存在的DNA结合蛋白质。Palumbo等利用Mat-Inspector平台筛选到MA2、RXR、PU.1以及VDR等转录因子在c-myb GGA重复区域的多个结合位点,并在EMSA和DNAaseⅠ足迹分析中得到验证[7]。Li等利用Mat-Inspector平台发现位于SPARC第三内含子的SATB1结合位点,并利用ChIP实验得到证实[8]。
mRNA展示技术(mRNA display)又称为mRNA-蛋白质融合体展示技术,它是一种新型的、不依赖于细胞转染的体外展示技术(In vitro display),该技术使得基因文库容量及筛选效率都获得大幅度提高。目前已成为可用于分离具有特定化学或生化特性的多肽和蛋白质的最佳方法之一。mRNA展示技术的原理是:化学合成兴趣蛋白或小肽段的DNA文库,并在DNA的5'端添加T7 RNA聚合酶启动子、翻译增强子和翻译起始密码子等序列,在3'端添加亲和纯化标签。在体外利用T7 RNA聚合酶将DNA转录成RNA,把RNA的3'端和嘌呤霉素连接子结合,带有嘌呤霉素连接子的诱饵RNA和RNA文库在无细胞系翻译体系中共翻译,mRNA与其所翻译的蛋白质结合起来形成mRNA-蛋白质融合体,再利用翻译蛋白所带的亲和标签,用亲和层析技术将mRNA-蛋白质融合体纯化出来,并对mRNA进行反转录,生成cDNA-mRNA-蛋白质融合体。采用ELISA,磁珠法等将筛选的靶物质固定于固相载体上,含有猎物蛋白的cDNA-mRNA-蛋白质融合体通过与固相载体上的靶物质特异性结合而得到分离,通过洗脱液将猎物cDNA-mRNA-蛋白质融合体洗脱下来,加酶分解得到cDNA,将其进行数轮PCR,富集和分离猎物蛋白质。日本学者Yanagawa等利用TPA反应元件为诱饵在基因文库中筛选到多个DNA结合蛋白异二聚体复合物如 c-jun、c-fos、junD、junB、atf2、b-atf,表明 mRNA展示技术可以在一个实验中鉴定多个DNA结合蛋白复合物[9]。
EMSA是一种可定性和定量鉴定蛋白质与特定核酸序列的结合的技术,目前已成为转录因子研究的经典方法。其基本原理是:将蛋白质与末端标记的核酸探针结合,通过电泳凝胶时,这种与蛋白质结合的复合物比未与蛋白结合的探针相比,其在凝胶中的泳动速度减慢,即表现为迁移速度相对滞后。还可通过加入特异性的抗体来检测特定的蛋白质,从而验证结合的特异性。其缺点是由于许多转录调控蛋白有相似或相同的DNA结合位点,故这种体外分析获取的结果不一定能真实反映体内转录调控蛋白和DNA的结合状况。姜安丽等对NKX 3.1基因上游的30bp序列进行EMSA分析,在不同肿瘤细胞株核蛋白提取物检测到转录调控蛋白质,初步揭示了不同肿瘤细胞系中有不同的结合蛋白,提示了不同肿瘤之间基因调控机理的差异[10]。Wu等通过EMSA和ChIP分析,研究了Vimentin不同顺式元件的调控蛋白质,揭示了它们在肿瘤发展过程中的意义[11]。Park等通过EMSA技术揭示了ERT与TGF-βRⅡmRNA表达沈默的机制[12]。Gorshkova等应用EMSA技术识别了GATA-6与NF-Y联合调控K-ras在肺癌发生中的作用[13]。
ChIP是鉴定与特定蛋白结合的基因序列或者鉴定与特定基因区域结合的蛋白质的有效方法。包括由核酸酶消化的非变性染色质免疫共沉淀(NChIP)和甲醛或UV光交联的变性染色质免疫共沉淀(XChIP)两种手段。NChIP采用未变性的染色质进行实验,利用内切核酸酶消化细胞核裂解液,使染色质成碎片,利用单克隆抗体将结合有某蛋白质的染色质片段选择性的进行免疫沉淀,再利用PCR方法进行DNA扩增及序列分析。该技术主要用于与DNA高亲和力的组蛋白及其修饰体研究,如组蛋白甲基化、乙酰化修饰分析。XChIP则先将染色质进行变性处理,如向细胞核裂解液加入甲醛,或者利用UV辐射(260nm)以及紫外线照射[14],使DNA与蛋白质发生交联,然后利用超声波将染色质破碎成小片段,再用特异性抗体将蛋白质-DNA复合物进行免疫共沉淀,最后逆转交联后分析沉淀的 DNA。ChIP的缺点是需要细胞数量大,限制了其在稀有细胞样本如干细胞或组织活检样本研究中的应用。基于芯片的染色质免疫共沉淀(ChIP on-chip)技术是鉴定全基因组范围内蛋白结合位点,在整体水平识别某转录因子的靶基因方法。Hatzis等利用ChIP-on chip分析了TCF4(Wnt信号通路转录因子)在全基因组的染色质结合情况,并通过模序识别算法(motif discovery algorithms)揭示出TCF4结合位点为进化上保守的A-C/G-A/T-T-C-A-A-A-G模序[15]。
DNA足迹分析是一种可以精确检测蛋白质在DNA上的结合位点的实验方法,有DNA酶Ⅰ足迹分析和硫酸二甲酯足迹分析两种,其中以DNA酶Ⅰ足迹分析常用。其基本原理是:DNaseⅠ可以随机水解核苷酸序列中的磷酸二酯键,将DNA切成单核苷酸;而结合有蛋白质的DNA则可免于被DNaseⅠ水解,在变性凝胶电泳的放射自显影图片上,相当于蛋白质结合部位会出现一空白区域,与对照组核苷酸序列条带区相比较,此空白区恰似一足迹占据了部分核苷酸序列位置。通过与对照组的核苷酸电泳条带对比,可以精确读出与该蛋白质结合位点的核苷酸序列[16]。Li等利用EMSA和DNA酶Ⅰ足迹法分析了消化道肿瘤AFP基因的转录调控蛋白,在启动子与增强子区鉴定出七个C/EBP结合位点,提出了C/EBP调节AFP基因表达的直接证据[17]。
该方法原理是:经UV辐射的DNA可把转录调控蛋白与其顺式元件以共价键方式连接,从而选择性地标记与DNA特异性结合的DNA结合蛋白,以这种方式标记的转录因子能在变性SDS-聚丙烯酰胺凝胶电泳的放射自显影下显示DNA结合蛋白的对应位点。该方法在定量蛋白质研究中具优势,它可以依靠变性胶将交联的DNA结合蛋白分离开来,从而直接测定相互作用蛋白的分子量以及结合的蛋白总量,还可检测到在EMSA中所看不到的微量蛋白。这为测定蛋白质与DNA的亲和力及调控基因表达的能力提供了重要方法[18]。
将DNA结合蛋白表达载体与启动子报告基因载体共同转染细胞模型,通过细胞内荧光素酶报告基因的表达强度来鉴定该DNA结合蛋白对启动子的调控作用。利用siRNA下调DNA结合蛋白的表达或过表达DNA结合蛋白来验证与报告基因转录水平的关系。该方法优点在于灵敏度高且速度快;但也可因转染效率不高或不能收集长期的实验数据而受到限制。已有多个研究小组利用酵母单杂交技术筛选出与启动子DNA结合的蛋白,并通过瞬时共转染、siRNA干扰等手段进行了反式作用因子对启动子表达的功能分析[19,20]。
综上所述,DNA结合蛋白在癌相关基因的表达调控中发挥着重要作用。DNA结合蛋白与蛋白之间、DNA结合蛋白与靶基因之间的相互作用决定了靶基因的表达。掌握以上DNA结合蛋白的识别方法,将为肿瘤相关基因的功能研究提供重要的技术支撑。
[1]Yang C,Yu B,Zhou D,Chen S.Regulation of aromatase promoter activity in human breast tissue by nuclear receptors[J].Oncogene,2002,21:2854.
[2]牛永东,许丽艳,韩溟方.酵母单杂交筛选人食管癌细胞系SHEEC中NF-kappa B元件结合蛋白[J].癌变.畸变.突变,2006,18(4):310.
[3]Bayarsaihan D,Ruddle FH.Isolation and characterization of BEN,a member of the TFII-I family of DNA-binding proteins containing distinct helix loop helix domains[J].PNAS,2000,97(13):7342.
[4]Li M,Xie YH,Kong YY,et al.Cloning and Characterization of a Novel Human Hepatocyte Transcription Factor,hB1F,Which Binds and Activates Enhancer II of Hepatitis B Virus[J].J Biol Chem,1998,273(44):29022.
[5]郭 江,成 军.应用噬菌体展示技术筛选细胞周期素B2启动子DNA的结合蛋白[J].解放军医学杂志,2005,30(12):1049.
[6]成 军,钟彦伟,刘 妍.噬菌体展示技术筛选诱导型NOS基因启动子DNA结合蛋白的研究[J].解放军医学杂志,2005,30(4):290.
[7]Palumbo SL,Memmott RM,Uribe DJ,et al.A novel G-quadruplex-forming GGA repeat region in the c-myb promoter is a critical regulator of promoter activity[J].Nucleic Acid Res,2008,36(6):1755.
[8]Li K,Cai R,Dai BB,et al.SATB1 regulates SPARC expression in K562 cell line through binding to a specific sequence in the third intron[J].Biochem Biophys Res Commun,2007,356(1):6.
[9]Tateyama S,Horisawa K,Takashima H,et al.Affinity selection of DNA-binding protein complexes using mRNA display[J].Nucleic Acids Res,2006,34(3):e27.
[10]姜安丽,张鹏举,胡晓燕.NKX 3.1基因上游一个30 bp负调控区结合蛋白的初步鉴定[J].山东大学学报(医学版),2005,43(5):375.
[11]Wu Y,Diab I,Zhang X,et al.Stat3 enhances vimentin gene expression by binding to the antisilencer element and interacting with the repressor protein,ZBP-89[J].Oncogene,2004,23:168.
[12]Park SH,Kim YS,Park BK,et al.Sequence-specific enhancer binding protein is responsible for the differential expression of ERT/ESX/ELF-3/ESE-1/jen gene in human gastric cancer cell lines:Implication forthe loss of TGF-b type II receptorexpression[J].Oncogene,2001,20:1235.
[13]Gorshkova EV,Kaledin VI,Kobzev VF,et al.Codon 12 Region of Mouse K-ras Gene Is the Site for in vitro Binding of Transcription Factors GATA-6 and NF-Y[J].Biochemistry(Moscow),2005,70,10:1180.
[14]Zhang L,Zhang K,Prandl R,et al.Detecting DNA-binding of proteins in vivo by UV-crosslinking and immunoprecipitation[J].Biochem Biophys Res Commun,2004,322:705.
[15]Hatzis P,van der Flier LG,van Driel MA,et al.Genome-Wide Patternof TCF7L2/TCF4 Chromatin Occupancy in Colorectal CancerCells[J].Mol Cell Biol,2008,28(8):2732.
[16]Bohmann D,Bos TJ,Admon A,et al.Human proto-oncogene c-jun encodes a DNA binding protein with structural and functional properties of transcription factor AP-1[J].Science,1987,238(4832):1386.
[17]Li HM,Ikeda H,Nakabayashi H,et al.Identification of CCAAT enhancer binding protein alpha binding sites on the human alpha-fetoprotein gene[J].Gene,2007,389(2):128.
[18]MolnarG,O'Leary N,Pardee AB,et al.Quantification of DNA-protein interaction by UV Crosslinking[J].Nucleic Acids Res,1995,23(16):3318.
[19]Lin KM,Zhao WG,Bhatnagar J,et al.Cloning and expression of human HBP1,a high mobility group protein that enhances myeloperoxidase(MPO)promoter activity[J].Leukemia,2001,15:601.
[20]Nagarajan P,Onami TM,Rajagopalan S,et al.Role of chromodomain helicase DNA-binding protein 2 in DNA damage response signaling and tumorigenesis[J].Oncogene,2009,28:1053