姚新生 (遵义医科大学免疫学教研室,遵义 563003)
TCR/BCR的V(D) J基因体细胞重排主要依赖于重组激活基因(recombination-activating genes,RAG)酶等对重组信号序列(recombination signal sequences,RSSs)的识别、剪切和连接,RSSs由12 bp 或23 bp的非保守间隔子(spacer)、分离保守的7聚体(heptamer)和9聚体(nonamer)组成,分别称为12RSSs(7-12-9)和23RSSs(9-23-7),体内V(D) J重组一般只发生在12RSSs~23RSSs间,即重组“12/23规则”[1-3]。
RSSs中,heptamer的保守或共识序列为CACAGTG,noname的保守或共识序列为ACAAA-AACC,V(D)J重组分为两个阶段,第一阶段为DNA的识别和剪切,第二阶段为DNA的分裂和结合,钝的信号末端形成闭环链接,编码末端按共价密封连接形成重排产物[3-5]。
RSSs侧翼的基因片段是等效参与重组的,但多项研究证实,抗原选择前的V(D)J重组并非随机重排,保守的heptamer、noname序列、规则的12 bp/23 bp 间隔子长度、RSSs的近端/远端重组基因间距等与V(D)J取用频率密切相关,形成V(D)J表达频率差异的TCR/BCR组库[6-11]。T、B细胞发展抗原与配体自我耐受选择和克隆增生应答导致V(D)J取用频率进一步改变[12-14]。
因体内RSSs对TCR/BCR初始重排中V(D)J 取用影响极为复杂,现有研究多数集中于外周细胞系,体内的影响效果和机制尚未阐明。外周TCR/BCR组库V(D)J取用频率和抗原的关系、初始重组导致V(D)J取用差异,导致外周TCR/BCR组库的机制与意义研究结论存在偏差。
TCR/BCR的多样性源于体胚系V(D)J基因在体细胞水平上的重排,重排的发生由2个重组基因上非编码“特殊DNA序列”引导,此“引导序列”在脊椎动物的进化过程中高度保守,被命名为RSSs,每个RSSs由12 bp或23 bp的非保守间隔子分离保守的7聚体和9聚体组成,12RSSs组成为:heptamer-12 bp spacer-nonamer(7-12-9),23RSSs组成为:nonamer-23 bp spacer-heptamer(9-23-7)。
TCR/BCR重组基因片段中,各V基因片段的3′端和各J基因的5′端各进化出1个RSSs,各D基因的5′端和3′端分别进化出1个RSSs,以人TCR/BCR的V(D)J为例,进化所形成的RSSs特征如下:IGHV-7-23-9、9-12-7-IGHD-7-12-9、9-23-7-IGHJ、IGKV-7-12-9、9-23-7-IGKJ、IGLV-7-23-9、9-12-7-IGLJ、TRBV-7-23-9、9-12-7-TRBD-7-23-9、9-12-7-TRBJ、TRAV-7-23-9、9-12-7-TRAJ、TRDV-7-23-9、9-12-7-TRDD-7-23-9、9-12-7-TRDJ、TRGV-7-23-9、9-12-7-TRGJ;D基因进化中,人IGHD的两端RSSs均为9-12-7,而TRBD两端RSSs分别为9-12-7和7-23-9;V基因进化中,IGKV的RSSs为7-12-9,其他V基因的RSSs均为7-23-9;J基因进化中,IGKJ和IGHJ的RSSs为9-23-7,而其他J基因的RSSs均为9-12-7。此差异是如何进化而来及其对重组的意义为何尚未阐明。同一个重组基因片段及其RSSs间可能存在不同的进化模式,具有不同的进化起源[15,16]。人TCRα和TCRδ的重组基因分散于同一条染色上的,Haynes等[17]研究发现TCRδ IG轻链片段具有相似的CDR2序列,提示其可能存在相似的进化历史。
RSSs中保守的heptamer序列组成为CACA-GTG,保守的noname序列为ACAAAAACC,规则的间隔子长度为12 bp或23 bp。但不同物种间和不同的V(D)J重组基因,其RSSs组成多数并非“保守”和“规则”,heptamer、nonamer、spacer的碱基序列在相同或不同的位点上多数存在1个以上碱基突变。同一物种V(D)J的多个等位基因上,其7-12-9或9-23-7组成存在差异,即1个个体的2条等位基因上V(D)J的RSSs可能是不同的,如人IGHJ5 基因片段目前发现2个等位基因:IGHJ5*01(登陆号:M25625)和IGHJ5*02(登陆号:X97051),IGHJ5*01 RSSs组成为:GTTCTTTGT-21 bp spacer(CGGGGTCTGGCATTGTTGTCACAATGTG),IGHJ5*02 RSSs组成为:GTTCTTGCC-22 bp spacer(TGGGGTCCTGGCATTGTTGTCACAATGTG),V(D)J基因片段的多样性和RSSs组成和特征的复杂性导致体内系统研究RSSs对V(D)J重排效率影响较为困难。RSSs主要通过与RAG蛋白相互作用启动并调控V(D)J重排,在B和T细胞发育过程中,RAG1/2蛋白复合物在保守重组信号序列(RSS)处切割DNA,启动V(D)J重组,RAG1/2也能催化含有RSS的底物转位链转移至靶DNA,形成支链DNA中间产物(发夹形成或去除转位的供体DNA),重组遵循“12/23规则”和“B 12/23 规则”,以人IGH的V(D)J中RSSs为例,重组仅发生在D-J和V-D之间[1,2,18,19]。
RSSs进化的组成特征中,heptamer总是直接相邻V(D)J基因,2个重组基因片段的heptamer末端以头对头的方式连接形成精确的“信号接头”,2个重组基因片段的编码端形成不精确的“编码接头”。参与重组识别、剪辑、连接的蛋白主要有:RAG1、RAG2、异二聚体(heterodimer)Ku70-Ku80、DNA依赖性蛋白激酶(DNA-dependent protein kinase,DNA-PK)、DNA连接酶Ⅳ (DNA ligase Ⅳ,XRCC4)、脱氧核苷酸末端转移酶(terminal deoxynucleotidyl transferase,TdT) 等[15,16]。
RSSs调控重组过程的效率和机制研究多数在体外细胞系中进行,通过分析RAG和RSSs的结合率、监测RSSs断裂末端及发夹形成等过程进行分析[20,21]。
根据脊椎动物进化过程中hepatamer与nonamer的保守碱基序列组成以及目前所获取的不同物种、不同重组基因、不同个体的等位基因组成和特征(均存在1个或以上的碱基突变),可通过体外人工突变技术对部分碱基进行研究,发现hepatamer与nonamer对重组中V、J的利用具有重要影响。
Hesse等[9]与Steen等[22]研究发现,在V(D)J重排过程中,heptamer对发夹的形成起关键作用,heptamer或将heptamer整体突变将无法形成发夹。通过DNA回文序列上的heptamer组成分析发现,heptamer的7个碱基中,连接位点附近的3个核苷酸(GTG/CAC)在BCR和TCR基因中几乎100%保守,其他位点的核苷酸仅63%~86%保守,可转变为其他核苷酸,但并不会失去底物活性,当heptamer最后4个位点的碱基顺序改变时,重组基因形成刻痕和发夹的效率降低至少2倍。当保留heptamer,但用随机序列替换nonamer,发现仍能检测到刻痕和发夹形成,但DNA分裂显著减少,提示准确的切割(刻痕和发夹形成)主要依赖于heptamer,尤其是前3个位点的碱基组成。尽管研究发现heptamer前3个碱基突变后依然能与RAG1和RAG2结合,但刻痕和发夹形成明显减少,推测heptamer的作用机制可能直接参与DSB形成的化学步骤,第1位和第3位碱基的突变反式形成减少[9,22]。Ramsden等[23]认为heptamer作用效率依赖于nonamer,nonamer在重排的初始绑定后,heptamer才能发挥作用。
为详细探讨人heptamer的7个位点碱基组成及各位点碱基的作用和效果,Akamatsu等[24]研究提示,heptamer前3个碱基突变将降低重组的连接率,与重组位点相邻的第1个碱基最为重要,但重组位点的特异性和前3个碱基较小,与野生型相比,当heptamer 7-1G处突变后,体外实验无法检测到重排;当heptamer第2位点(7-2T)和第3位点(7-3G)突变,可检测到重组水平分别为0.5%和0.6%;当heptamer第5位点G残基突变为C(7-5C)时,重组水平下降至5.9%;当heptame其余残基突变时,重组水平下降至28.5%~52.0%[10]。Nagawa等[20]通过检测5种heptamer突变体,发现heptamer中第1和第2位点的突变减少发夹的形成。heptamer的作用依赖于规则的12和23间隔子,Akira等[11]通过构建包含合成RSSs的重组底物,并导入Pre-B细胞系,发现如果满足12碱基和23碱基间隔子规则,两组heptamer(CACTGTG)和(GGTTTGT)序列都能引起V(D)J连接,但当heptamer序列中1个位点突变,将显著减少重组的发生。
nonamer调控V(D)J重组的效果和方式同heptamer区别较大,Akamatsu等[10]发现,nonamer调控V(D)J重组,主要依赖于nonamer中的“A-rich core”,3个连续的A碱基是形成有效重组的必要条件,且两侧的核苷酸需要多个碱基才能满足重组酶测量heptamer和nonamer距离的要求,以满足12/23 bp间隔子规则启动重排,当nonamer中心位点碱基发生突变,如9-4G(A变为G),重组频率仅下降至对照组的27.3%,9-5C(A变为C)时下降为10.4%,双突变(9-3G/4G)时下降至19.3%,双突变(9-6G/7G)时下降至26.0%。但当9-4G/5C和9-5C/6G双位点突变,未检测到重组发生[10]。对于nonamer的“A-rich core”不同位点碱基的突变研究结果,Akamatsu等[10]认为第5位点处A碱“A-rich core”最为重要。而Hesse等[9]认为第6位点处A碱基最为重要。Steen等[22]发现保守的nonamer(ACAAAACC)序列中单个碱基位置的改变可能影响V(D)J重组中DSB水平,其中第5个位点突变只对DSB有中等影响,第6个位置突变会显著降低突变反式DSB水平,结果和Hesse等[22]一致。nonamer侧翼碱基位点突变对V(D)J重组影响的研究中发现,C突变为A(9-2A)时,重组频率降低至对照水平的2.7%;C突变为T(9-2T)时,频率下降至12.9%;C突变为G(9-2G)时,频率保持为61.3%;当2个C残基均改变为G(9-8G/9G)时,重组频率为65%;当两个C残基都变为A(9-8A9A)时,频率下降至0.1%以下。提示以上侧翼C碱基可能在重组酶测量heptamer和nonamer间距离时起重要作用[10,24,25]。同时,nonamer除保守位置外的其他位点突变可导致重组DNA分裂水平降低[9,26]。
在heptamer和noname调控V(D)J重组的研究中机制,重组主要来源于其与RAG间的相互作用。Jessica等[27]发现只有RAG1/2最初组装在单个RSS上的复合体才能导致12RSS-23RSS组合,激活分裂;Nagawa等[20]发现nonamer突变体可能通过DNase I 影响其和RAG1相互作用,部分nonamer突变能清除RSS-RAG1的相互作用;Agrawal等[28]发现RAG1与noname中的特定碱基相互作用,且相互作用延伸至相邻的间隔子,但未阐明RAG2和RSS存在交互作用,RAG1对heptamer的保护是局部的,只有在12RSS和23RSS间形成突触复合体后,才能稳定地与RAG蛋白相互作用。Ramsden等[23]认为RSS中单个成分具有不同功能,nonamer在RAG蛋白的结合中起重要作用,而有效的刻痕和发夹形成则需要heptamer序列,heptamer对分裂的化学步骤至关重要,在信号编码边界周围裂解DNA是启动V(D)J组合的必要条件。Difilippantonio等[29]发现RAG1蛋白中的Hin结构域与RSS的nonamer相互作用,参与V(D)J重组。
Hesse等[9]利用质粒将DNA导入Pre-B细胞,证明重组独立于任何特异染色体背景,包含heptamer-nonamer的84 bp和42 bp侧翼鼠基因片段均能发生重组,提示V(D)J重组对位点的拓扑排列相对不敏感。Hiroshi等[30]发现CpG甲基化对RAG1/RAG2和RSS的反应产生影响,直接和间接控制V(D)J分裂。
“12/23 规则”是V(D)J重组的必要条件,不同物种、不同重组基因、不同个体等位基因研究发现,RSSs的12 bp或23 bp长度存在至少1个碱基突变,而spacer的碱基序列存在不同的组成,12/23 spacer长度和序列调控V(D)J重组的效率和机制已被广泛研究。
12和23 间隔子的长度改变对V(D)J重组的影响研究中,Akamatsu等[10]发现在11 bp的RSSs中,重组频率下降至野生型的7.7%,在12 bp RSSs中加入1个C碱基(13RSSs),重组频率为11.0%,当添加2个C碱基(14RSSs)时,未能检测到重组的发生,提示RSSs长度在重组效率中关键作用。Akira等[11]发现23 bp和12 bp2种间隔子长度(21 bp/22 bp/23 bp /24 bp与11 bp/12 bp/13 bp)的组合变化将减少重组的发生;Steen等[22]发现 23 间隔子长度中,1个核苷酸(23 bp+1 bp)改变,in cis和in trans均适度地减少了DSB的形成;如果改变间隔子长度超过1个核苷酸(23 bp-2 bp和23 bp-3 bp),将严重减少和突变反式分裂;如果12 bp和23 bp同时改变(12 bp-3bp/23 bp-3 bp),将无法检测到DSB的发生;如果将heptamer(H-6G、H-7T)、间隔子加1 bp和nonamer(N-5G)进行组合改变,突变反式的高效重组中DSB的形成将严重减少。Ramsden等[23]发现nonamer距离heptamer 18 bp或29 bp时,将干扰heptamer分裂,无nonamer情况下可观察到刻痕,但发夹形成减少,nonamer和heptame间隔34 bp时,重排中两者依旧存在协作关系。
12/23 spacer序列的改变对V(D)J的影响较为复杂,Fanning等[31]通过改变IGKV的12RSSs(CTACAGACTGGA)的第5位碱基,将其由A变为C(CTACCGACTGGA)时,与其重组的IGKJ 23RSSs(GTAGTACTCCACTGTCTGGCTGT)不变,突变的近端RSSs使用频率从54%降低至37%,提示RSSs间隔序列影响V(D)J的重组较率。Montalbano等[32]认为间隔子序列在RSS的重组效率中起重要作用,主要发生在RAG结合RSSs之后,间隔序列中的单碱基突变能显著影响其重组效率,通过研究非常规的RSSs(12RSSs第6、11、12位分别为ATCG时,23RSSs第3、5、8、11、21位分别为GTTGT时)发现,与保守RSSs相比,其结合RAG蛋白的效率降低2倍。
Larijani等[33]发现间隔子中的某些位置存在适度守恒,间隔子序列变化可能影响重组频率改变为6倍以上;Steen等[22]发现12RSSs 3种突变(12-1T、12-1A和12-1G)将会取消顺突变重组中DSB形成。Akira等[11]发现,当12RSSs的间隔子被转换为人工序列时(GATCGATCGATCS),重组效率不变,间隔子序列影响重组基因频率的作用有限。
Feeney等[34]认为,体内间隔序列中发生自然变异可能有助于体内观察人V基因的非随机使用,人V基因间隔子序列中随机产生的变异导致其重组效率降低;Nadel等[8]认为间隔子序列是引发重排频率的决定因素,体外不同人V、K基因片段重组率可能与其在体内的Pre-B细胞中的重排频率相关。Posnett等[35]直接根据外周V基因家族相对应T细胞的比例发现,人TRBV3的2个等位基因在RSSs的23 bp spacer间隔区内的1个单核苷酸位点存在“C/T”差异,导致外周血中TRBV3细胞变化,TRBV3等位基因为纯合子“T”个体,TRBV3细胞数为8.1%,杂合子个体(C/T)TRBV3细胞占比为4.7%,等位基因为纯合子 “C”个体平均TRBV3细胞数为1.2%,提示间隔区序列改变影响重组效率。在12和23间隔子调控的机制上。Joydeep等[36]认为RAG蛋白检测V(D)J分裂的步骤,初始RAG结合可能发生在含有12 bp或23 bp间隔子的RSSs上。
重组V(D)J基因片段分散于染色体,重组的2个基因片段来源于同一条染色体上不同位置,重组的首要条件为RAG对单RSSs的识别后,按“12/23”规则寻找配对的目标RSSs基因片段。研究证实参与重组基因片段近端和远端配对的基因表现出不同的重组效率[37-39]。
Yancopoulos等[7]在前B细胞系的研究体系中发现大多数IGHJ近端的IGHV基因片段优先用于V(D)J重排,表明IGHV基因片段的重组频率受其在染色体上位置影响,在前B细胞(初始库)中表达与成熟B细胞群具有显著差异;Perlmutter等[40]发现胎儿杂交瘤系来源的Pre-B细胞选择到DJH重排的IGHV基因片段具有偏向性,多数IGHJ近端的IGHV基因片段被优先使用。Reth等[41]发现B细胞系初始HD和HJ重排使用了更多的3′D段,但一旦形成1个HD-HJ复合物(DJ替代重排)后,则优先使用最多的5′D段。
Feeney等[42]发现V(D)J重排中,远端区域V基因重排频率较低,86个cDNA序列中只有2个来自远端,51个非有效性DNA序列中3个来自远端区域,但IGKJ近端和远端基因片段重排无显著区别;Malynn等[43]发现在胎儿发育早期,IGHV序列具有明显偏差,且可持续至出生后5~7 d。成人骨髓B细胞初始库中,IGHJ近端的IGHV基因片段存在表达优势,提示成人脾脏B细胞IGHV差异主要来源于初始重排时的选择,而不是重排后表达频率改变造成的差异;Raaphorst等[44]发现胎儿胸腺和肝脏、骨髓、脾脏和脐血中TCRβ CDR3区域中,TRBJ2.1具有较高的利用频率,可能与其靠近D或V有关。
TCR/BCR的多样性是适应性免疫应答研究的核心,V(D)J基因片段的表达频率与自身耐受的选择及克隆增生的应答关系备受关注,但初始TCR/BCR组库中,V(D)J参与重组的取用差异较为复杂,进展较少甚至被忽略,导致外周TCR/BCR研究V(D)J取用的意义和机制研究出现偏差。
随着高通量测序对体内T/B细胞组库(CDR3受体库)解析的进展,近年来,本课题组对比分析人和鼠中枢及外周T/B细胞CDR3组库,对功能性基因、假基因、RSSs等参与重排的效率和取用原则进行了初步探讨,可为体内研究V(D)J重组提供基础数据和新的技术[45-47]。目前,关于RSSs和V(D)J的进化、个体等位基因的多样性、重排调控的机制及初始库与生理/病理应答的关系等的研究较少,有待进一步研究。