郭艳丽,李可强,白少川,王 涛,王德贺,王 麒,李兰会*
(1.河北农业大学动物科技学院,保定 071000;2.河北科技师范学院动物科技学院,秦皇岛 066004;3.河北省畜牧兽医研究所,保定 071001)
禽白血病病毒E亚型(ALV-E)属于内源性白血病病毒。ALV-E是第一个被发现的内源逆转录病毒,与外源性禽白血病病毒A、B、C、D等亚群具有相似结构,由外源白血病病毒入侵宿主逆转录整合在鸡基因组中。鸡基因组中至今已发现400余种ALVEs,其不仅影响家禽生产,更是种鸡白血病病毒净化的严重阻碍,另外还造成人用鸡胚生物制品的潜在危害。ALV-E不仅自身表达,还能与其他病毒重组生成如ALV-J等新病毒亚型,造成肉鸡淋巴白血病、蛋鸡传染性肿瘤等严重病变[1]。有实践证明,马立克病毒或其疫苗能诱导处于沉默状态的ALVE-1、ALVE-21活化表达,诱发淋巴瘤[2]。本文对ALVE的结构与整合分布进行综述,并分析其对宿主功能的影响,为深入探究ALV-E的表达调控机制以及家禽白血病净化提供参考依据。
ALV-E属于长末端重复(LTR)逆转座子,具有典型的基因组结构特征:5′LTR-gag-pol-env-3′LTR,长度约7.5 kb。LTR长270 bp左右,是ALV-E在宿主细胞表达的调控中心,含有启动子、增强子、聚腺苷酸化位点等调控元件[3-4]。5′LTR发挥启动ALV-E基因组转录功能,而3′LTR在外源禽白血病病毒RNA逆转录整合到宿主基因组后形成(图1),发挥聚腺苷酸化信号功能而终止转录。LTR由U3、R和U5共3个不同区域组成,U3和U5分别是基因组两末端的复制,R是RNA末端的短重复。U3-R边界区为转录起始位点,U5区包含剪接供体(SD)位点。LTR的两末端存在双核苷酸反向重复(5′TG和3′CA),在其整合位点上、下游产生4~6 bp的靶位点重复序列(TSD)[3]。有研究发现,5′LTR的启动子活性是3′LTR的50倍,王麒等[5]发现ev21的5′LTR启动子活性是3′LTR的8倍以上,Cullen等[6]指出活化的5′LTR存在时,3′LTR不能有效启动转录。尽管3′LTR在病毒自身转录中无启动子活性,但原病毒顺式整合在myc基因上游,myc的转录被3′LTR启动而失去细胞自身的调控[7]。
图1 ALV-E在宿主基因组整合示意图Fig.1 Schematic diagram of ALV-E integration in host genome
gag、pol和env是ALVE的3个结构基因。gag编码病毒结构的核心组分-衣壳(p27,CA)、基质(p19,MA)和核衣壳(p12,NC)蛋白,pol编码逆转录酶(RT,其表达是逆转录病毒活性的标记)和整合酶(IN),env编码病毒附着和渗透的功能表面糖蛋白(SU)和跨膜糖蛋白(TM)[8]。Polypurine tract(PPT)是邻3′LTR的U3域的一段多嘌呤RNA序列,在逆转录和DNA正链合成中发挥引物结合位点作用,之后引物脱离生成完整的原病毒双链DNA,正链合成发动是逆转录病毒复制的关键环节。
p27序列完整的ALV-E表达p27蛋白,种禽的白血病净化基于p27抗原检测,所以ALVE的表达造成白血病净化的假阳性。ALVE-1、ALVE-3、ALVE-21和ALVE-TYR都具备完整的p27基因,除ALVE-1不表达外,其他3个在商品鸡中都有表达[9],尤其是ALVE-21具备完整的病毒基因组序列,有表达完整病毒的风险[10-11]。尽管这些ALV-E的env序列完整性更高,但其表达可能受miR-155完整靶标结合位点的抑制。
ALV-E在鸡基因组中的整合位点称为ev基因座,随着生物测序技术的广泛应用,上千个ev基因座被发现,构成约3%的鸡基因组序列[3]。除ALV-E完全净化品系外,所有鸡都携带有完整或缺陷的ev,每只鸡平均整合5种ev,并遵循孟德尔遗传规律垂直传播[12-16]。家禽的高强度选择降低了ev的整合率,Mason等[17]发现商品蛋鸡的整合率低于肉鸡和地方鸡;褐壳蛋鸡一般整合6~11个,肉鸡有13~30个;90.3%的ev整合数量变异来源于品系内,白来航鸡的ALV-E整合数量最少,最多6个,其中ALVE-1、ALVE-3、ALVE-9和ALVE-15的整合频率最高[17-18]。
商品蛋鸡ALV-E的低整合揭示其与生产性能的负相关关系,选育过程中剔除了有害整合。因此,建立ev的快速完全检测方法,降低ALV-E在鸡基因组中的整合频率,对于提高家禽生产和管理水平是非常必要的。传统的检测方法为限制性内切酶切割鸡基因组,再用Rous-associated virus type 2(RAV-2)探针杂交的RFLPs检测,但ALV-E的多拷贝性使RFLP应用受到限制,而且不能满足批量样品的快速检测需求。PCR检测方法虽然简单,但面对大规模的商业检测仍显不足,并且存在识别不完全性的缺点。基因组数据的爆炸性增长使荧光标记快速PCR技术得到规模应用,obsERVer作为识别WGS数据中新型ERV整合的高通量生物信息管道,其应用使ALV-E的净化成为可能[17]。Mason等[17,19]利用obsERVer分析8个品系蛋鸡的全基因组数据,鉴定出20个ALVEs;在57个WGS数据库中发现322个ALVEs整合位点;407个地方鸡WGS中发现850个新的ALV-E整合位点,使ALV-E的数量增加到1 300个以上。
外源病毒倾向于整合在宿主染色体开放区域,尤其编码基因附近,但只有26.7%的ALV-E整合于基因内,远低于51.8%的随机整合概率[15];并且基因内整合倾向于内含子,1.5%的外显子整合比率低于4.9%的随机概率;而在编码基因上、下游10 kb区域有显著富集,8倍于随机整合概率(32.9%vs. 4.1%)[17,20]。另外,整合位点区域碱基构成存在AT偏倚(59.0%),而鸡基因组序列的AT比率为57.1%,但ALVEs的TSD具有49.9%的GC构成,远高于42.9%的基因组平均水平[21]。这些都表明了ALV-E整合的宿主基因组区域偏向性,人工或自然选择剔除了其在鸡基因内的有害整合。
ALV-E的宿主基因组定位以及结构特征的识别对揭示ALV-E的宿主基因调控效应具有基础地位,另外,病毒基因组的完整性及其表达水平对宿主调控作用均有影响。Mason等[17]发现18个ALVEs(5.6%)整合在鸡CR1(chicken repeat1)元件中。葛琳涵等[22]发现ev21整合位点侧翼区存在3个突变,其中C>T突变和8个碱基(AGTTAGTT)插入起到正调控作用,polyA起到了负调控作用。C>T突变的C等位基因增加了CDC2、CDC25C、CCNA2转录因子结合,可能发挥细胞分化抑制作用与ev21的细胞肿瘤致毒性病变有关[23-24],从而导致宿主癌变致死。T等位基因增加了EN、GR、PR-alpha和AR转录因子的结合,EN发挥转录抑制作用可能与宿主细胞ev21的低转录表达及其低细胞毒性有关,GR、PR-alpha和AR的转录结合与宿主细胞的免疫调节、抗应激有关[25-27],保证了ev21与鸡宿主的共进化表达。C型的启动子活性显著高于T型,推断在C型侧翼区启动ev21高转录从而细胞癌变致死毒性,导致此类宿主全部致死,而只有ev21整合在侧翼T等位基因下游的个体存活繁衍。
Chang等[10]发现,TYR基因的ALV-E整合与其侧翼polyA连锁,而没有ALV-E整合的侧翼区不存在polyA,但红原鸡存在。这也表明,polyA可能抑制ALV-E的表达,发挥负调控作用。Wallace等[28]对人全基因组数据分析发现,46个内源病毒位点整合与侧翼SNP存在连锁关系。基因组数据分析揭示,ERVs一般反向整合于功能基因外部,与随机整合理论矛盾,可能由于正向整合对典型剪切信号存在潜在干扰,揭示宿主自身强的净化选择效应。
鸡基因组中大约有500个相对完整的ev位点,如:ev1、ev2、ev7、ev9、ev12、ev18和ev21等,其中ev1、ev7和ev9不具感染性。有些ALV-E具备编码完整感染病毒的能力,能够按典型的传染路径感染宿主;很多序列完整的ALV-E元件由于超甲基化或者位置效应而失活,但大部分由于内部短缺只产生感染病毒粒子,或缺乏自我复制必需的编码基因(env),或只是“单LTR”,“单LTR”的拷贝数大约是相对完整结构的60倍[20]。
LTR区是ALV-E的表达调控中心,外源禽白血病病毒LTR是小型强启动子和增强子活性区,可以启动病毒和邻近基因的高表达,感染细胞的病毒RNA量可占细胞总RNA的20%[29]。LTR区的Y-box是ALV-E转录启动子活性必需的,CCAAT元件发挥增强子功能,CArG盒子通过生长因子调节LTR活化。ALV-E的LTR区短于外源禽白血病病毒,缺失U3区的CCAAT等增强子元件,但包含1个拷贝的Y-box和CArG启动子元件,还有核心聚合酶II启动子元件(如TATA盒),而外源病毒有多个拷贝的Y-box、CCAAT元件。ALV-E与外源白血病病毒相比致瘤性弱化,可能与其LTR区增强子/启动子元件的缺失有关。ALVEs间的主要区别在于LTR的U3区,U3区包含TATA盒(TATATAA)、多聚A加尾信号(AATAAA)、M-CAT元件(CATTCCA)、CCAAT盒子(ATTGG)等,以及位于U3区上游的PPT(ACGGAGGGGGA)序列。ev2、ev4、ev5和ev6的U3缺失可能造成其表达缺陷。
LTRs元件不仅调控ALV-E自身转录,对邻近基因的转录调控、翻译以及稳定性等也发挥重要的调控作用,甚至参与调控宿主基因的转录表达。24 bp的LTR与SLCO1B3共转录,促使SLCO1B3在鸡卵巢和蛋壳腺中的表达增加,形成绿色蛋壳[30-31]。ALVE-15和ALVE-ros005只有LTR区,但ALVE-ros005与蛋壳颜色存在显著负相关,ALVE-15整合在GRIK2的末端内含子内,使其3′末端外显子转录缺失[31]。胡序明等[32]发现,ALVE-1的LTR在SPF鸡发育早期的肺、脾、心等器官组织中高表达,而在35 d的肺和肝表达较高,其他组织中转录水平较低。
人类和小鼠的LTR包含p53、OCT4、SOX2和NANOG等多达20%转录因子结合位点[33],发挥转录调控作用。Montesion等[34]认为,肿瘤病发中LTR启动活性受转录因子的阶段性特异表达影响,并且LTR的多态性影响个体的HERV差异表达。王麒等[5]发现,ev21的5′LTR区存在3个TATA盒子,具有强启动子活性,而3′LTR区有1个TATA盒子,启动子活性较弱。朱文奇等[35]的体外试验发现,miR-155显著抑制内源白血病毒ev1的表达,Chung等[36]利用双向miRNA抑制了猪肾细胞的内源病毒表达。牙鲆OF-ERV9的LTR衍生的OF-miRNA-307发挥超增强子功能与其他转录因子协同调控基因表达[37]。ev3在鸡体内有表达,其U3域与ev1和ev2存在1个碱基的差异,但三者的U3启动子活性却没有差异[38],说明LTR上、下游的细胞序列调控元件可能参与ALV-E的转录。
另外,ALV-E的表达受表观遗传调控,如高甲基化与其表达沉默、癌变等负相关。戴开宇[39]研究发现,去甲基化处理后LTR转录水平显著增加。7 524 bp的ev21全基因组序列中发现6个238~526 bp的CpG岛,分散在5′UTR区和基因结构域,总长占病毒序列的29.9%[40]。而Yu等[41]发现,7.5 kb的ev1中包含813个CpG位点,白血病抗性的72品系中两个保守域的CpG位点处于高度甲基化状态,而白血病敏感的63系处于低或中等甲基化状态,并且72品系的ALV-E组织表达远低于63系。
ALV-E的沉默程度还受整合位点细胞序列的结构、甲基化程度和染色体结构等调控影响。有学者指出,整合位点上游100 bp的细胞DNA序列对ALV-E表达具有抑制作用。Conklin[38]对ALV-E表达水平与LTR区序列差异关系分析认为,ALV-E的转录表达受到侧翼细胞序列的调控。LTR序列缺失的ev1、ev2、ev3和ev6与完整序列的ev18和ev19在以鸡胚成纤维细胞为基质的麻疹疫苗中的转录表达一定程度说明ALV-E序列完整性不影响其转录[42],更表明了甲基化表观调控和顺式作用元件调控的重要性。
ALV-E整合对蛋肉鸡生产性能的影响是多方面的,相同ALV-E对不同品系可能产生相反影响,或对某一品系有影响而对另一品系可能无影响[39]。Fulton等[43]对ALV-E整合与蛋肉鸡生产性能进行关联分析,发现ALVE-15与两个品系白来航鸡的蛋白高度有相反效应,ALVE-ros004与白普里茅斯洛克鸡和洛岛红鸡的蛋白高度也有相反效应。ALVE-B5与洛岛红鸡的蛋重、白来航鸡的蛋壳颜色和白普里茅斯洛克鸡的蛋壳断裂强度相关。ALVE-B1、ALVE-B5、ALVE-B6和ALVE-B8均整合在产肉性能相关的数量性状位点附近,在肉鸡中经历正选择、基因频率增加,而降低了蛋鸡的生产性能、频率降低[44]。ALVE-3对某品系来航鸡的蛋白高度、马立克氏病抗性等都有影响,而在其他品系则影响产蛋量、穿刺评分、蛋重、蛋壳颜色等。这些关联的多变性反映了ALV-E复杂效应。另外,ALVE结构的完整性似乎并不与效应显著相关,Fulton等[43]发现56个与性状显著关联的ALV-E中结构不完整的有27个。ALVE-3整合在HCK原癌基因内含子区,只表达gag和env糖蛋白,但有11个显著关联性状。ALVE-15和ALVE-ros005虽然只有LTR区,但仍有生产性能受其影响,ALVE-15整合在GRIK2基因的最后一个内含子,可能提供可变启动子或破坏基因转录而改变基因功能。
宁中华等[45]研究发现,白壳蛋鸡慢羽系的白血病高发率可能与ev21的整合存在直接关系,并影响蛋鸡生产性能。另外,白莱航鸡慢羽系及其后代均表现出对外源淋巴白血病病毒免疫性能减退、生产性能下降、死亡率升高等,可能都与ev21的整合有关[43,45-48]。Mason等[17]发现,白莱航鸡一般整合有2~4个ALV-E,ALVE-1和ALVE-16整合在产蛋性能数量性状位点附近,对开产日龄、产蛋数和产蛋率均有影响,其在商品蛋鸡中的整合率升高,而在肉鸡的频率降低[44]。ALV-E的存在导致产蛋率减少8%~9%,蛋重降低2.2 g,蛋比重减少0.003[43]。Yu等[41]发现,携带ev10、ev19、沉默的ev1或表达特定抗原的ev3、ev6、ev21都显著降低了母鸡的产蛋率。
Fulton等[43]认为,ALV-E的存在可能通过3种机制影响鸡生产性能:1)ALV-E生成病毒粒子调节免疫系统对健康产生不利影响,从而间接影响生产性能(病毒效应),在不同品系间效应的差异可能与遗传背景(其他ALV-E是否存在)或者病毒抗性有关;2)ALV-E整合引起的插入突变可能直接导致基因改变或影响基因调控(基因效应);3)ALV-E整合在数量性状位点区域内或附近,可作为遗传标记,并在不同品系间由于连锁不平衡造成效应差异。
人们很早发现ALV-E有助于衍生免疫[46,49],具备复制能力的ALV-E能影响宿主对外源逆转录病毒的先天免疫效应,其产物如核酸、miRNA、piRNA、lnRNA、蛋白等都能参与免疫反应;其蛋白产物还可以通过干扰外源病毒受体,阻止病毒转运而抑制病毒感染[50]。ALV-E的LTR区高度保守,存在先天性免疫应答激活转录因子如NF-AT、c-JUN等,其转录可以激活先天免疫系统,并通过双链RNA依赖的TLR3/MDA5信号通路诱导细胞因子如IFN的产生,从而抑制肿瘤的发生发展[51]。
ALV-E主要通过3种方式对外源性逆转录病毒感染产生抗性:受体干扰、抑制逆转录病毒生殖循环(脱壳、重组和核定位)及靶标逆转录病毒RNA形成双链RNA而降解[52-55]。王归燕[56]发现,黄羽鸡和隐性白羽鸡在接种ALV-J后,ev1促进OAS、PKR和IFN-β、IFN-γ的表达,从而抑制外源性病毒的复制;同时抑制IL-18的表达,从而增强了肿瘤排斥反应。来源于ALVE-1的反义长链非编码RNA(lnc-ALVE1-AS1)过度表达使ALV-J的表达显著降低[57-58]。内源性EAV-HP插入SLCO1B3基因5′侧翼区降低了其在肝的表达,导致脂肪代谢和外源物质转运能力降低,并可能参与免疫过程[59]。由ALV-E的gag、pol或env基因编码的单一蛋白表达也能对宿主免疫产生影响。gag多聚蛋白可诱导机体对ALV感染的耐受性,导致免疫反应延迟和淋巴肿瘤的发病率升高[60]。相反,env包膜糖蛋白的表达通过受体干扰,降低细胞受体的活性,保护鸡免受外源性病毒感染,增强抵抗力[46]。Federspiel等[61]发现,ALV-E来源的env蛋白表达鸡对Rous-1病毒感染具有高抗性,而无env蛋白表达的品系却表现高病毒表达、抗体反应或病毒血症。APOBECs作为DNA编辑器调控内源逆转录病毒的稳定性及其活性,APOBEC4在NDV感染早期的鸡B细胞系、巨噬细胞系的表达显著升高,可能参与ALV-E活性表达的机体宿主免疫反应[62]。
鸡一般都携带有完整的或缺陷性的ALV-E基因组,其遵循孟德尔遗传规律进行垂直传播,参与免疫调节,抑制外源病毒感染与肿瘤的发生。ALV-E整合对蛋肉鸡表型的影响是多方面的,主要通过3种机制影响鸡生产性能。ALV-E表达干扰禽外源性白血病病毒的净化,同时对宿主生理功能存在毒害性,因此其活性受到严密控制。obsERVer高通量检测技术增加了ALV-E整合检出率和位点的准确性,但ALV-E整合位置及效应研究尚不明确。ALV-E基因结构功能研究及obsERVer高通量检测技术的应用使ALV-E的净化成为可能。在基因组测序方面,基于ALV-E数据的系统研究有助于新整合内源病毒的发现,并使ev位点作为信息标记的潜力得以挖掘。