焦 健,沙小晶
(中国科学院科技战略咨询研究院,北京 100190)
利用生物信息学的途径预测并发现新的miRNA 是一种有效方法,它以计算机程序分析为基础、以给定的基因组序列为范围,在动植物中鉴定出许多miRNA[1]。此方法可以鉴定那些表达量低或有时空表达特性的miRNA,利用miRNA 前体的二级结构特征、热力学稳定性和物种间的相对保守性,寻找同源miRNA。
植物miRNA 的生物信息学预测方法有同源性比对、与靶标基因相结合、模式学习等方法[2]。同源性比对是根据同源miRNA在物种间的相对保守性和pre-miRNA 前体的结构特征来搜索miRNA。利用miRNA 与其靶标基因可以发生碱基互补配对的特点,以及该配对方式也具有保守性,可以结合miRNA 的靶标基因,作为预测中的一个筛选条件,这种与靶标基因相结合来预测miRNA 的方法进一步提高了预测的准确性。模式学习是预先训练计算机程序对已知阳性miRNA 数据集和阴性miRNA 数据集的识别,进而对未知数据集进行分析的技术手段,该方法通过区分miRNA 和非miRNA 的天然特点,成为预测新miRNA 的一种途径。
根据以上预测方法的基本原理,出现了系列miRNA 及其靶标基因的预测软件,如:miRanda、DIANA-microT、RNAhybrid、TargetScan、MicroInspector、PicTar、TargetBoost、miTarget、RNA22 和microTar 等[3]。这些程序或预测软件各有优缺点,还需其他方法加以佐证才能真正鉴定新的miRNA。
近年来,第二代测序法即高通量测序法被广泛应用于植物siRNA 或miRNA 的测序和鉴定,客观上加快了siRNA 和miRNA研究进展,使大规模克隆sRNA 并分析它们的功能成为可能。
高通量测序法具有高通量、高灵敏度、杂交特异性好等优点。该方法首先需提取植物组织的Total RNA,用高密度聚丙烯酰胺凝胶电泳回收长度为18~30 nt 的sRNA,将得到的sRNA 5’和3’端加特异的接头adaptor,经过反转录和PCR 级联扩增,建立富含18~30 nt的sRNA 文库,再高通量上机测序得到大量初始数据。通过对这些初始数据的比对、分析和鉴定,可以获得相当可观的信息。
目前,通过高通量测序法建立的miRNA 数据库有:GEO(Gene Expression Ommibus)、miRBase、ASRP(Arabidopsis Small RNA Project)、Rfam、MPSS(Massively Parallel Signature Sequencing)和TarBase 数据库等[4]。
miRNA 靶标基因的鉴定并进而对其的功能分析,是研究miRNA 生物学功能的重要环节[5]。由于miRNA 可以与其靶标基因互补配对,因此,可以较方便的利用生物信息学方法,比对miRNA 所在的物种基因组全序列或部分ESTs 数据库,就能对miRNA 的靶标基因进行初步预测。
初步预测得到的候选miRNA 靶标基因,还需通过其他试验方法加以验证,最终结合多种miRNA 靶标基因鉴定的方法,可以确定一个miRNA 的一个或多个靶标基因。其中,5’RACE 方法可以在转录水平鉴定miRNA 对其靶标基因的切割降解,通过5’RACE 却不能扩增到的候选基因,即为miRNA 的靶标基因。
Western bloting 方法可以在翻译水平鉴定miRNA 对其靶标基因翻译的抑制,Western 杂交后目的蛋白条带不清晰或没有蛋白条带的候选基因,即为miRNA 的靶标基因。
利用Northern bloting 方法可以检测靶标基因的降解片段,从而在体外验证miRNA 对靶标基因的切割降解。
通过对miRNA 靶标基因的预测和各种鉴定后,对其功能分析也可以间接证明内源miRNA 的功能,因此,miRNA 靶标基因的鉴定和研究对分析miRNA 功能和作用具有重要意义[6]。
大麦材料:I10;小麦材料:中国春;其他植株材料:本生烟、拟南芥、短柄草等。
VIGS 相关的病毒载体包括:BSMV-LIC 载体(α,β 和γ 均为DNA 质粒)。
表达载体包括:pGreen 载体,用于内源siRNA 或miRNA 在本生烟中高表达。
克隆载体包括:pEASY-T、Gateway 相关载体。
大肠杆菌菌株包括:DH5α 和DH10B;农杆菌菌株包括:GV3101 和EHA105。
用于内源基因沉默:PCR 扩增目的片段时(最优片段大小约为200-400bp),正向引物5’端需加LIC 接头的序列为:5’-AAGGAAGTTTAA-3’,反向引物5’端需加LIC 接头的序列为:5’-AACCACCACCACCGT-3’。
操作流程:PCR 扩增带有LIC 接头的目的片断;将pCaBSγ-LIC 载体用ApaI 完全酶切,并依照以下流程将目的片段与载体用LIC 克隆方法连接:
若将携带amiRNA 的miRNA 前体序列插入BSMV pCaBS-γ-LIC载体,需要利用多重PCR,用amiRNA 和amiRNA*序列替换内源的miRNA 和miRNA*序列,并保持原miRNA 前体二级茎环结构不变。
目前,越来越多的miRNA 通过测序或生物信息学预测的手段被报道,而仅有其中少数被研究透彻。通过表达和沉默miRNA是广泛使用的反向遗传学策略,为验证BSMV 表达miRNA 前体而产生vamiRNA 或“与miRNA 序列相同的sRNA”(以vsiRNA表示)能否用于研究麦类作物内源miRNA 的功能,可利用BSMV 病毒载体在麦类作物和模式植物短柄草中表达miRNA 前体以产生vsiRNA,或利用vamiRNA 沉默内源miRNA。
(1)构建基于BSMV 的vsiR_miRNA 表达载体
在大麦品种I10 中分别过表达HvuMIR164 和HuvMIR171 前体(以下用BSMV:vsiR_miR164 和BSMV:vsiR_miR171 表示),利用半定量End-point Stem-loop RT-PCR 检测到内源miR164 或miR171均有显著上调,这可能是vsiR_miR164或vsiR_miR171高表达的结果。
(2)构建基于BSMV 的miRNA 沉默载体
通过WMD3 平台,设计靶向内源miR164 和miR171 区域的amiRNAs 序列,即vamiR_miR164 和vamiR_miR171,再利用水稻OsaMIR528 前体作为骨架携带它们,通过BSMV 在I10 中表达(以下用BSMV:vamiR_miR164和BSMV:vamiR_miR171表示)。
半定量RT-PCR 检测结果表明,BSMV:vamiR_miR164 或BSMV:vamiR_miR171 侵染的植株中,miR164 或miR171 的相对表达量显著低于BSMV:EV 处理的植株,并且BSMV:vamiR_miR164 或BSMV:vamiR_miR171 侵染的植株中检测到了vamiR_miR164 或vamiR_miR171 的高表达,而对照BSMV:EV 处理的植株未检测到了vamiR_miR164 或vamiR_miR171 的表达。
结果说明,基于BSMV 的miRNA 前体或vamiRNA 的表达系统可在大麦中表达与miRNA 序列相同的sRNA(即vsiRNA)或沉默内源miRNA,这为研究麦类作物内源miRNA 的功能提供了一种研究手段。
(3)基于BSMV 的miRNA 表达或沉默在小麦和短柄草中的验证
试验进一步证明,BSMV 病毒载体也可以在普通小麦和模式植物短柄草中实现对内源miRNA 的沉默或表达与miRNA序列相同的sRNA。QRT-PCR结合End-point Stem-loop技术检测结果表明,与对照BSMV:EV 处理的植株相比,BSMV:vsiR_miR164 和BSMV:vsiR_miR171 处理后,大、小麦和短柄草vsiR_miR164 和vsiR_miR171 表达量显著上升;而BSMV:vamiR_miR164 和BSMV:vamiR_miR171 处理后,大、小麦和短柄草内源miR164 和miR171 表达量显著下降。
半定量PCR 检测BSMV 在大麦中高表达vsiR_miR164和vsiR_miR171。半定量PCR 检测BSMV 在大麦中沉默内源miR164 和miR171。QRT-PCR 检测BSMV 在麦类作物和短柄草中vsiR_miR164 或vsiR_miR171 的表达变化。
研究内源miRNA 的功能,首先,要获得miRNA 序列,这可以通过生物信息学预测、高通量测序或直接克隆得到。其次,要研究miRNA 的功能,过表达和沉默是研究内源miRNA 功能的重要技术手段,可以借助于miRNA 高表达载体在植物中瞬时或稳定的高表达内源miRNA,也可以通过amiRNA 技术和miRNA target mimic 技术沉默内源miRNA。此外,通过生物信息学方法预测内源miRNA 的靶标基因,对其靶标基因的功能分析也可以间接证明内源miRNA 的功能。
本研究发现,在麦类作物和短柄草植物中,BSMV 病毒载体可通过表达内源miRNAs 的前体以过表达与miRNA 序列相同的sRNAs(即vsiRNAs)或表达适当的vamiRNAs 以沉默相应的内源miRNAs。或许,BSMV 病毒载体还可以结合STTM 技术,或将实现对内源miRNAs 的沉默。总体来看,这使得鉴定麦类作物和模式植物短柄草内源miRNAs 的靶标基因成为可能。