田怀志, 郭 豪, 田 浩, 熊兴伟, 张素勤, 耿广东,3*
( 1. 贵州大学 农学院, 贵阳 550025; 2. 遵义市农业科学研究院, 贵州 遵义 563000; 3. 贵州大学辣椒产业技术研究院, 贵阳 550025 )
辣椒(Capsicumannuum)作为世界上第二大茄科蔬菜,是我国种植面积最大的蔬菜(邹学校等,2020)。伴随着辣椒用途的不断开发和加工型产业的快速发展,其已成为我国乡村振兴的重要支柱产业之一。但是,辣椒属于浅根系作物,根系不发达,再生能力弱,耐涝能力差。长江中下游地区涝害频繁发生,导致辣椒减产减收严重(刘周斌等,2015)。目前,对辣椒耐涝胁迫方面的研究较少且主要集中于生理方面,对其分子机理的研究更少。耐涝是受多基因控制的性状,难以定位,仅基于表型很难快速地将这些性状加以利用。利用分子标记进行预选可减少群体规模,并可在辣椒生长早期筛选出理想的基因型,可加速辣椒新品种培育进程。
转录组测序(RNA-seq)技术利用高通量测序进行基因表达水平分析,可以反映基因的转录水平,能快速有效地获得基因序列。其因高通量、准确性和可重复性等优点,现已被广泛应用到分子生物学领域。RNA-seq技术加速了新基因表达模式和功能的分析(Jain et al., 2016),是分析生物体基因表达量变化的重要工具(Zhang et al., 2017),其对非模式植物的基因挖掘和分子标记开发均具有重要意义,是探究植物耐涝分子机制的有力工具。Kinga等(2021)对两个耐涝性不同的黄瓜品种进行转录组分析,发现在耐涝品种中所鉴定的基因与增强糖酵解、氨基酸代谢和不定根发育相关。Xu等(2017)对黄瓜转录组进行分析,发现耐涝植株表现出更高的碳水化合物代谢以及三磷酸腺苷和还原型辅酶Ⅰ的再生,以应对水涝胁迫带来的能量危机。Pimprapai等(2011)研究了两个不同耐涝性豌豆品种的分子响应变化,通过对根的转录组研究,发现能量代谢通路、激素、细胞壁修饰、膜转运蛋白和过氧化物酶相关的多个差异表达基因可能有助于豌豆的耐涝。Li等(2022)通过转录组分析发现耐涝猕猴桃根系通过调节碳水化合物和氨基酸代谢来应对水涝胁迫。另外,叶鹏等(2019)通过对金花茶转录组数据的挖掘,获得SSR位点分布特征,为SSR引物设计与筛选提供依据。
SSR因其具有丰富的数量、较高的多态性、良好的重复性以及共显性等优点而被广泛应用(罗冉等,2010),但SSR标记的开发需要经过构建文库、筛选和测序等工作,既昂贵又繁琐。如今,大规模开展的cDNA测序工作以及飞速发展的生物信息学,使得EST(expressed sequence tag)为SSR标记的开发提供了一种经济、方便的方法。随着测序技术的迅速发展,EST数量逐步增加,使得EST-SSR标记越来越丰富。与传统SSR相比,EST-SSR具有开发便宜、共显性、稳定、通用性好等优点,被广泛应用于基因标记(Varshney et al., 2005;姜春芽等,2009)。现已在木瓜(伍越等,2021)、香合欢(安琪等,2022)、黄精(陈友吾等,2020)、龙眼(胡文舜等,2019)、川芎(袁灿等,2017)、红麻(万雪贝等,2017)、枫香(李辉等,2023)等植物上开发与应用,并广泛应用于分子标记辅助育种、基因定位、遗传多样性分析和遗传连锁图谱的构建等研究。已有研究基于公共数据库或转录组有限的辣椒EST序列开发了一些引物,并在实践中得到了应用(傅鸿妃等,2018;管俊娇等,2019),但辣椒可公开获得的SSR标记有限(Huang et al., 2000),已公开报道可利用的SSR标记仅有500多个(李永平等,2016),开发数量偏少,难以适应辣椒高密度作图的要求,亟需开发更多的SSR标记用于遗传图谱构建、种质鉴定以及分子辅助育种等。
本研究在水涝胁迫下从耐涝辣椒转录组数据中检测差异表达基因(differentially expressed genes, DEGs),并对其进行组装与功能注释;通过RNA-seq技术获得丰富的辣椒SSR位点信息,进行辣椒EST-SSR引物设计,随后采用PCR扩增及聚丙烯酰胺凝胶电泳技术筛选出多态性好、稳定的辣椒EST-SSR引物,并通过对不同辣椒品种的遗传多样性进行分析以验证引物的应用效果。拟探讨:(1)辣椒对水涝胁迫应答的分子机制;(2)辣椒EST-SSR位点的分布及序列特征;(3)辣椒多态性EST-SSR引物。本研究以期为今后辣椒遗传图谱构建、种质资源评价、系统进化分析、功能基因标记和分子辅助育种等研究奠定基础。
试验材料为‘ZHC1’(不耐涝朝天椒)、‘ZHC2’(耐涝朝天椒)和‘大方皱椒’(线椒)。‘ZHC1’和‘ZHC2’为遵义市农业科学院惠赠的纯系材料,‘大方皱椒’为贵州当地种植的常规辣椒品种。
以耐涝‘ZHC2’辣椒为试验材料,其培养及淹水处理参考郭豪等(2022)的方法。待辣椒植株长至5片叶时,分别进行淹水6 h(T1)、淹水24 h(T2)和恢复1 h(T3)3个处理,并以正常培养的辣椒材料作为对照(CK)。试验包括3次生物学重复,每次生物学重复由10株长势一致的辣椒根系混合而成,取样后立即放入液氮中快速冷冻,然后放入-80 ℃超低温冰箱中保存,使用TRIzol®试剂盒[天根生化科技(北京)有限公司]提取总RNA,用于转录组测序。测序文库的构建在华大基因技术服务有限公司进行,使用Illumina HiSeq 2000测序平台、Trinity软件分别进行转录组的双末端测序、Clean reads组装以及聚类去冗余,获得单基因(Unigene)。对DEGs进行KEGG(Kyoto Encyclopedia of Genes and Genomes)和GO(Gene Ontology)功能注释,对Unigene与NT(NCBI non-redundant nucleotide sequence database)、NR(NCBI non-redundant protein sequences database)、SwissProt、Pfam(protein family)和KOG(euKaryotic Ortholog Groups)公共数据库中的序列进行同源性分析。
使用MISA V1.0在线软件测定Unigene中的SSR,限定单核苷酸至六核苷酸序列SSR的重复次数至少为12个、6个、5个、5个、4个和4个;并限定复合微卫星形成的标准为两个微卫星之间的距离小于100 bp(Thiel et al., 2003)。使用Primer 3在线工具设计引物(Andreas et al., 2012),引物设计原则:(1)引物长度为18~24 bp;(2)产物大小为80~300 bp;(3)退火温度为55~62 ℃,上下游引物退火温度差值小于5 ℃;(4)GC含量为40%~60%;避免引物二级结构的出现。从中任意挑选30对引物进行扩增。引物由生工生物工程(上海)股份有限公司进行合成。
以‘ZHC1’‘ZHC2’和‘大方皱椒’为材料,待植株长至5叶1心时,采集顶部两三片叶,液氮速冻后于-80 ℃中保存。通过CTAB法进行DNA提取,用于引物的有效性筛选。PCR反应体系与反应程序见表1,PCR反应在T100TMThermal Cycler PCR仪(BIO-RAD公司)上进行。
表 1 PCR反应体系和反应程序Table 1 PCR reaction system and procedure
用10%非变性聚丙烯酰胺凝胶(PAGE)电泳检测PCR扩增产物。于120 V电泳2.0 h后,进行银染显色和照相,分析EST-SSR标记的多态性效果。
从耐涝‘ZHC2’辣椒不同淹水处理样品中分离RNA,并对原始Reads进行过滤和组装,总共构建了12个cDNA文库。由表2可知,每个处理中Q20的比例均高于Q20规定的极限值(>80%),GC含量均低于50%,表明测序质量良好。
对不同处理的辣椒植物根系进行转录组测序,构建了12个cDNA文库,获得Clean reads共153.99 Gb,对其组装去冗余后,得到128 939个Unigene(图1)。总长度、平均长度、GC含量依次为55 082 725、1 101 bp和40.57%。在所有的Unigene中,57 243个基因长度介于200~1 000 bp之间,所占比例为44.40%,35 213个基因长度介于1 000~2 000 bp之间,所占比例为27.31%,19 321个基因长度介于2 000~3 000 bp之间,所占比例为14.98%,17 162个基因长度大于3 000 bp,所占比例为13.31%。
将Unigene比对到NR、NT、SwissProt、KOG、KEGG、GO和Pfam数据库(表3)中,分别有102 123个(79.20%)、110 157个(85.43%)、70 203个(54.45%)、73 539个(57.03%)、77 646个(60.22%)、77 442个(60.06%)以及68 216个(52.91%)Unigene获得功能注释,被任意一个数据库注释的Unigene有116 057个,占Unigene总数的90.01%。
图 1 辣椒单基因长度分布Fig. 1 Distribution of Unigene length in hot pepper
表 2 辣椒转录组测序结果Table 2 Results of hot pepper transcriptome sequencing
将水涝胁迫与对照相比的DEGs进行GO功能注释。共有43 446个DEGs被注释在GO数据库中(图2),可分成分子功能、细胞组分以及生物过程三大类。分子功能中主要方面是结合、催化活性及转运蛋白活性。细胞组分中主要方面是细胞解剖实体、细胞内以及蛋白质复合物。在生物过程中细胞过程占据主导地位,其次是代谢过程和生物调节。13 702个DEGs被注释到KEGG通路中(图3)。其中碳水化合物代谢、脂质代谢与氨基酸代谢是主要的代谢途径。与代谢相关的DEGs有8 404个,包含碳水化合物(16.52%)、氨基酸(9.22%)、脂质(7.03%)、其他次级代谢物的生物合成(6.08%)以及能量代谢(4.99%)等;在遗传信息处理中,主要为翻译和折叠、分类和降解以及转录3个过程;在环境信息处理途径中主要是信号转导与跨膜运输;运输和分解代谢及环境适应是细胞过程和有机系统中的主要途径。这说明在淹水过程中辣椒受到碳水化合物代谢、脂质代谢、氨基酸代谢、信号转导等途径的协同作用,这些通路可能在辣椒水涝胁迫应答中起到重要作用。
EST-SSR的长度范围为12~110 bp,其中12 bp和15 bp分布最多,分别有5 331个(20.06%)和5 523个(20.78%)SSR位点(图4)。在单核苷酸和二核苷酸中,最常见的片段长度为12 bp,在单核苷酸中有2 909个(10.95%)位点,二核苷酸中有2 422个(9.11%)位点。单核苷酸和二核苷酸最长的片段分别是102 bp和96 bp。在三核苷酸中,主要长度类型是15 bp和18 bp,二者分别有4 510个(16.97%)个和1 945个(7.32%)位点,二者占三核苷酸位点总数的78.36%。四核苷酸及五核苷酸均以20 bp为主,分别有235个(0.88%)和340个(1.28%)位点。六核苷酸中最长的为90 bp,检测到4个位点,24 bp占绝大多数(568,2.14%)。在本研究中,SSR有6 018条SSR的长度大于20 bp,占SSR总数的22.65%;20 556条SSR分布于12~19 bp之间,占SSR总数的77.35%。
使用MISA V1.0在线软件对所有的Unigene进行SSR位点检测,共发现26 574个SSR位点分布在24 889个Unigene中,其中23 451个Unigene含有单一SSR,1 438个Unigene包含3 123个SSR位点,SSR位点出现频率(SSR数目占Unigene总数百分比)为20.61%,SSR发生频率(含SSR的Unigene数占Unigene总数百分比)为19.30%。从表4可以看出,辣椒EST-SSR序列主要以4~10次重复为主,共15 411个,占总EST-SSR的57.99%;其次是11~20次重复,共10 125个,占总EST-SSR的38.10%;20次以上的重复较少,共1 038个,占总EST-SSR的3.91%。在已鉴定的SSR中,单核苷酸基序SSR最丰富(9 902,37.26%),其次是三核苷酸(8 238,31.00%)、二核苷酸(6 760,25.44%)、六核苷酸(838,3.15%)、五核苷酸(466,1.75%)和四核苷酸(370,1.39%)的基序SSR。
1. 结合; 2. 催化活性; 3. 转运蛋白活性; 4. 结构分子活性; 5. 转录调节活性; 6. 分子功能调节活性; 7. 抗氧化活性; 8. 翻译调节活性; 9. 分子换能器活性; 10. 其他; 11. 细胞解剖实体; 12. 细胞内; 13. 蛋白质复合物; 14. 细胞过程; 15. 代谢过程; 16. 生物调节; 17. 对刺激的反应; 18. 生物过程的调节; 19. 定位; 20. 发育过程; 21. 信号传导; 22. 多细胞生物过程; 23. 繁殖; 24. 繁殖过程; 25. 生物过程负调节; 26. 生物过程正调节; 27. 多生物过程; 28. 生物间的相互作用; 29. 增长; 30. 其他。1. Binding; 2. Catalytic activity; 3. Transporter protein activity; 4. Structural molecule activity; 5. Transcription regulator activity; 6. Molecular functional regulation activity; 7. Antioxidant activity; 8. Translation regulator activity; 9. Molecular transducer activity; 10. Other; 11. Cellular anatomical entity; 12. Intracellular; 13. Protein complex; 14. Cellular process; 15. Metabolic process; 16. Biological regulation; 17. Response to stimulus; 18. Regulation of biological process; 19. Localization; 20. Development process; 21. Signaling; 22. Multicellular organismal process; 23. Reproduction; 24. Reproductive process; 25. Negative regulation of biological process; 26. Positive regulation of biological process; 27. Multibiological processes; 28. Interspecies interaction between organisms; 29. Growth; 30. Other.图 2 辣椒DEGs的GO注释Fig. 2 GO annotation of hot pepper DEGs
1. 核苷酸代谢; 2. 聚糖生物合成和代谢; 3. 萜类和聚酮类的代谢; 4. 辅因子和维生素的代谢; 5. 其他氨基酸的代谢; 6. 能量代谢; 7. 其他次级代谢产物的生物合成; 8. 脂质代谢; 9. 氨基酸代谢; 10. 碳水化合物代谢; 11. 全局和概览图; 12. 复制和修复; 13. 转录; 14. 折叠、分类和降解; 15. 翻译; 16. 膜运输; 17. 信号转导; 18. 运输和分解代谢; 19. 环境适应。1. Nucleotide metabolism; 2. Glycan biosynthesis and metabolism; 3. Metabolism of terpenoids and polyketides; 4. Metabolism of cofactors and vitamins; 5. Metabolism of other amino acids; 6. Energy metabolism; 7. Biosynthesis of other secondary metabolites; 8. Lipid metabolism; 9. Amino acid metabolism; 10. Carbohydrate metabolism; 11. Global and overview maps; 12. Replication and repair; 13. Transcription; 14. Folding, sorting and degradation; 15. Translation; 16. Membrane transport; 17. Signal transduction; 18. Transport and catabolism; 19. Environmental adaptation.图 3 辣椒DEGs的KEGG注释Fig. 3 KEGG annotation of hot pepper DEGs
表 3 单基因功能注释Table 3 Function annotation of Unigene
从辣椒EST-SSR核苷酸的基序类型来看,EST-SSR以单核苷酸为主要类型,约9 902个,占总SSR的37.26%,其次是三核苷酸8 238个(31.00%)和二核苷酸6 760个(25.44%),三者共占检测出的SSR总数的93.70%。在单核苷酸中,A/T是主要类型,占全部单核苷酸的95.58%,其次为三核苷酸,以TTG/CAA、ACA/TGT为主要类型,分别占三核苷酸SSR的18.10%、12.71%。在二核苷酸中, 以AG/CT、TC/GA、AT和TA的比例最高,占所有二核苷酸SSR的23.30%、21.02%、20.58%和17.25%。而四核苷酸、五核苷酸、六核苷酸3种核苷酸基序出现频率均较低,三者一起共占SSR总数的6.30%。在四核苷酸中,以TTTA/TAAA、AATA/TATT和AAAT/ATTT的比例最高,分别占四核苷酸SSR的13.78%、10.27%和9.73%;在五核苷酸中,以ATGGT、ACTCA所占比例最高,各占五核苷酸SSR的6.01%和4.08%;在六核苷酸中,以GAAGAG、GAGCTG的数量最多,各占六核苷酸SSR的3.82%和3.10%(表5)。
表 4 辣椒EST-SSR的类型、数量及分布频率Table 4 Type, number and distribution frequency of EST-SSR in hot pepper
表 5 辣椒EST-SSR基序的分布Table 5 Distribution of EST-SSR motif in hot pepper
使用Primer 3在线工具对含有SSR的21 008条EST序列设计了10 002对SSR引物。为验证其有效性,随机选择30对引物进行合成,引物信息见表6,以‘大方皱椒’‘ZHC1’ 和‘ZHC2’ 3个辣椒材料的DNA进行PCR扩增与引物筛选。所挑选的全部引物均可扩增,由图5可知,其中7对引物在3个辣椒材料中可以扩增出目的条带,占挑选引物总数的23.33%,推测可用的EST-SSR数量有2 333对,可作为后续参考使用。引物分别为Unigene12971_All_10480、CL10067.Contig1_All_6591、CL10579.Contig2_All_6940、CL10070.Contig1_All_6593、CL10751.Contig1_All_7072、CL10564.Contig1_All_6936、CL10056.Contig8_All_6589。
通过植物RNA-seq技术可以获取大量的转录本信息,这为植物基因表达的综合分析提供了合理而可信的数据资源(贾新平等,2014)。因此,在淹水胁迫下辣椒转录组信息的系统分析为全面了解辣椒耐涝分子机制和挖掘新的耐涝基因奠定基础。本研究对不同淹水时间的辣椒根系进行转录组测序,对数据组装共获得128 939个Unigene。把这些Unigene在NR、NT、SwissProt、KEGG、KOG、Pfam和GO数据库中加以注释,得到注释Unigene共有116 057个,占总Unigene的90.01%,有12 882个Unigene没有得到注释。与其他植物相比(夏铭泽,2022;张小红等,2023),在水涝胁迫下辣椒转录组测序获得的基因数量及注释效率均较高。组装得到的Unigene不能在已知相关基因数据库中得到注释,这种现象是普遍存在的,这与所得部分Unigene片段太短、相关数据库基因注释信息缺乏、辣椒中存在新基因等因素都有关联(张少平等,2016)。可以进一步研究未被注释的基因,确定这些基因在植物生长发育过程中的作用,从而丰富基因数据库(马彦军等,2020)。本研究在对DEGs进行KEGG注释时,发现碳水化合物、氨基酸、脂质等代谢注释最多,其次为翻译、折叠、遗传信息分类和降解以及信号转导。植物在受到水涝胁迫的时候,植物根系缺氧导致线粒体有氧呼吸受到极大抑制。碳水化合物代谢对植物存活至关重要,在此过程中,植物通过积累易利用糖类和额外丙酮酸等物质以保持其能量供应。氨基酸代谢在植物应对非生物胁迫中发挥着重要作用(Hildebrandt et al., 2018)。其中,对脯氨酸的研究最为广泛, 但其他氨基酸, 如支链氨基酸(亮氨酸、异亮氨酸和缬氨酸)也同样重要(Huang et al., 2017),其氧化会产生大量的三磷酸腺苷(Hildebrandt et al., 2015);而丙氨酸和天冬氨酸在其相应氨基转移酶作用下通过影响草酰乙酸的量而参与丙酮酸的再生,可以为植物逆境生存提供物质与能量,这可能是‘ZHC2’辣椒耐涝性强的原因之一。在脂质代谢过程中,耐缺氧型个体脂质分解加强,其分解为甘油和游离脂肪酸。甘油可用于碳和能量供应以及不定根发育,而游离脂肪酸可为新生成的细胞提供成分。当辣椒受到水涝胁迫时,碳水化合物代谢可以产生足够能量使植物维持多种生理生化反应,同时植物需要合成大量的酶来催化体内的多种生理生化反应,将受到的刺激信号进行传导,以便植物能产生应激反应来应对不良环境造成的影响。试验将进一步对重要差异基因进行分析,筛选出与辣椒耐涝紧密相关的基因,并解释辣椒耐涝的分子机制。
1-21. 点样顺序为Unigene12971_All_10480、CL10067.Contig1_All_6591、CL10579.Contig2_All_6940、CL10070.Contig1_All_6593、CL10751.Contig1_All_7072、CL10564.Contig1_All_6936、CL10056.Contig8_All_6589引物的扩增结果,每对引物中以‘ZHC1’‘ZHC2’‘大方皱椒’的顺序点样。M. DL2000 Marker。1-21. The orders of sampling are the amplification results of Unigene12971_All_10480, CL10067.Contig1_All_6591, CL10579.Contig2_All_6940, CL10070.Contig1_All_6593, CL10751.Contig1_All_7072, CL10564.Contig1_All_6936, CL10056.Contig8_All_6589 primers, respectively. Among each pair of primers, the samples are ‘ZHC1’, ‘ZHC2’ and ‘Dafangzhoujiao’, respectively. M. DL2000 Marker.图 5 7对EST-SSR引物的扩增结果Fig. 5 Amplification results of seven pairs of EST-SSR primers
本研究发现,26 574个SSR位点分布于128 939个辣椒无冗余Unigene中,EST-SSR出现频率为20.61%,高于Yi等(2006)、刘峰等(2012)和魏兵强等(2013)的辣椒EST-SSR结果,低于蓖麻(Qiu et al., 2010)、木薯(Kunkeaw et al., 2011)、灰毡毛忍冬(刘思思等,2021)的EST-SSR结果,这可能是由物种间SSR信息的差异所造成的,也可能是因为用于分析的EST数量在不同物种间各不相同,或者用于搜索SSR所使用的软件算法及所设定的参数不同(吴智明等,2012)。辣椒EST-SSR单核苷酸频率最高(37.26%),其次是三核苷酸(31.00%)和二核苷酸(25.44%)。在辣椒单核苷酸EST-SSR中,绝大部分基元为A/T,这与魏兵强等(2013)和刘峰等(2012)的结果一致。在二核苷酸重复类型中,出现频率最高的是AG/CT和TC/GA,其次是AT和TA,而GC/CG出现频率低,这与Yi等(2006)、Kantety等(2002)和张宇等(2010)在辣椒上的研究结果基本一致,而且与珍珠粟(Selthilvel et al., 2008)、石蒜(李青竹等,2021)、蝴蝶兰(张水明等,2012)和毛竹(张智俊等,2011)的结果相似,说明EST-SSR在其发生和进化过程中具有高度保守性。GA/TC在mRNA水平上可以代表遗传密码子GAG、AGA、UCU和CUC,并可以分别翻译成精氨酸、谷氨酸、丙氨酸和亮氨酸,而丙氨酸和亮氨酸分别以8%和10%的高频率存在于蛋白质中,这可能是GA/TC在EST中高频出现的原因(Kantety et al., 2002)。在三核苷酸中,出现频率高的是TTG/CAA和ACA/TGT,这与Kumpatla等(2005)和Yi等(2006)对辣椒EST-SSR的研究结果相符合。但刘峰等(2012)研究认为,除单核苷酸A/T重复序列外,辣椒EST-SSR最多的是三核苷酸重复序列AAC/GTT和AAG/CTT,其次是二核苷酸重复序列。这可能是由SSR搜索标准(基序长度、重复次数等)、分析软件及数据库大小不同所造成。
在本研究中,共有6 018条SSR长度大于20 bp,占全部SSR总数的22.65%;20 556条SSR长度介于12~19 bp之间,占所有SSR总数的77.35%,说明辣椒EST-SSR具有较好的多态性(Temnykh et al., 2001),这与盛文涛等(2019)的研究结果基本一致,可用于辣椒分子标记研究。根据26 574条EST序列设计了10 002对SSR位点特异性引物,从中随机挑选了30对引物进行PCR验证,都可以实现有效扩增,较大的数据量和较高的拼接质量应是EST扩增效率高的原因。在30对扩增引物中,有7对(23.3%)引物在3份辣椒中表现出多态性,低于李永平等(2016)的研究结果(35.5%),其原因可能与本研究所选用的3份辣椒材料均为贵州地方品种,并且‘ZHC1’和‘ZHC2’为朝天椒,材料间的遗传背景差异小有关。EST-SSR来自基因组转录区,而转录区的序列通常比较保守。因此,一般来讲,EST-SSR所检测到的多态性要低于基因组SSR。多态性检测能力的大小也与所测试的植物材料有关,如果所用的植物材料遗传背景差异较大,则标记检测的多态性就高,反之,则标记的多态性就会大大降低。应用EST-Genome、Phrap、Clustalw、BLAST等软件对EST序列进行精确分析以增加供试材料的基因型与数量是提高EST-SSR标记多态性和价值性的有效途径(张宇等,2010)。因为EST-SSR是对基因内部变异的一种直接评价,所以它将可能与某些表型、生理生化特征或某个特定的环境适应型相联系,反映植物基因表达的转录部分(姚利华等,2008)。挑选的EST-SSR标记可用于遗传多样性分析与分子标记辅助育种。由于其丰富的多态性信息含量,因此EST-SSR可为遗传连锁图谱构建等奠定基础。下一步可寻找与辣椒耐涝基因连锁的EST-SSR标记,以应用于辣椒耐涝育种研究。