中国棉花审定品种SSR指纹库的构建与综合评价

2024-04-24 06:59吴玉珍黄龙雨周大云黄义文付守阳彭军匡猛

中国农业科学 2024年8期

吴玉珍，黄龙雨，周大云，黄义文，付守阳，彭军，匡猛

吴玉珍1,2，黄龙雨1,2，周大云1,2，黄义文1,2，付守阳1,2，彭军1,2，匡猛

1中国农业科学院棉花研究所/棉花生物育种与综合利用全国重点实验室，河南安阳 455000；2三亚中国农业科学院国家南繁研究院，海南三亚 572024

【目的】棉花是一种异源四倍体作物，基因组结构复杂，常异花授粉的繁殖方式也导致棉花品种难以实现高度纯合；棉种市场缺乏有效的监管技术手段，品种多乱杂现象长期存在，严重影响纤维品质一致性。构建中国近20年棉花审定品种标准样品的DNA指纹库，探索棉花品种高通量SSR身份鉴定模式，为棉花品种真实性鉴定和新品种特异性鉴定提供依据；分析审定品种的遗传多样性和群体分化，为棉花不同生态区的适应性鉴定和培育适应新环境的品种提供理论基础。【方法】基于多重PCR技术和毛细管电泳检测方法，使用筛选得到的60个SSR标记构建1 015份棉花审定品种标准样品的DNA指纹库，通过植物品种DNA指纹库管理系统对审定品种SSR指纹进行两两比对，分析审定品种的遗传差异，筛选用于品种鉴定的核心SSR位点。利用聚类分析法和群体结构分析法分析1 015份棉花审定品种的遗传多样性，并计算群体间遗传分化指数。【结果】60个SSR标记在1 015个审定品种中共扩增出216种等位变异，平均等位变异数为3.6，平均值为0.37。1 015个审定品种的SSR指纹进行两两比较，共产生513 591组结果，样品间最大差异位点数为58个。差异位点百分比主要集中在41%—70%，涉及428 115组，占83.36%；其中，差异位点百分比在51%—60%时，涉及组数最多，为197 829组，占38.52%。品种间差异位点百分比大于20%时，占所有品种两两比对组数的99%以上，差异位点百分比低于20%的比对结果只占0.58%。基于组合鉴定法，筛选一套包含10个SSR位点的核心位点组合，在1 015个品种中鉴别能力达到99%。聚类结果和群体结构分析表明，1 015个品种被清晰地划分为5个亚群，G1（n=240）为早熟棉亚群，主要分布于中国北部和西北内陆地区，该亚群品种遗传多样性最丰富，品种间平均遗传距离为0.419。G2（n=277）亚群为中熟棉亚群，分布于长江流域，该亚群杂交种较多，亚群内平均遗传距离为0.309。G3（n=109）亚群属于早熟、中熟棉亚群，分布于河北黑龙港地区，该亚群品种遗传组分相对单一，亚群内平均遗传距离在陆地棉群体中最小，仅为0.150。G4（n=254）亚群属于中早熟棉亚群，主要分布于黄河流域，群体内平均遗传距离为0.307。G5（n=37）亚群由37份海岛棉组成，群体内平均遗传距离最小，为0.149。海岛棉与陆地棉之间遗传分化水平最高，平均ST值为0.503；陆地棉群体内，G3亚群与其他亚群之间遗传分化水平最高，ST值为0.193—0.242。长江流域与黄河流域相比，遗传分化水平最低，ST值为0.112。【结论】构建了1 015个中国近20年审定品种标准样品DNA指纹库，筛选了一套包含10个SSR位点的核心标记组合，可以清晰地鉴别99%以上的品种，创建了“核心位点+扩展位点”的高通量棉花鉴定模式；1 015个品种被划分为5个亚群，其中，陆地棉具有明显的地理分布特征。

棉花；标准样品；SSR标记；DNA指纹库；综合评价

0 引言

【研究意义】我国是世界上主要植棉大国，植棉历史悠久、地域辽阔。近年来，棉花审定品种的数量逐年增多。截至目前，我国通过国家审定和各省、自治区审定的棉花品种数量达到2 342个（中国种业大数据平台，http://202.127.42.47）。随着棉花品种遗传基础日趋狭窄和骨干亲本的集中使用，导致出现了一系列派生品种、近似品种、姐妹系。种子市场上不断出现“一名多品”“一品多名”、名不符实的现象，严重打击了育种者的积极性，侵害了农民的利益，给农业生产带来不利影响。构建棉花审定品种标准DNA指纹库有助于净化棉种市场、打击套牌侵权、激发种业创新，为品种审定、品种保护、市场监管提供技术支撑。标准化的DNA指纹图谱可以为司法仲裁提供客观的依据。当涉及品种权益、品种保护或品种纠纷时，可以通过比对DNA指纹图谱来确定品种的真实性和独特性，确保知识产权的合法保护。研究棉花审定品种进行遗传多样性，可以明确现有品种的遗传背景和系谱关系，有效指导常规育种的亲本选择及杂交组合选配，从而显著提高传统育种工作效率，支撑种业振兴方案的实施，推动棉花产业高质量发展。【前人研究进展】根据农业行业标准，赵久然等[1]、王凤格等[2-3]利用40对SSR核心引物构建了包含3 998个玉米审定品种标准样品的DNA指纹库；刘丽华等[4-6]、赵昌平等[7]利用21对SSR核心引物构建了560个小麦区域试验品系的DNA指纹库，以及使用42对SSR引物构建了75个小麦品种的DNA指纹库；林亦霞等[8]利用农业行业标准NY/T 1433-2014《水稻品种鉴定技术规程SSR标记法》[9]中48对SSR核心引物构建了94份杂交稻亲本的DNA指纹库。利用微卫星标记，程本义等[10]构建了279个浙江省水稻品种的DNA指纹图谱数据库。此外，马铃薯[11]、黄瓜[12]、大豆[13]、茄子[14]、辣椒[15-16]、花椰菜[17]等多种农作物均开展了DNA指纹库构建工作。随着棉花基因组测序工作的相继完成[18-20]，棉花品种DNA指纹库构建和遗传多样性研究的报道也越来越多。匡猛等[21]利用36对SSR引物构建了32份棉花主栽品种DNA指纹库；WANG等[22]利用40对SSR引物构建了1 242份棉花DUS测试样品的DNA指纹库。CHEN等[23]利用398对SSR引物，对不同亲本来源、不同选育时期、不同种植生态区的43份陆地棉基础种质进行了遗传多样性分析；贾子昉等[24]利用38对SSR引物分析了300份棉花种质资源的遗传背景；郭志军等[25]采用74个SSR标记对172份陆地棉自然群体的基因组变异进行扫描。HE等[26]利用10 522个高质量SNP位点分析了137个棉花登记品种的遗传多样性和群体结构；Hinze等[27]利用63K SNP芯片对395份棉花种质材料进行遗传分析。【本研究切入点】以往的研究对象往往是棉花核心种质[27-28]、育种材料[29-30]或自然群体[25]，很少涉及大量棉花审定品种标准样品；构建的棉花DNA指纹库规模较小，主要用于科学研究；构建指纹库所使用的标记和建库方法不标准，无法用于品种管理、市场监管、执法和司法仲裁。【拟解决的关键问题】本研究根据行业标准《棉花品种真实性鉴定SSR分子标记法》（NY/T 2634—2022）[31]，使用60个SSR标记对来自官方登记备案的1 015份棉花审定品种标准样品进行了棉花标准DNA指纹库构建，从分子水平上揭示了审定品种的遗传多样性和群体分化，筛选了一套包含10个SSR位点的核心标记组合，创建了“核心位点+扩增位点”的高通量棉花鉴定模式，为棉花品种管理、执法监督和培育新品种提供基础，同时，也为建立公平的品种市场竞争环境提供了技术支持。

1 材料与方法

1.1 试验材料

1 015份材料包括617份常规种和398份杂交种（附表1），品种由1996至2019年国家或各省、自治区审定，基本涵盖了中国曾经或正在推广的棉花品种。所有样品经农业农村部种业管理司批准，由中国种质资源库（北京，中国）提供，系国家和省级农作物品种审定委员会向品种选育单位收集的中国棉花审定品种标准样品。

1.2 SSR引物

60对SSR引物来自农业行业标准《棉花品种真实性鉴定SSR分子标记法》（NY/T 2634—2022）[31]，所用SSR引物由美国Thermofisher公司合成，每对SSR引物中，选择在上游引物5′端使用一种荧光染料进行标记，共选用了PET、NED、VIC、FAM 4种荧光染料，引物序列和荧光标记信息见附表2。

1.3 DNA提取

每份供试样品随机抽取70粒种子形成混合样品，充分磨碎后，取100—200 mg粉末于2.0 mL离心管，采用匡猛等[32]棉花种子DNA快速提取法提取棉花基因组DNA。采用酶标仪（EPOCH）进行DNA质量和浓度的测定，并使用超纯水稀释成40 ng·μl-1的DNA工作液。

1.4 SSR指纹图谱构建

采用农业行业标准《棉花品种真实性鉴定SSR分子标记法》（NY/T 2634—2022）[31]，分别使用60对SSR引物对1 015份棉花审定品种标准样品进行扩增。PCR扩增体系20 μL，包括10 μL 2×Taq Plus Master Mix（诺唯赞）、0.2 μmol·l-1SSR引物和120 ng DNA模板。PCR反应程序为94 ℃ 5 min；94 ℃ 45 s，60 ℃ 45 s，72 ℃ 45 s，32个循环；72 ℃ 7 min。

按照携带不同荧光标记的引物毛细管电泳时可以自由组合，携带相同荧光标记的引物，PCR扩增产物大小不同时毛细管电泳可以自由组合的原则，60个SSR标记组成6个十重毛细管电泳组合（表1），等体积取同一组合中10对引物的扩增产物，充分混匀。从混合液中吸取1 μL，加入DNA分析仪专用96孔上样板上。每孔再分别加入0.15 μL Liz-500分子量内标和8.85 μL去离子甲酰胺，95 ℃ 5 min，4 ℃冷却10 min以上，于ABI 3130xl基因分析仪（赛默飞公司）上进行电泳检测。荧光毛细管电泳检测程序为预电泳15 kV 3 min；2 kV进样2 s；电泳15 kV 20 min。

毛细管电泳结果采用植物品种DNA指纹管理系统（以下简称指纹库管理系统，登记号：2015SR085905）进行读取、储存与分析比对。

表1 多重引物组合信息

1.5 遗传多样性、群体结构和遗传分化

采用Power marker V3.25软件[33]分析SSR分子标记的等位基因数、杂合率、遗传多样性和多态性信息量（polymorphism information content，）等。采用类平均法（unweighted pair-group methodwith arithmetic means，UPGMA）对相似系数矩阵和遗传距离矩阵进行聚类分析。使用Structure 2.3.4软件[34]评估1 015份棉花审定品种的群体结构，基于数学模型划分类群。设定亚群数K为1—10，每个K值运行10次，参数Length of burn-in period设为1.0×104次，MCMC（markov chain monte carlo）设为1.0×105次；根据似然值最大原则，并结合Evanno等[35]的统计模型，确定最佳K值。使用VCFtools（v.4.0）软件分析群体间遗传差异[36]，分别计算每个群体与其他群体在每个SSR位点的ST值。

2 结果

2.1 SSR标记多态性评估

根据1 015个审定品种的标准DNA指纹数据，对60个SSR标记的总体多态性情况进行全面评估，对等位基因数、基因型数、遗传多样性、杂交种中引物杂合率、值和主要等位基因及频率多个参数进行分析（表2）。60个SSR引物总体多态性较高，共检测到216种等位变异（附表3），平均等位变异数为3.6。其中，PC29引物的等位变异最丰富，有10种等位基因，27种基因型，说明该引物最适合揭示该群体的遗传多样性。引物的值与等位基因数、遗传多样性、杂交种中杂合率基本呈正相关，值越高，等位基因数、遗传多样性等指标也越高。这套核心引物是使用代表中国棉花种质资源库7 362份棉花样品的419份核心种质筛选而来。棉花审定品种大规模建库数据，对引物的评估结果与以往的筛选评估结果基本一致[37]。

2.2 1 015个审定品种SSR指纹分析

将1 015个棉花审定品种标准SSR指纹上传植物品种DNA指纹管理系统（登记号：2015SR085905），常规种在每个SSR标记中只扩增出单条带，毛细管电泳对应峰型为单峰（常规种中棉所64号SSR指纹图谱见附图1），杂交种在SSR标记中可能扩增出单条带或2条带，毛细管电泳对应峰型为单峰或双峰（杂交种中棉所72号SSR指纹图谱见附图2）。所有品种的SSR指纹进行两两比对，共产生513 591组比对结果。其中，新海38号与川杂棉10号、新海25与华杂棉H11两组品种间差异位点数最大，为58个；所有海岛棉与陆地棉相比，差异位点均大于34个。差异位点百分比主要集中在41%—70%，涉及428 115组，占83.36%；其中，差异位点百分比在51%—60%时，涉及组数最多，为197 829组，占38.52%。品种间差异位点百分比大于20%时，占所有品种两两比对组数的99%以上；差异位点百分比低于20%的比对结果只占0.58%（表3）。

表2 60个SSR引物扩增效果

续表2 Continued table 2

以等位变异扩增片段大小代表变异类型The allele amplification fragment size represents the variant type

在品种鉴定中，2个样品差异位点百分比低于5%（小于3个差异位点），需要考虑2个样品是近似品种或相同品种。1 015个样品比对结果中差异位点在0—2共涉及152组，162个样品，其中41组（58个样品）比对结果显示，2个样品之间差异位点为0。该58份样品已经提交审定标准样品管理机构，正在进一步核实是否来自同一品种，如果来自同一品种，应在标准样品库中将指纹相同的样品保留一份，其他进行合并或清理，如果来自不同品种，应进一步提供其他差异。

2.3 核心SSR位点组合的筛选

基于1 015个样品60个SSR位点的基因型数据，按照引物值从高到低的顺序，使用植物品种DNA指纹管理系统分析，当选择表1中值最高的前5个引物PC29、PC12、PC15、PC13和PC03鉴定1 015个样品时，差异位点数在0—2的有46 446组，占9%。当选择表1中值最高的前10个引物鉴定1 015个样品时，差异位点数在0—2的有4 557组，占0.9%。当选择表1中值最高的前15个引物鉴定1 015个样品时，差异位点数在0—2的有1 353组，占0.26%。以此类推，每次增加5个引物，1 015个样品之间两两比对，差异位点在0—2的组数不断较少，其中，大于10个SSR位点时，不能鉴别的组数趋于平缓（图1）。因此，选择最高的前10个SSR引物PC29、PC12、PC15、PC13、PC03、PC17、PC21、PC01、PC06和PC07作为核心引物首先用于品种鉴定，其鉴别能力为99.1%。

表3 棉花审定品种遗传差异分析

图1 SSR位点组合对1 015个样品的鉴别能力

根据多重毛细管电泳组合原则，携带相同荧光基团的引物，扩增的等位变异片段不能重合；携带不同荧光基团的引物，扩增的等位变异片段可以重合。分析10个核心SSR引物携带荧光基团类型和扩增的等位变异片段大小，10个核心SSR引物可以组成一个十重毛细管电泳组合进行电泳。当10个核心引物组合不能区分样品时，增加剩余的50个扩展引物进行鉴定。

2.4 群体结构和聚类分析

使用Structure 2.3.4软件对1 015个标准样品进行群体结构分析，Ln(P(D))值随假定亚群数K值的增大而持续增大（图2-a），ΔK峰值出现在K为5时（图2-b），由此判定，该群体可被分为5个亚群（G1—G5）（图2-c）。分析各供试样品的Q值（某样品其基因组变异源于第K群体的概率），结果表明，917份样品（占90.3%）在某一亚群内Q值大于或等于0.5，说明这些样品遗传组分相对单一，可以明确划分到5个亚群内；98份样品（占9.7%）在任一亚群内Q值小于0.5，表明这些样品遗传组分比较复杂，无法明确归类，单独划为一个混合群H。采用基于Nei（1973）遗传距离的非加权组平均法（UPGMA）进行聚类分析（图2-d），结果与群体结构分析基本一致。1 015个棉花品种被清晰地划为4个陆地棉亚群和1个海岛棉亚群，不同亚群内的品种表现出明显的地理分布特征（表4）。

G1（n=240）亚群属于特早熟、早熟棉亚群，主要分布于中国北部和西北内陆地区，包括辽宁南部、新疆大部和甘肃河西走廊一带；品种主要以早熟的辽棉系列、酒棉系列、新陆早系列等棉花品种为主。该亚群材料间平均遗传距离最大，为0.419，说明此亚群遗传基础比较复杂，表现出较高的遗传多样性。G2（n=277）亚群属于中熟棉亚群，主要分布于长江流域，包括长江上游四川盆地丘陵地带、长江中游沿江地区、长江中游丘陵地区、长江下游和南襄盆地。品种主要包含川棉、鄂棉、湘棉、皖棉和赣棉等。G2亚群杂交种较多，共191份，占该亚群的69%，群体内平均遗传距离为0.309。G3（n=109）亚群属于早熟、中早熟棉亚群，主要分布于河北省黑龙港地区，包括沧州、衡水、邢台等地；品种主要包括冀棉、国欣棉、津棉等。品种遗传组分相对单一，亚群内平均遗传距离在陆地棉群体中最小，仅为0.150。G4（n=254）亚群属于中早熟棉亚群，主要分布于黄河流域，包括华北平原和黄淮平原地区。品种以鲁棉、豫棉、中棉所系列等为主，群体内平均遗传距离为0.307。G5（n=37）亚群由37份海岛棉组成，群体内平均遗传距离最小，为0.149。

表4 1 015个样品群体结构分析中亚群信息

a：Ln(P(D))与K值变化折线图；b：利用ΔK估算亚群数目；c：K=5时的群体结构图；d：1 015个棉花品种聚类图

2.5 群体间的遗传分化

进一步对群体间的分化程度分析，使用VCFtools（v.4.0）软件分别计算每个群体与其他群体在每个等位变异位点的ST值，成对比较亚群间的平均ST值（图3）。与陆地棉亚群相比，海岛棉群体间遗传分化最大，ST值为0.431—0.563。陆地棉亚群间遗传分化较小，ST值为0.112—0.242，其中，来自河北黑龙港地区的G3亚群与长江流域的G2亚群之间遗传分化指数最大，为0.242，这与G3亚群的品种在地理分布上比较聚集，平均种植纬度相对较高，而G2亚群的品种平均种植纬度最低有关。G3亚群与G1（中国北部和西北内陆）和G4（黄河流域）亚群相比，ST值相对较高，分别为0.198和0.193。G2（长江流域）与G4（黄河流域）相比，遗传分化最低，ST值为0.112；G2（长江流域）与G1（中国北部和西北内陆）相比，ST值为0.129；G1（中国北部和西北内陆）与G4（黄河流域）相比，ST值相对较低，为0.124。G1、G2和G4之间两两比较，ST值都较低，原因可能是长江流域亚群中杂交种较多，亲本中可能含有来自黄河流域或西北内陆的材料，远缘杂交提高品种的杂种优势；G1亚群南疆地区与黄河流域纬度相似，品种在生态适应性上差异较小，两地区可以相互引种，所以遗传分化较小。

图3 成对比较亚群间的平均FST值

3 讨论

3.1 SSR标记筛选

《中华人民共和国种子法》规定申请审定和新品种保护的品种应当符合特异性、稳定性、一致性的要求（DUS测试）。随着棉花骨干亲本的集中使用和棉花品种数量的迅速增加，DUS测试和品种管理面临诸多挑战，如周期长，一般要经过2—3年的重复观察；受季节限制，也易受自然灾害、病虫害等因素的影响；测试性状多，工作量大，人工成本高；测试性状多数为多基因控制的数量性状，受环境等因素影响较大，表现为连续变异，使性状分级不明显。分子标记在品种鉴定方面具有许多优势，包括共显性、高效性以及不受环境影响。目前，国内外公认的农作物DNA指纹鉴定技术主要是SSR标记技术[2, 5-6, 8]和SNP标记技术[38-41]。其中，SSR标记具有多态性高、共显性遗传、稳定性好的优点，并且SSR检测操作简便、对试验条件要求不高、检测成本低，便于在实验室开展工作，被国际植物新品种保护联盟（International Union for The Protection of New Varieties of Plants，UPOV）推荐为农作物品种鉴定优选标记[42]。我国建立了玉米[3]、小麦[7]、水稻[9]、向日葵[43]等15种作物SSR标记鉴定技术的农业行业标准，其中，《棉花品种真实性鉴定SSR分子标记法》（NY/T 2634—2022）[31]于2023年3月1日实施。相比遗传多样性分析和遗传定位研究，由于品种鉴定主要用于品种管理、市场监督和司法仲裁，因此更看重SSR标记的稳定性、重复性、扩增效率和易于判读的特性。本研究使用60个SSR标记以棉花全基因组测序数据为基础，以48份棉花基础种质10×重测序数据为来源，使用代表7 362份棉花材料的近400份棉花核心种质作为筛选材料[44]，通过变性聚丙烯酰胺凝胶电泳初筛和毛细管电泳复筛，自主开发的在基因组上具有单拷贝特性的引物，实现了四倍体作物二倍化分型，即常规种在60个SSR位点全部为单条带的纯合型，杂交种在60个SSR位点中会出现单条带的纯合型或2条带的杂合型，大大降低了数据统计与分析的难度[37]。

3.2 棉花品种真实性鉴定

品种真实性是种子的主要质量指标，影响作物的产量和品质。刘峰等[45]利用来自Cotton Marker Database（CMD）数据库中的11对首选核心SSR引物对25个区试样品和32个审定品种进行真实性鉴定，通过遗传相似系数判定，在遗传相似系数为0.984时，参试品系被分为53系。匡猛等[46]利用36对SSR核心引物对138个棉花主栽品种进行指纹库构建，每个品种检测6个单粒种子DNA，并将3个差异位点作为判定阈值。王欣怡等[47]利用26对SSR引物对10份棉花常规种进行真实性鉴定，采用非变性聚丙烯酰胺凝胶电泳法，每个样品检测15个单株。以往对棉花品种真实性鉴定的研究中，样品量太少，无法评估SSR标记对大批量样品的鉴别能力；每个样品检测多个单株的DNA，工作量大，而且选择的单株太少，统计学上没有代表性；检测方法多为聚丙烯酰胺凝胶电泳，不同批次，不同电泳板的结果无法比对。

本研究使用的60个SSR标记来自《棉花品种真实性鉴定SSR分子标记法》（NY/T 2634—2022）[31]，标记的鉴别能力经过大量样品的验证，标记的检测效果经过多家单位验证。本文首次使用标准方法为1 015个棉花标准样品建立了标准DNA指纹，每个样品使用70粒混样的DNA，可以代表样品的真实基因型；使用荧光毛细管电泳法，指纹数据上传到植物品种DNA指纹管理系统中（登记号：2015SR085905），可以随时进行比对。基于组合优化算法，筛选了一套具有10个SSR位点的核心标记组合，使用最少的SSR标记可以有效区分99%以上的棉花品种，用于棉花品种的高通量鉴定。在实际品种鉴定过程中首先使用含较少标记的核心组合对大量样本进行筛查，有效区分大多数品种；对于无法区分的样品，继续使用剩下的标记进行比对。“核心位点+扩展位点”分步鉴定的方法在极大提高检测通量的同时有效节约了成本，对于确保棉花品种的真实性、品种审定以及未来植物新品种的保护具有重要意义。

3.3 遗传多样性分析

在不同的生态环境（如年平均降水量、日照、太阳辐射和温度）下，品种产生趋异适应，成为遗传上有差异的、适应不同生态环境的类群，被称为品种的“生态型”[26]。近年来，我国植棉地区发生了很大的变化，棉区迁移加剧了研究陆地棉生态适应性的紧迫性，如何快速育成适应特定棉区的品种，是棉区变迁中亟需解决的问题。而亲本材料是育种工作的基础，对育种材料进行类群划分，明确育种基础材料遗传多样性、遗传背景及遗传结构，对选育新品种具有非常重要的作用。在棉花研究中利用SNP技术[26, 30, 44]对不同生态型进行类群划分已有报道。然而，SNP技术具有成本高、对试验条件要求高，不易操作等缺点。本文构建的1 015份棉花审定品种标准样品DNA指纹数据库首次揭示了中国近20年棉花审定品种的遗传多样性和群体结构，聚类分析和群体结构分析基本一致，1 015个棉花审定品种被清晰地划为5个生态亚群，这与前人[26, 30]的研究结果基本一致。4个陆地棉群体具有明显的地理分布特征，其中，西北内陆地区的棉花遗传多样性最丰富，长江流域的品种遗传多样性大于黄河流域，河北黑龙港地区的品种遗传多样性最小，研究结果与郭志军等[25]、别墅等[48]、刘文欣等[49]的研究结论基本相似。近20年审定品种的遗传多样性低于棉花基础种质[23]和自然群体[25]，说明在品种选育过程中由于追求产量和品质，抛弃了许多遗传变异，使棉花品种的遗传多样性进一步降低。在今后的育种工作中，可以更有针对性地对材料加以选择和利用，选择亲本时，除考虑材料间的亲缘关系外，还要考虑其复杂的遗传组分，尽可能挑选亲缘关系相对较远，遗传背景不同的材料作为父母本，不仅能够避免盲目组配，而且省时省力，加快育种进程，获得可预见性的优势品种。

4 结论

构建了1 015份棉花审定品种标准样品的DNA指纹数据库，并将其分为5个亚群：中国北部和西北内陆亚群、河北黑龙港亚群、黄河流域亚群、长江流域亚群和海岛棉亚群。筛选了一套包含10个SSR位点的核心标记组合，创建了棉花品种“核心位点+扩展位点”的高通量棉花鉴定模式。

[1] 赵久然, 王凤格, 易红梅, 田红丽, 杨扬. 我国玉米品种标准DNA指纹库构建研究及应用进展. 作物杂志, 2015(2): 1-6, 170.

ZHAO J R, WANG F G, YI H M, TIAN H L, YANG Y. Progress of construction of Chinese maize varieties standard DNA fingerprint database. Crops, 2015(2): 1-6, 170. (in Chinese)

[2] 王凤格, 杨扬, 易红梅, 赵久然, 任洁, 王璐, 葛建镕, 江彬, 张宪晨, 田红丽, 侯振华. 中国玉米审定品种标准SSR指纹库的构建.中国农业科学, 2017, 50(1): 1-14. doi:10.3864/j.issn.0578-1752.2017. 01.001.

WANG F G, YANG Y, YI H M, ZHAO J R, REN J, WANG L, GE J R, JIANG B, ZHANG X C, TIAN H L, HOU Z H. Construction of an SSR-based standard fingerprint database for corn variety authorized in China. Scientia Agricultura Sinica, 2017, 50(1): 1-14. doi: 10.3864/j. issn.0578-1752.2017.01.001. (in Chinese)

[3] 王凤格, 易红梅, 赵久然, 刘平, 张新明, 田红丽, 堵苑苑. 玉米品种鉴定技术规程SSR标记法: NY/T 1432-2014. 北京: 中国农业出版社, 2014．

WANG F G, YI H M, ZHAO J R, LIU P, ZHANG X M, TIAN H L, DU Y Y. Protocol for the Identification of Maize Varieties-SSR Marker Method: NY/T 1432-2014. Beijing: China Agriculture Press, 2014. (in Chinese)

[4] 刘丽华, 刘阳娜, 张明明, 李宏博, 庞斌双, 赵昌平. 我国75份小麦品种SNP和SSR指纹图谱构建与比较分析. 中国农业科技导报, 2020, 22(5): 15-23.

LIU L H, LIU Y N, ZHANG M M, LI H B, PANG B S, ZHAO C P.Construction and comparative analysis of SNP and SSR fingerprints of 75 wheat cultivars in China. Journal of Agricultural Science and Technology, 2020, 22(5): 15-23. (in Chinese)

[5] 刘丽华, 庞斌双, 刘阳娜, 邱军, 李宏博, 张欣, 王娜, 赵昌平. 2009-2014年国家冬小麦区域试验品系的遗传多样性及群体结构分析. 麦类作物学报, 2016, 36(2): 165-171.

LIU L H, PANG B S, LIU Y N, QIU J, LI H B, ZHANG X, WANG N, ZHAO C P. Genetic diversity and population structure analysis of winter wheat lines from recent national regional trials in China. Journal of Triticeae Crops, 2016, 36(2): 165-171. (in Chinese)

[6] 刘丽华, 庞斌双, 李宏博, 刘阳娜, 福德平, 王娜, 赵昌平. 2009-2015年北京市冬小麦区域试验品系的DNA指纹分析. 作物杂志, 2016(5): 13-18.

LIU L H, PANG B S, LI H B, LIU Y N, FU D P, WANG N, ZHAO C P. DNA fingerprint analysis of winter wheat lines of Beijing regional trials from 2009 to 2015. Crops, 2016(5): 13-18. (in Chinese)

[7] 赵昌平, 支巨振, 邱军, 庞斌双, 刘丽华, 王立新. 主要农作物品种真实性SSR分子标记检测普通小麦: NY/T 2859-2015. 北京: 中国农业出版社, 2015.

ZHAO C P, ZHI J Z, QIU J, PANG BS, LIU LH, WANG LX. Variety genuineness testing of main crops with SSR markers-Wheat (L.): NY/T 2859-2015. Beijing: China Agriculture Press, 2015. (in Chinese)

[8] 林亦霞, 王梓辛, 刘欢, 王征, 梁满中, 戴小军, 陈良碧. 基于NYT 1433-2014中48对SSR引物的94份杂交稻亲本DNA分子数字指纹库研究. 中国水稻科学, 2016, 30(6): 593-602.

LIN Y X, WANG Z X, LIU H, WANG Z, LIANG M Z, DAI X J, CHEN L B. Research on DNA molecular digital fingerprint database based on 48 pairs of SSR primers for 94 hybrid rice parents in NYT 1433-2014.Chinese journal of Rice Science, 2016, 30(6): 593-602. (in Chinese)

[9] 徐群, 魏兴华, 庄杰云, 吕波, 袁筱萍, 刘平, 张新明, 余汉勇, 堵苑苑. 水稻品种鉴定技术规程SSR标记法: NY/T 1433-2014. 北京: 中国农业出版社, 2014.

XU Q, WEI X H, ZHUANG J Y, LÜ B, YUAN X P, LIU P, ZHANG X M, YU H Y, DU Y Y. Protocol for the Identification of Rice Varieties-SSR Marker Method: NY/T 1433-2014. Beijing: China Agriculture Press, 2014. (in Chinese)

[10] 程本义, 吴伟, 夏俊辉, 刘鑫, 庄杰云, 杨仕华. 浙江省水稻品种DNA指纹数据库的初步构建及其应用. 浙江农业学报, 2009, 21(6): 555-560.

CHENG B Y, WU W, XIA J H, LIU X, ZHUANG J Y, YANG S H. Construction and application of DNA fingerprint database of rice varieties in Zhejiang Province. Acta Agriculturae Zhejiangensis, 2009, 21(6): 555-560. (in Chinese)

[11] Ghislain M, NÚÑEZ J, DEL ROSARIO HERRERA M, PIGNATARO J, GUZMAN F, BONIERBALE M, SPOONER D M. Robust and highly informative microsatellite-based genetic identity kit for potato. Molecular Breeding, 2009, 23(3): 377-388.

[12] ZHANG J, YANG J J, ZHANG L K, LUO J, ZHAO H, ZHANG J N, WEN C L. A new SNP genotyping technology Target SNP-seq and its application in genetic analysis of cucumber varieties.Scientific Reports, 2020, 10: 5623.

[13] WEI Z Y, LI H H, LI J, Yasir A G, QIU L J. Accurate identification of varieties by nucleotide polymorphisms and establishment of scannable variety IDs for soybean germplasm. Acta Agronomica Sinica,2018, 44(3): 315.

[14] LIU W L, QIAN Z W, ZHANG J, YANG J J, WU M S, BARCHI L, ZHAO H Y, SUN H H, CUI Y L, WEN C L. Impact of fruit shape selection on genetic structure and diversity uncovered from genome- wide perfect SNPs genotyping in eggplant. Molecular Breeding, 2019, 39(10): 140.

[15] DU H H, YANG J J, CHEN B, ZHANG X F, ZHANG J, YANG K, GENG S S, WEN C L. Target sequencing reveals genetic diversity, population structure, core-SNP markers, and fruit shape-associated loci in pepper varieties. BMC Plant Biology, 2019, 19(1): 578.

[16] JUNG J K, PARK S W, LIU W Y, KANG B C. Discovery of single nucleotide polymorphism in Capsicum and SNP markers for cultivar identification. Euphytica, 2010, 175(1): 91-107.

[17] YANG Y Y, LYU M J, LIU J, WU J J, WANG Q, XIE T Y, LI H C, CHEN R, SUN D L, YANG Y X, YAO X W.Construction of an SNP fingerprinting database and population genetic analysis of 329 cauliflower cultivars. BMC Plant Biology, 2022, 22(1): 522.

[18] WANG K B, WANG Z W, LI F G, LI F G, YE W W, WANG J Y, SONG G L, YUE Z, CONG L, SHANG H H, ZHU S L, ZHOU C S, LI Q, YUAN Y L, LU C R, WEI L L, GUANG C Y, ZHENG Z Q, YIN Y, ZHANG X Y. The draft genome of a diploid cotton. Nature Genetics, 2012, 44(10): 1098-1103.

[19] LI F G, FAN G Y, WANG K B, SUN F M, YUAN Y L, SONG G L, LI Q, MA Z Y, LU C R, ZHOU C S, CHEN W B, LIANG X M, SHANG H H, LIU W Q, SHI C C, XIAO G H, GOU C Y, YE WW, XU X, ZHANG X Y, WEI H L, LI Z F, ZHANG G Y, WANG J Y, KOHEL R J, PERCY R G, YU J Z, ZHU Y X, WANG J, YU S X, LIU K. Genome sequence of the cultivated cotton.Nature Genetics, 2014, 46(6): 567-572.

[20] ZHANG T Z, HU Y, JIANG W K, FANG L, GUAN X Y, CHEN J D, ZHANG J B, SASKI CA, SCHEFFLER B E, STELLY D M, HULSE-KEMP A M, WAN Q, LIU B L, LIU C X, WANG S, PAN M Q, WANG Y K, WANG D W, YE W X, CHANG L J, ZHANG W P, SONG Q X, KIRKBRIDE R C, CHEN X Y, DENNIS, J L, LLEWELLYN D J, PETERSON D G, THAXTON P, JONES D C, WANG Q, XU X Y, WU H T, ZHOU L, MEI G F, CHEN S Q, TIAN Y, XIANG D, LI X H, DING J, ZUO Q Y, TAO L N, LIU Y C, LI J, LIN Y, HUI Y Y, CAO Z S, CAI C P, ZHU X F, JIANG Z, ZHOU B L, GUO W Z, LI R Q, CHEN Z J, ZHANG H. Sequencing of allotetraploid cotton (L. acc. TM-1) provides a resource for fiber improvement. Nature Biotechnology, 2015, 33(5): 531-537.

[21] 匡猛, 杨伟华, 许红霞, 王延琴, 周大云, 冯新爱. 中国棉花主栽品种DNA指纹图谱构建及SSR标记遗传多样性分析. 中国农业科学, 2011, 44(1): 20-27. doi: 10.3864/j.issn.0578-1752.2011. 01.003.

KUANG M, YANG W H, XU H X, WANG Y Q, ZHOU D Y, FENG X A. Construction of DNA fingerprinting and analysis of genetic diversity with SSR markers for cotton major cultivars in China.Scientia Agricultura Sinica,2011, 44(1): 20-27. doi: 10.3864/j.issn. 0578-1752.2011.01.003. (in Chinese)

[22] WANG L Y, ZHENG Y S, ZHANG H, WANG D J, WANG M M, WANG H, DUAN L L, LI H, WANG W, GENG H J, CHENG H M, AN C C, HAN R X, LI R Y. Genetic characterization of cotton varieties and genetic threshold value determination for similar variety selection in cotton DUS testing. Genetic Resourcesand Crop Evolution, 2023, 70(8): 2463-2477.

[23] CHEN G, DU X M. Genetic diversity of source germplasm of upland cotton in China as determined by SSR marker analysis. Acta Genetica Sinica, 2006, 33(8):733-745.

[24] 贾子昉，王清连，董娜. 陆地棉种质资源的表型及SSR遗传多样性分析. 生物技术通讯, 2019, 30(5): 653-661.

JIA Z F, WANG Q L, DONG N. Phenotype and SSR genetic diversity of upland cotton germplasm resources. Letters in Biotechnology, 2019, 30(5): 653-661. (in Chinese)

[25] 郭志军, 赵云雷, 陈伟, 李运海, 王红梅, 龚海燕, 桑晓慧. 陆地棉SSR标记遗传多样性及其与农艺性状的关联分析. 棉花学报, 2014, 26(5): 420-430.

GUO Z J, ZHAO Y L, CHEN W, LI Y H, WANG H M, GONG H Y, SANG X H. Genetic diversity and association analysis of upland cotton based on SSR markers.Cotton Science, 2014, 26(5): 420-430.(in Chinese)

[26] HE S P, SUN G F, HUANG L Y,YANG D G, DAI P H, ZHOU D Y, WU Y Z, MA X F, DU X M, WEI S J, PENG J, KUANG M. Genomic divergence in cotton germplasm related to maturity and heterosis. Journal of Integrative Plant Biology, 2019, 61(8): 929-942.

[27] Hinze L L, Hulse-Kemp A M, Wilson I W, ZHU Q H, LLEWELLYN D J, TAYLOR J M, SPRIGGS A, FANG D D, ULLOA M, BURKE J J, GIBAND M, LACAPE J M, VAN DEYNZE A, UDALL J A, SCHEFFLER J A, HAGUE S, WENDEL J F, PEPPER A E, FRELICHOWSKI J, LAWLEY C T, JONES D C, PERCY R G, STELLY D M. Diversity analysis of cotton (L.) germplasm using the CottonSNP63K array. BMC Plant Biology, 2017, 17(1): 37.

[28] Campbell B T, Saha S, Percy R, Frelichowski J, JENKINS J N, PARK W, MAYEE C D, GOTMARE V, DESSAUW D, GIBAND M, DU X, JIA Y, CONSTABLE G, DILLON S, ABDURAKHMONOV I Y, ABDUKARIMOV A, RIZAEVA S M, ABDULLAEV A, BARROSO P A V, PÁDUA J G, HOFFMANN L V, Podolnaya L. Status of the global cotton germplasm resources. Crop Science, 2010, 50(4): 1161-1179.

[29] FANG L, WANG Q, HU Y, JIA Y H, CHEN J D, LIU B L, ZHANG Z Y, GUAN X Y, CHEN S Q, ZHOU B L, MEI G F, SUN J L, PAN Z E, HE S P, XIAO S H, SHI W J, GONG W F, LIU J G, MA J, CAI C P, ZHU X F, GUO W Z, DU X M, ZHANG T Z. Genomic analyses in cotton identify signatures of selection and loci associated with fiber quality and yield traits. Nature Genetics, 2017, 49(1): 1089-1098.

[30] HE S P, SUN G F, GENG X L, GONG W F, DAI P H, JIAY H, SHI W J, PAN Z E, WANG J D, WANG L Y, XIAO S H, CHEN B J, CUI S F, YOU C Y, XIE Z M, WANG F, SUN J, FU G Y, PENG Z, HU D W, WANG L R, PANG B Y, DU X M. The genomic basis of geographic differentiation and fiber improvement in cultivated cotton.Nature Genetics, 2021, 53(1): 916-924.

[31] 匡猛, 晋芳, 吴玉珍,金石桥, 彭军, 黄龙雨, 何团结, 魏守军, 周大云, 王延琴, 黄义文, 郑曙峰.棉花品种真实性鉴定SSR分子标记法: NY/T 2634-2022. 北京: 中国农业出版社, 2023.

KUANG M, JIN F, WU Y Z, JIN S Q, PENG J, HUANG L Y, HE T J, WEI S J, ZHOU D Y, WANG Y Q, HUANG Y W, ZHENG S F. Cotton (spp. L.) Variety Genuineness Identification-SSR Based Methods: NY/T 2634-2022. Beijing: China Agriculture Press, 2023. (in Chinese)

[32] 匡猛, 杨伟华, 许红霞, 王延琴, 周大云, 冯新爱. 单粒棉花种子DNA快速提取方法. 分子植物育种, 2010, 8(4): 827-831.

KUANG M, YANG W H, XU H X, WANG Y Q, ZHOU D Y, FENG X A. A rapid method of DNA extraction from single cotton seed. Molecular Plant Breeding, 2010, 8(4): 827-831. (in Chinese)

[33] LIU K J, MUSE S V. PowerMarker: an integrated analysis environment for genetic marker analysis. Bioinformatics, 2005, 21(9): 2128-2129.

[34] Pritchard J K, WEN X, FALUSH D. Documentation for structure software: version 2.3. Chicago: University of Chicago, 2010.

[35] EVANNO G, REGNAUT S, GOUDET J. Detecting the number of clusters of individuals using the software STRUCTURE: a simulation study. Molecular Ecology, 2005, 14(8): 2611-2620.

[36] DANECEK P, AUTON A, ABECASIS G, ALBERS C A, BANKS E, DEPRISTO M A, HANDSAKER R E, LUNTER G, MARTH G T, SHERRY S T, MCVEAN G, DURBIN R, GENOMES PROJECT ANALYSIS GROUP 1000. The variant call format and VCFtools. Bioinformatics, 2011, 27(15): 2156-2158.

[37] WU Y Z, HUANG L Y, ZhOU D Y, FU X Q, LI C, WEI S J, PENG J, KUANG M. Development and application of perfect SSR markers in cotton. Journal of Cotton Research, 2020, 3(1): 21.

[38] TIAN H L, WANG F G, ZHAO J R, YI H M, WANG L, WANG R, YANG Y, SONG W. Development of maizeSNP3072, a high-throughput compatible SNP array, for DNA fingerprinting identification of Chinese maize varieties. Molecular Breeding, 2015, 35(6): 136.

[39] 刘丽华, 庞斌双, 刘阳娜, 李宏博, 王娜, 王拯, 赵昌平. 基于SNP标记的小麦高通量身份鉴定模式. 麦类作物学报, 2018, 38(5): 529-534.

LIU L H, PANG B S, LIU Y N, LI H B, WANG N, WANG Z, ZHAO C P. High-throughput identification mode for wheat varieties based on SNP markers. Journal of Triticeae Crops,2018, 38(5): 529-534. (in Chinese)

[40] GREWAL S, HUBBART-EDWARDS S, Yang C Y, DEVI U, BAKER L, HEATH J, ASHLING S, SCHOLEFIELD D, HOWELLS C, YARDE J, ISAAC P, KING I P, KING J. Rapid identification of homozygosity and site of wild relative introgressions in wheat through chromosome-specific KASP genotyping assays. Plant Biotechnology Journal, 2020, 18(3): 743-755.

[41] KUANG M, WEI S J, WANG Y Q, ZHOU D Y, MA L, FANG D, YANG W H, MA Z Y. Development of a core set of SNP markers for the identifcation of upland cotton cultivars in China. Journal of Integrative Agriculture, 2016, 15(5): 954-962.

[42] UPOV I V F T. Guidelines for DNA- profiling: Molecular Marker Selection and Database Construction ( "BMT guidelines"). Geneva: Switzerland: UPOV, 2010.

[43] 张曼, 支巨振, 牛庆杰, 赵建忠, 晋芳, 刘丰泽, 孙墨可, 李慧英, 任雪贞, 田娟, 董玉迪, 张雷, 于学鹏, 王祉诺, 谭丽萍, 黄绪堂, 于海峰, 刘胜利. 向日葵品种真实性鉴定SSR分子标记法: NY/T 3752-2020. 北京: 中国农业出版社, 2020.

ZHANG M, ZHI J Z, NIU Q J, ZHAO J Z, JIN F, LIU F Z, SUN M K, LI H Y, REN X Z, TIAN J, DONG Y D, ZHANG L, YU X P, WANG Z N, TAN L P, HUANG X T, YU H F, LIU S L. Sunflower (L.) Variety Genuineness Identification-SSR- Based Methods: NY/T 3752-2020. Beijing: China Agriculture Press, 2020. (in Chinese)

[44] MA Z Y, HE S P, WANG X F, SUN J L, ZHANG Y, ZHANG G Y, WU L Q, LI Z K, LIU Z H, SUN G F, YAN Y Y, JIA Y H, YANG J, PAN Z E, GU Q H, LI X Y, SUN Z W, DAI P H, LIU Z W, GONG W F, WU J H, WANG M, LIU H W, FENG K Y, KE H F, WANG J D, LAN H Y, WANG G N, PENG J, WANG N, WANG L R, PANG B Y, PENG Z, LI R Q, TIAN S L, DU X M. Resequencing a core collection of upland cotton identifies genomic variation and loci influencing fiber quality and yield. Nature Genetics, 2018, 50(6): 803-813.

[45] 刘峰, 冯雪梅, 钟文, 刘玉栋, 阴祖军, 韩秀兰, 徐子初, 沈法富. 适合棉花品种鉴定的SSR核心引物的筛选. 分子植物育种, 2009, 7(6): 1160-1168.

LIU F, FENG X M, ZHONG W, LIU Y D, YING Z J, HAN X L, XU Z C, SHEN F F. Screening of SSR Core Primer Pairs for Identificating Cotton Cultivar. Molecular Plant Breeding, 2009, 7(6): 1160-1168.(in Chinese)

[46] 匡猛, 杨伟华, 许红霞, 王延琴, 周大云, 冯新爱, 张玉翠, 王飞, 苏畅. 中国棉花主栽品种DNA指纹数据库初步构建研究. 棉花学报, 2012, 24(3): 229-237.

KUANG M, YANG W H, XU H X, WANG Y Q, ZHOU D Y, FENG X A, ZHANG Y C, WANG F, SU C. Primary construction of a DNA fingerprint database of leading cotton varieties in China.Cotton Science, 2012, 24(3): 229-237.(in Chinese)

[47] 王欣怡, 艾先涛, 王俊铎, 梁亚军, 龚照龙, 郑巨云, 郭江平, 买买提·莫明, 李雪源. 利用SSR快速鉴定棉花品种真实性和纯度. 作物学报, 2017, 43(10): 1565-1572.

WANG X Y, AI X T, WANG J D, LIANG Y J, GONG Z L, ZHENG J Y, GUO J P, MAIMAITI M M, LI X Y. Rapid identification system of purity and authenticity in cotton varieties by SSR markers. Acta Agronomica Sinica, 2017, 43(10): 1565-1572.(in Chinese)

[48] 别墅, 孔繁玲, 周有耀, 张光梅, 张群远, 王孝纲. 中国3大主产棉区棉花品种遗传多样性的RAPD及其与农艺性状关系的研究. 中国农业科学, 2001, 34(6): 597-603.doi:10.3321/j.issn:0578-1752. 2001.06.004.

BIE S, KONG F L, ZHOU Y Y, ZHANG G M, ZHANG Q Y, WANG X G.Genetic diversity analysis of representative elite cotton varieties in three main cotton regions in China by RAPD and its relation with agronomic characteristics. Scientia Agricultura Sinica, 2001, 34(6): 597-603.doi: 10.3321/j.issn:0578-1752.2001.06.004. (in Chinese)

[49] 刘文欣, 孔繁玲, 郭志丽, 张群远, 彭惠茹, 付小琼, 杨付新. 建国以来我国棉花品种遗传基础的分子标记分析. 遗传学报, 2003, 30(6): 560-570.

Liu W X, Kong F L, Guo Z L, ZHANG Q Y, PENG H R, FU X Q, YANG F X. An analysis about genetic basis of cotton cultivars in China since 1949 with molecular markers. Acta Genetica Sinica, 2003, 30(6): 560-570.(in Chinese)

Construction of SSR fingerprint library and comprehensive evaluation for approved cotton varieties in China

WU YuZhen1,2, HUANG LongYu1,2, ZHOU DaYun1,2, HUANG YiWen1,2, FU ShouYang1,2, PENG Jun1,2, KUANG Meng1,2

1Institute of Cotton Research, Chinese Academy of Agricultural Sciences/State Key Laboratory of Cotton Biology, Anyang 450001, Henan;2National Nanfan Research Institute (Sanya), Chinese Academy of Agricultural Sciences, Sanya 572024, Hainan

【Objective】Cotton, a heterotetraploid crop with a complex genome structure, faces challenges in achieving high homozygosity due to frequent cross-pollination. The absence of effective technical supervision in the cotton seed market and the persistence of disordered varieties have a negative impact on the consistency of fiber quality. The objectives of this study are threefold: to establish a DNA fingerprint database for approved cotton varieties in China over the past 20 years, to explore a high-throughput SSR identification model for cotton varieties, and to provide a basis for the authentication of existing varieties and the specific identification of new cotton varieties. Additionally, we aim to analyze the genetic diversity and population differentiation among approved varieties. Ultimately, our goal is to provide a theoretical framework for identifying cotton varieties that are well-suited to different ecological regions and for developing varieties that can adapt to new environments.【Method】Based on multiplex PCR technology and capillary electrophoresis detection method, using 60 SSR markers screened to construct a DNA fingerprint library of 1 015 standard samples of cotton approved varieties. Through the plant variety DNA fingerprint library management system, the SSR fingerprints of approved varieties were compared pairwise to analyze the genetic differences of approved varieties and screen the core SSR loci for variety identification. Cluster analysis and population structure analysis were used to analyze the genetic diversity of 1 015 cotton approved varieties and calculate the genetic differentiation index between populations.【Result】60 SSR markers amplified 216 allelic variations in 1 015 approved varieties, with an average of 3.6 allelic variations and a meanvalue of 0.37. When the SSR fingerprints of the 1 015 approved varieties were compared, a total of 513 591 pairwise results were generated, with a maximum of 58 different loci between samples. The percentage of different loci was mainly concentrated at 41%-70%, involving 428 115 groups, accounting for 83.36%. Among them, when the percentage of different loci was at 51%-60%, the largest number of groups was involved, accounting for 197 829 groups, accounting for 38.52%. When the percentage of different loci between varieties was greater than 20%, it accounted for more than 99% of all pairwise comparison groups, and the pairwise comparison results with a percentage of different loci lower than 20% only accounted for 0.58%. Based on the combination identification method, a set of cores SSR loci containing 10 SSR loci was selected, and the discrimination ability among the 1 015 varieties reached 99%. Clustering results and population structure analysis showed that the 1 015 varieties were clearly divided into five subpopulations. G1 (n=240) was an early-maturing cotton subpopulation, mainly distributed in northern and inland regions of China. This subpopulation had the most abundant genetic diversity among varieties, with an average genetic distance of 0.419 between varieties. G2 (n=277) was a medium-maturing cotton subpopulation, distributed in the Yangtze River Basin. This subpopulation had more hybrids, with an average genetic distance of 0.309 within the subpopulation. G3 (n=109) belonged to early-maturing and medium-maturing cotton subpopulations, distributed in Hebei'sHeilonggang region. This subpopulation had relatively simple genetic components, with the smallest average genetic distance among upland cotton subpopulations at only 0.150. G4 (n=254) belonged to a medium-early maturing cotton subpopulation, mainly distributed in the Yellow River Basin. The average genetic distance within this subpopulation was 0.307. G5 (n=37) consisted of 37 sea island cotton samples, with the smallest average genetic distance within the population at only 0.149. The genetic differentiation level between sea island cotton and upland cotton was the highest, with an averageSTvalue of 0.503. Among upland cotton populations, the genetic differentiation level between G3 and other subpopulations was the highest, withSTvalues ranging from 0.193 to 0.242. The genetic differentiation level between the Yangtze River Basin and the Yellow River Basin was the lowest, with anSTvalue of 0.112.【Conclusion】A DNA fingerprint library of standard samples of 1 015 approved varieties in China over the past 20 years was constructed. A set of cores SSR loci containing 10 SSR loci was selected to clearly identify more than 99% of the varieties. A high-throughput cotton identification model of "core loci + extended loci" was created. The 1 015 varieties were divided into five subpopulations, and upland cotton had obvious geographical distribution characteristics.

cotton; standard samples; SSR markers; DNA fingerprint database; comprehensive evaluation

10.3864/j.issn.0578-1752.2024.08.002

2023-11-09；

2024-01-08

三亚崖州湾科技城科技专项（SCKJ-JYRC-2022-62）、棉花生物育种与综合利用全国重点实验室项目（CB2022C08）、农业生物育种重大项目（2022ZD04019）、海南省自然科学基金联合项目（SQ2021ZRLH0113）

吴玉珍，Tel：13629838042；E-mail：15959263920@163.com。通信作者彭军，Tel：13937228796；E-mail：jun_peng@126.com。通信作者匡猛，Tel：15836313471；E-mail：kuangmeng007@163.com

（责任编辑李莉）