尹中江,廖文华,高小丽
(西藏自治区农牧科学院农业研究所,西藏 拉萨 850032)
作物种质资源(又称品种资源、遗传资源或基因资源)是人类社会生存与发展的战略性资源;是作物育种、生物科学研究和农业生产发展的物质基础,是农业持续发展的重要保障,是提高农业综合生产能力,是促进生产力发展的核心,是农业得以持续发展的重要基础,维系国家食物安全的重要保证和重要资源;同信息资源一样,必须充分认识作物种质资源的战略重要性和潜在价值[1]。
西藏农作物各持资源研究工作始于1952年,自1978年开展学科体系以来,主要经历了资源引进、资源收集与考察、农艺性状鉴定与利用研究、资源贮藏[2],目前研究工作重点与方向是资源评价利用、建立及适应西藏农业生产对更多资源需求利用研究。
本研究是基于对所分析青稞资源,研究采用模糊聚类的方法,主要目的是完成区内地方青稞资源(含野生近缘种)的品质检测与分析,并建立和完善西藏青稞资源品质性状信息库,并做出相关信息的评价,为西藏青稞(及其它作物)育种和生产提供强有力的支撑。
项目实施地点资源田间种植部分安排在农业研究所4号试验地,占地0.47 hm2。前茬为油菜,土质砂壤,肥力中等,试验于2017年4月10日播种,内容主要进行田间抗倒性鉴定试验;安排在农业研究所品种资源室温室内进行;实际种植参试800份青稞材料。笔者在数据分析实际中,仅选择了结果中684份材料作为本文分析应用数据(表1)。
运用模糊数学方法将模糊性的定义,通过模糊关系运算与合成,将其定量化,确定青稞品种间的亲疏关系,通过“物与类聚”,对原有模糊性的概念客观分型归类[3]。运用模糊数学方法之一进行模糊聚类分析。
为了对青稞抗倒性进行一个整体评价,主要选择同抗倒有关株高(cm)、外径(mm)、壁厚(mm)、茎秆强度4个测量值来衡量青稞茎秆强度与抗倒性。
数据处理与分析计算:为了进行评价优劣,消除量纲对观测值的影响,我们对数据进行了无量纲化处理计算,为了进行综合评价,我们采取了模糊聚类分析。通过编制程序,数据处理软件使用:MATLAB 2018 a 和2017 b Windows版上通过运行,计算机硬件使用上:笔记本I7-7700 HQ CPU和台式I5-2400 CPU 通过运行。
表1 青稞抗倒性数据
注:此表限于篇幅只列出部分数据。
表2 标准化数据矩阵结果
将试验取得数据利用标准差公式中的平移· 极差变换(也称:极差变换)[4],对原始数据进行数据标准化计算处理。
(1)
利用公式(1)标准化后的数据范围介于[0,1]之间,计算得到的数组矩阵,数据如表2所示(限于篇幅,数据列出了部分数据)。
标定,也就是计算模糊相似矩阵。其计算公式很多,本文利用欧式距离法(即:一般欧式距离法)[5]对分析数据进行标定计算。
rij=1-cd(ui,uj)
(2)
利用公式(2)计算,计算得到的数组矩阵,数据如表3(只保留前5行和后1行部分数据)。
2.3.1 计算模糊等价关系矩阵 按照计算所得的模糊相似矩阵,依据传递闭包法计算出模糊等价矩阵。
在模糊相似矩阵的基础上,经过7次计算,可以计算出模糊等价关系矩阵,计算得到的数组矩阵,数据如表4(只保留部分数据)。
表3 模糊相似矩阵
表4 模糊等价关系矩阵
2.3.2 根据不同的λ截距水平进行分类 按照模糊等价矩阵和计算的λ截距水平对所得青稞品种进行聚类分析。
模糊等价矩阵基础上,可以计算出λ截距矩阵:数据如表5。
表5 λ截距矩阵及λ截距值
续表5 Continued table 5
序号123456450.95660.95630.95590.95560.95520.9546460.95450.95430.95420.95300.95200.9517470.95160.95080.95030.94920.94910.9481480.94690.94660.94620.94580.94510.9446490.94440.94330.94320.94200.94140.9398500.93940.93840.93820.93770.93740.9368510.93570.93510.93440.93410.93380.9337520.93260.92720.92490.92320.92240.9088530.89920.87190.86530.81510.81080.8096
注:318个λ截距值。①说明参试青稞材料,据λ截距值可以分为318个类型。②但实际应用分类时,也要结合实际情况可再分不同需求类型。
2.3.3 画模糊聚类图 有了λ截距数据值,就可以将青稞材料,依据表6的λ截距水平,将材料划归于不同的类型。结合农业生产实际意义,聚类则更有意义。图1中左边竖排红色部分为λ值,顶部粉红色为聚类后的材料序号,右边竖排蓝色部为分类后的序号。
图1 青稞模糊聚类图
图2 青稞糊聚类图(图1λ值和排序后数组局部放大效果图)
图3 青稞糊聚类图(图1分类值和排序后数组局部放大效果图)
序号123456789101112131415113732925525956215445555916026116036346532658664672618563629642394478274328329355381400346148628830034631634114218516414916520615518942292401672022042332362822872852182442892932695357401296330344393402348351368360371375384422641040441243534539645147629139741642921126527172782993653673664054474554775015105594673105248487511539453521527583625374379406430466378424930535341546550832738535228335936429532239242110497230248308389420499533545506496565593640637116674134254344795075436796416635095173095022231226828033739541444143831536144249553145850057213528306377399445456489557606514243302284326184141972092461621884592906165235405535375746176131561563565951853253660063657062358060524925430116320354335376423498253267380382437463471522473175054745965495665946243503564094084754192325731863164364457663933439845249445748154857740744619488139179551614150177208214261225226314383597206273914113534538550607628655542581622587462214844931191344685192102342762982592624335295542259962063314317247049156221322022165421925764623272286317590632652666670325347403443338369427244645354495125155605646692122793184925922556512566867668235842848064957923958236356815121525226227235258238520530609612247270312332386584370
续表6 Continued table 6
序号12345678910111213141527645365071697944476592102811101251292880971111281411148913115816315913617519019329859910810712339264266439490578241362426661305585032074316481335711044825164241855619513316505891351694855465985885475566603264436132759312014615317610011213814431934067729460833275638541306646747224303159586249342526349094919510911813218645201242277353243492505851701802971998411712713715716818336195174196178187121263203217231281390205147154371616746756806831139873656761018710688963817118222414866263116448145292284060433337239339525273313444450454342569601115126206571944021619823725132310330762625638730461057706741105665684160228673222140567166191774404174694246035413361833686716783435265651601224358623371561738327481156131191012200441241526811924543613173863068714164578192260303321388432472483331215045411812246825357552451586647
注:参试的青稞,模糊聚类排序后的数组矩阵的排序值。
从收获的青稞材料整体分析,从模糊聚类结果上讲,依据λ值可以分为318个不同的类型,按照平均数简单的统计结果,在684份资源里则可以说每2.15个品种可归为1个相同的类型,即其品种的特征与特性是一样的,可以看作是同一个品种资源类型。
按照当λ=1时,参试青稞品种各自属于独立一类。即:{1,373,29,2,552,595,621,544,555,591,602,611,603,634,653,658,664,672,……,575,52,4,5,15,86,647};
当λ=0.9957时,分为两类,即:{1,29,2,552,595,621,544,555,591,602,611,603,634,653,658,664,672,……, 575,52,4,5,15,86,647}和{373}。
按照表3的λ值,依次类推,将参试青稞资源材料归类分为318个类型。
图1~3的模糊聚类结果图显示,青稞材料的有明显的差异性。从品种序号排序顺序上看,前面的青稞品种如:1,373,29,2,552,595,621,544,555,和排在后面青稞资源如:575,52,4,5,15,86,647有着明显的差异性。
通过模糊聚类分析后,对应的青稞资源名,经过重新排序后,可以摸清其资源亲缘关系的远近程度,对于明确资源的类型是极其重要的。
从表7可以得到一个较为明确的结果类型。例如:前10个资源即:ZDM5766、ZDM5685、ZDM4381、ZDM4611、ZDM5497、ZDM4340、ZDM4684、ZDM44 78、ZDM4387、ZDM4281,从类型上更相似和接近为同亲缘类型;后10个资源即:ZDM4821、ZDM4423、ZDM5479、ZDM4513、ZDM5559、ZDM5575、ZDM55 00、ZDM4819、ZDM5781、ZDM4426从类型上更相似和接近为同亲缘类型;但前后两者从亲缘和类型上则更加远离。从资源的利用上,该特性尤其重要,需要人们有针对性的、根据要求去选择亲缘关系:近、远及差异大小,才能有明确的目标。
3.2.1 茎粗 模糊聚类的结果,表型数据较好是:模糊序号82,种植序号:244,种植名称:ZDM4423,同聚类结果较为一致。
3.2.2 茎秆强度 模糊聚类的结果,表型数据较好是:模糊序号4,种植序号:537,种植名称:ZDM5575,同聚类结果较为一致。
表7 模糊聚类后的结果排序表
3.2.3 茎秆壁厚 模糊聚类的结果,表型数据较好是:模糊序号647,种植序号:313,种植名称:ZDM4426,同聚类结果较为一致。
3.2.4 株高 结合模糊聚类排序情况:可知道,排序号为682号,模糊聚类后的序号是:15,实际田间编号是:525,种植品种名称:ZDM4819。其ZDM4819最高121 cm。ZDM5479的株高105.25 cm,其亲缘程度同分类结果吻合,可归属于高秆类型。参试表型株高最高的种质编号为ZDM4819。青稞株高对于西藏青稞生产具有很好的实际意义,尤其是对于农区生产和农区发展农区畜牧业。
从模糊聚类分析的结果上看,综合抗倒性优质的青稞资源,主要集中模糊排序的最后一些在资源材料中,其整体体现较为抗倒性较为理想和优良。
(1)通过Matlab程序]编制[6-7],能够很容易克服大量的数组矩阵数学运算任务,节省大量的计算时间,避免人为计算出错。
(2)品种资源数量大,模糊聚类时,计算费时耗费。虽然分类容易,但出图的效果比品种资源数量小的情况差[8]。
(3)由于资源数量大,评价分析工作和评价方法还需要进一步探讨和完善。
(4)对于青稞的抗倒性分析,还应该进行更多的指标进行综合评价分析;本文所涉及的数据仅是综合指标中的一个部分,对于青稞抗倒和青稞综合资源整体分析,还需求进一步开展多指标和多数据评价分析工作,才能更加有利于向从事青稞育种工作提供更多,更有价值的信息和实际利用的供体材料资源。