主成分分析在作物科学研究中的应用

2012-04-01 05:42宋登蓉张文英长江大学农学院湖北荆州434025
长江大学学报(自科版) 2012年5期
关键词:农艺学报大豆

宋登蓉,张文英(长江大学农学院,湖北 荆州 434025)

主成分分析在作物科学研究中的应用

宋登蓉,张文英(长江大学农学院,湖北 荆州 434025)

综述了主成分分析法在农作物产量性状、品质性状分析以及种质资源鉴定和抗逆性鉴定等方面的应用情况,指出了该分析方法今后在作物科学研究中的应用方向。

主成分分析;产量性状;品质性状;种质资源;抗逆鉴定

主成分分析是一种旨在利用降维,把多个指标转化为少数几个综合指标的多元统计分析方法。在多指标的研究中,由于相关的指标个数太多,各个指标之间很可能存在一定的相关性,主成分分析就是通过线性变换,将各指标间相互重叠的信息通过少数几个综合的指标反映出来,使这些综合的因子之间尽量相互独立,而且能够最真实地反应原指标的信息,从而达到简化目的。这些新的变量按照方差依次递减的顺序排列,在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分;依次类推,1个变量就有1个主成分。在主成分分析中,方差代表了性状在主成分方向上的分散程度,方差越大,主成分在样本数据分析中所起的作用越大。一般根据分析后方差累积贡献率大于85%的原则提取主要的主成分因子。随着计算机在各个领域的普及,主成分分析不仅普遍应用于现代经济分析、环境评价和医学诊断,还广泛应用于农作物的产量性状分析、品质性状分析以及种质资源研究和抗逆性鉴定指标等的研究中。

1 在作物产量及农艺性状分析中的应用

近年来,主成分分析法较多地应用于大豆农艺性状及产量性状的研究中。李向华等[1]对89个中国春大豆品种的18个数量性状进行了主成分分析。韩秉进等[2]对3个主栽大豆品种的农艺性状进行主成分分析,找出了大豆产量的主导因子,提出在育种上需加强生物量大、3粒荚和4粒荚数多、结荚节位低的性状选择。王彩杰等[3]对不同生态类型的大豆品种的产量与主要性状进行了相关与主成分分析。这些研究结果基本吻合,所得结论为大豆新品种的选育、品种改良提供了判断依据。另外,主成分分析和聚类分析方法相结合可用于大豆品种的筛选。张玉革等[4]采用主成分和聚类分析方法研究了10个大豆品种在沈阳地区种植的适应性。

在水稻农艺性状研究中,孔德伟等[5]运用主成分分析法考察了杂交水稻8个农艺性状与产量的相互关系;通过主成分分析选取了充实度、剩余库容、生物产量、单株产量4个因子,其中充实度因子的方差贡献最大,说明穗重对产量影响最大,所以改良以穗重为代表的穗部性状可以较为有效地改良产量组成系统,从而实现高产育种目标。王曙光等[6]通过对杂交中籼稻新组合的经济性状进行主成分分析,结论显示高产育种中在适宜穗数的基础上应注重选择大穗型的组合,这与孔德伟等[5]及李培富等[7]对宁夏水稻品种主要农艺性状分析的结果相似。

在小麦研究中,周竹青等[8]对长江中游麦区11个小麦品种的13个与粒重密切相关的农艺性状和生理指标进行了主成分分析,将其综合为4个独立的新指标;并以主成分值为指标进行系统聚类分析,将11个品种分为3大类型,说明不同类型品种主成分值的大小和相互协调方式不同,直接导致品种粒重不同,为小麦育种和栽培实践提供了理论依据。周丽艳等[9]选取国内外43个春小麦品种为试验材料,通过主成分分析将11个农艺性状简化为彼此互不相关的5个主成分。

在棉花农艺性状研究中,王沛政等[10]先后对不同来源陆地棉20个品种在新疆特定生态条件下的13个性状和19份抗旱、耐盐碱、矮秆陆地棉材料进行了主成分分析[11]。对不同来源陆地棉20个品种的分析结果表明:纤维品质因子、产量因子、单铃重因子、衣分因子、第一果枝高度因子对变异的累积贡献率达84.3%;抗旱、耐盐碱、矮秆陆地棉材料的前6个因子贡献率达86.5%,根据主成分值评价优劣原则初选出了综合性状较好的材料。

在油菜农艺性状研究中,段利云等[12]对不同来源的62份甘蓝型油菜的9个主要农艺性状进行主成分分析,筛选出角果数因子、角果长因子、一次分支部位因子、籽粒因子和一次分枝因子5个主成分,其对变异的累积贡献率达88.53%;提出在油菜育种中应根据不同的育种目标加强对应主成分因子的选择。

除了在上述主要作物的农艺性状研究中应用广泛外,主成分分析法在其他各类作物中均有所应用,如在花生[13]、甜高粱[14]、大麦[15]、红麻[16]、亚麻[17]、黄瓜[18]、辣椒[19]等的农艺性状研究中。

2 在作物品质性状分析中的应用

随着人们对稻米品质要求的不断提高,水稻品质育种在国内外育种工作中越来越受到重视。朱碧岩等[20]、杨泽敏等[21]、许良珠等[22]先后分别对水稻的主要品质性状进行了主成分分析,结果一致表明:整精米率、胶稠度、垩白度和碱解值为鉴定稻米品质的主要性状因子,而且它们的变异幅度较大并具有较大的优中选优的潜力。姜秀英等[23]对辽宁省水稻区域试验中中熟、中晚熟品种的品质性状进行了主成分分析和聚类分析,结果表明:前6个主成分的累积贡献率达90%以上;辽宁主要稻区水稻新品种在品质育种上仍应以降低垩白粒率和垩白度为重点。马静等[24]对宁夏育成的粳稻品种(系)的主要指标进行相关及主成分分析,得到了5个主要因子;认为因宁夏粳稻稻米品质性状相关性和5个主因子的贡献率不同,建议注重垩白粒率和蒸煮品质的选择,以提高宁夏水稻品质育种效率。张玉荣等[25]通过测定大米的理化特性、蒸煮特性及质构特性等16项指标,利用主成分分析法分别构建了粳型米饭与籼型米饭的食味品质预测评价模型,并利用感官评价法对该模型进行了验证,从而为大米食味品质的客观评价探索了一条新途径。

在小麦品质性状育种改良研究中,薛香等[26]对小麦13个淀粉和蛋白质品质性状进行主成分分析,将其简化为5个主成分因子,认为在品质性状育种改良过程中,第一、第二和第四主成分适当增大有利于对强劲小麦品质的改良,第三主成分适当增大时有利于弱劲小麦性状选择和品质改良。

在棉花纤维品质性状研究中,许崇志等[27]对49个陆地棉品种主要纤维品质性状进行主成分分析,确定了3个反映棉花纤维性状的主成分及其主成分函数式。薛春善等[28]为了探讨棉花纤维品质的基本动态与总体特征,对黄河流域区试的17个杂交春棉品种材料的纤维品质性状进行了相关及主成分分析。

韩继祥等[29]采用主成分分析,把甘蓝型油菜49个杂交组合的12个主要农艺性状和品质性状归纳为5个主成分因子,根据各主成分遗传贡献率的大小,以主成分为单位选育高产、优质油菜品种。

殷冬梅等[30]对花生含油量、蛋白质、油酸等主要品质性状进行主成分分析和聚类分析,主成分分析表明,将10个品质性状综合成为4个主成分因子,可代表花生品质80.73%的原始数据信息量。利用主成分分析和聚类分析进行花生品质的综合评价,可避免单一指标的片面性和不稳定性,为花生亲本的利用和品质育种提供重要的科学依据。此外,在对大豆[31]、玉米[32]、黄瓜[33]、番茄[34]、小豆[35]、杧果[36]等品质性状的研究分析中也应用了主成分分析法。另外,还有基于主成分分析法构建芝麻油[37]、白茶[38]、苹果酒[39]等的香气质量评价模型的报道,评价结果与传统的感官评价法结果具有很好的一致性。

3 在作物种质资源研究中的应用

庄萍萍等[40]为了从波斯小麦中发掘优异基因资源,拓宽小麦遗传基础,对来自多个国家(地区)的波斯小麦进行了农艺性状相关性及主成分分析。张晓杰等[41]以576份中国花生全套核心种质为材料,对26个表型性状进行了主成分和相关性分析,从主成分分析结果看前5个主成分对变异的累积贡献率达72.67%,叶宽、种子宽、百果重、百果仁重对花生种植资源主成分1影响较大,表明在花生种植资源鉴定中,这些性状占重要地位。王建林等[42]、孟霞等[45]对西藏野生油菜种质资源进行了主成分分析和聚类分析。张礼凤等[44]、张恒斌等[45]应用主成分分析法分别对山东、新疆大豆种质资源的形态多样性和遗传多样性进行了分析研究。Prashanth等[46]在对印度籼型栽培稻和地方性水稻品种的遗传多样性研究中也应用了主成分分析法。其次,在蔬菜、水果,如茄子[47]、芒果[48]等的种质资源研究中也有应用主成分分析的报道。

4 在作物抗逆性鉴定中的应用

主成分分析法在作物抗逆性的鉴定研究中也有所应用。通过主成分分析对与作物抗逆性有关的形态指标、生理指标进行分析,将其归为几个主要的综合指标,以优化抗逆性鉴定指标体系。

朱宗河等[49]利用主成分分析、回归分析及聚类分析对甘蓝型油菜进行耐旱性综合评价,筛选耐旱种质资源;主成分分析结果将花前和花后干旱胁迫各15个单项指标综合成为6个相互独立的综合指标。冯方剑等[50]和朱永波等[51]分别对抗旱性不同的棉花品种和不同基因型玉米品种进行苗期抗旱性试验,通过苗期水分胁迫,测定了与抗旱性有关的生理生化指标,通过主成分分析:将32个棉花品种的7个相互关联的单项指标综合成为3个独立的综合指标;筛选出内在水分利用效率(WUE)、过氧化物酶(POD)、叶绿素含量等生理生化指标作为玉米品种苗期重要的抗旱性评价指标,在抗旱性鉴定中加以利用。张明生等[52]对水分胁迫下甘薯形态、生长势、生理生化和产量性状等与品种抗旱性关系密切的指标进行了主成分分析。潘相文等[53]以收获期10项指标的相对抗旱系数为基础,应用主成分分析方法对黑龙江省202份大豆基因型进行了抗旱性评价研究。为了筛选出可用于鉴定番茄耐弱光性的量化指标,对番茄的耐弱光性进行较系统的综合评价,徐心诚[54]对番茄9个生理生化指标耐弱光系数进行了相关分析和主成分分析。

5 小结与展望

大多数农作物如棉花、水稻、小麦、油菜、玉米、大豆等的产量、品质都是由多个农艺性状共同作用的结果,且各性状因素对产量、品质的影响不尽相同。在育种工作中仅对单一性状指标进行选择时很难做出准确合理的选择;在种质资源材料的评选中,由于性状多、受评群体大且各性状间存在着许多有利和不利的相关性,如果仅仅依靠经验,根据其表型直观评选,就会增加人为的主观性,也会对评选工作带来很大难度。通过主成分分析将主要性状转化为较少的几个主成分,由于这几个主成分提供了原性状85%以上的信息,且是综合的、相对独立的指标体系,因而所得结果更直观,便于进一步分析[40]。将主成分分析用于作物农艺性状的评价和筛选,既能把握综合性状表现,又能简化选择程序,且更科学。不过,主成分分析法也有其局限性,对于评选综合性状优良的种质是可行的,但对于评选指定的单一或少量性状则不太适用。

在国内,主成分分析法在棉花、水稻、小麦、大豆等的农艺性状、品质性状分析及种质资源评选鉴定中应用较普遍,而在油菜、玉米等的研究中还应用得比较少。且主成分分析多与聚类分析等多元统计分析方法结合使用,为育种中性状指标选择、品种区域适应性选择及在品种分类上等都提供了一定的依据。同时,在作物抗逆性鉴定指标(包括形态指标和生理指标等)的研究中主成分分析法也有应用,其中应用在作物抗旱性研究中的报道较多[49-53],在其他抗逆研究中的应用报道鲜为少见。在国外的研究报道中,澳大利亚的Mahmood和Ross在区别小麦与2种杂草幼苗形态的研究中应用了主成分分析法[55]。Wu等[56]在大豆耐盐性研究中发现盐敏感和耐盐大豆品种之间的代谢产物组成有明显差异,并利用主成分分析对其次生代谢产物进行分析,结果表明使用其次生代谢产物(如大豆异黄酮,皂甙)来区分密切相关的大豆基因型是有可能的。另外,有报道称,在大豆叶面积指数的测定方法中,基于多波段光谱信息的使用,主成分分析与神经网络信息处理系统相结合的测定方法是效果最好的[57]。

因此,在今后的研究中,主成分分析可以更加广泛地应用于作物抗逆性研究中;在作物遗传多样性的研究中,可以将主成分分析与基因组学方法结合起来使用。

[1]李向华,常汝镇.中国春大豆品种聚类分析及主成分分析[J].作物学报,1998,24(3):325-331.

[2]韩秉进,潘相文,金 剑,等.大豆农艺及产量性状的主成分分析[J].大豆科学,2008,27(1):67-75.

[3]王彩洁,李连华,李 伟,等.大豆品种产量与主要性状的主成分分析[J].山东农业科学,2008,(1):5-6.

[4]张玉革,胡绪彬.基于主成分和聚类分析的大豆品种生物学性状的比较研究[J].大豆科学,2004,23(3):178-182.

[5]孔德伟,陈德全,周良强,等.杂交水稻几个重要农艺及产量性状的主成分分析[J].中国农学通报,2005,21(8):117-119.

[6]王曙光,谢成林,谢仁康,等.杂交中籼稻产量与主要经济性状关系的分析[J].中国稻米,2009,(2):11-14.

[7]李培富,杨淑琴,张彦红,等.宁夏水稻品种主要农艺性状分析[J].西北农业学报,2007,16(2):33-36.

[8]周竹青,朱旭彤,王维金.影响小麦粒重的农艺性状,生理指标的主成分分析[J].生物数学学报,2002,17(1):92-96.

[9]周丽艳,郭振清,马玉玲,等.春小麦品种农艺性状的主成分分析与聚类分析[J].麦类作物学报,2001,31(6):1057-1062.

[10]王沛政,陈爱民,阿布来提,等.不同来源陆地棉数量性状主成分及聚类分析[J].西北农业学报,1999,(4):50-52.

[11]王沛政,烟 杉,高 翔.抗旱、耐盐碱、矮秆陆地棉数量性状的遗传相关及主成份分析[J].棉花学报,2002,12(3):154-157.

[12]段利云,王通强,阳标仁,等.甘蓝型油菜主要农艺性状的主成分和聚类分析[J].山地农业生物学报,2007,26(5):381-385.

[13]陈四龙,李玉荣,程增书,等.花生品种(系)生物学性状的主成分分析和聚类分析[J].花生学报,2007,36(2):28-34.

[14]冯国郡,叶 凯,涂振东,等.甜高粱主要农艺性状相关性和主成分分析[J].新疆农业科学,2010,47(8):1552-1557.

[15]普晓英,曾亚文,杨树明,等.啤酒大麦新品系产量性状与品质性状的相关与主成分分析[J].大麦与谷类科学,2009,(1):6-9.

[16]洪建基,祁建民,王晓飞,等.红麻产量与品质性状的相关及其主成分分析[J].福建农林大学学报(自然科学版),2008,37(6):561-564.

[17]王利民,张建平,米 君,等.国外引进油用亚麻品种资源农艺性状分析与评价[J].中国油料作物学报,2011,33(4):356-361.

[18]钟金仙,罗 英.黄瓜品种主要农艺性状相关与主成分分析[J].中国农学通报,2012,28(4):131-134.

[19]李 晴,韩玉珠,张广臣.辣椒品种主要农艺性状的相关性和主成分分析[J].长江蔬菜,2010,(6):29-33.

[20]朱碧岩,贾志宽.水稻品质性状遗传参数的分析[J].西北农林科技大学学报(自然科学版),1990,(3):71-75.

[21]杨泽敏,胡孔峰,雷振山,等.晚粳稻米品质性状的综合分析[J].吉林农业大学学报,2002,24(4):30-34,39.

[22]许良珠,陈木莲,吴元奇,等.不同播期早籼稻米品质性状的变异及主成分分析[J].广东农业科学,2005,(3):18-21.

[23]姜秀英,于永梅,王 铮,等.辽宁省主要稻区水稻新品种品质性状的主成分及聚类分析[J].安徽农学通报,2009,15(7):106-108.

[24]马 静,孙建昌,安永平,等.宁夏育成粳稻品种(系)品质相关性及主成分分析[J].种子,2011,(10):89-91.

[25]张玉荣,张秀华,周显青,等.主成分分析法综合评价大米的食味品质[J].河南工业大学学报,2008,29(5):1-5,9.

[26]薛 香,郜庆炉,杨忠强.小麦品质性状的主成分分析[J].中国农学通报,2011,27(7):38-41.

[27]许崇志,李 青.陆地棉纤维品质性状的主成分分析[J].新疆农业科学,2006,43(2):121-124.

[28]薛春善,尹景本.多元统计分析棉花品质性状的研究[J].安徽农业科学,2008,36(13):5247-5248,5534.

[29]韩继祥,刘后利.甘蓝型油菜杂种主要农艺性状和品质性状的主成分分析[J].华中农业大学学报,1993,12(5):427-432.

[30]殷冬梅,张幸果,王 允.花生主要品质性状的主成分分析与综合评价[J].植物遗传资源学报,2011,12(4):507-512,518.

[31]宁海龙,李文霞,王继安.黑龙江省大豆蛋白质油分及蛋白质组分类型[J].作物学报,2003,29(4):551-556.

[32]宋江峰,李大婧,刘春泉,等.甜糯玉米软罐头主要挥发性物质主成分分析和聚类分析[J].中国农业科学,2010,43(10):2122-2131.

[33]徐 强,刘进生,陈学好,等.加工类型黄瓜品质性状的主成分及聚类分析[J].扬州大学学报(农业与生命科学版),2003,24(4):78-81.

[34]陈 贤,龚元圣,杨 德.3种测度结合的分组主成分法在番茄果实商品性综合评价上的应用[J].中国农学通报,2008,24(1):335-339.

[35]武晓娟,薛文通,张 惠.不同品种红小豆的品质评价研究[J].中国粮油学报[J].2011,26(9):20-24.

[36]石胜友,武红霞,王松标,等.杧果种质果实品质性状多样性分析[J].园艺学报,2011,38(5):840-848.

[37]李萍萍,魏 芳,董绪燕,等.基于主成分分析法的芝麻油香气质量评价模型的构建[J].中国油脂,2009,34(10):75-79.

[38]郭 丽,蔡良绥,林 智,等.基于主成分分析法的白茶香气质量评价模型构建[J].热带作物学报,2010,31(9):1606-1610.

[39]岳田利,彭帮柱,袁亚宏,等.基于主成分分析法的苹果酒香气质量评价模型的构建[J].农业工程学报,2007,23(6):223-226.

[40]庄萍萍,李 伟,魏育明,等.波斯小麦农艺性状相关性及主成分分析[J].麦类作物学报,2006,26(4):11-14.

[41]张晓杰,姜慧芳,任小平,等.中国花生核心种质的主成分分析及相关分析[J].中国油料作物学报,2009,31(3):398-304.

[42]王建林,何 燕,栾运芳,等.西藏野生油菜形态及生态特征多元统计分析[J].作物研究,2006,(3):223-226.

[43]孟 霞,卓 嘎,旦 巴,等.西藏野生油菜种质资源植株形态性状多样性分析[J].中国农学通报,2010,26(16):309-314.

[44]张礼凤,李 伟,王彩杰,等.山东大豆种质资源形态多样性分析[J].植物遗传资源学报,2006,7(4):450-454.

[45]张恒斌,刘胜利,战 勇,等.新疆大豆品种资源遗传多样性分析[J].新疆农业科学,2010,47(7):1387-1390.

[46]Prashanth S R,Parani M,Mohanty B P,et al.Genetic diversity in cultivars and landraces ofOryzasativasubsp.indica as revealed by AFLP markers[J].Genome,2002,45:451-9.

[47]赵德新,孙志强,任子君,等.茄子形态学性状主成分分析及聚类分析[J].河南农业大学学报,2009,43(4):393-397.

[48]李国鹏,张林辉,解德宏,等.怒江干热河谷芒果种质资源主成分分析[J].贵州农业科学,2010,38(11):29-30.

[49]朱宗河,郑文寅,张学昆.甘蓝型油菜耐旱相关性状的主成分分析及综合评价[J].中国农业科学,2011,44(9):1775-1787.

[50]冯方剑,宋 敏,陈全家,等.棉花苗期抗旱相关指标的主成分分析及综合评价[J].新疆农业大学学报,2011,34(3):211-217.

[51]朱永波,张仁和,卜令铎,等.玉米苗期抗旱性鉴定指标的研究[J].西北农业学报,2008,17(3):143-146.

[52]张明生,张丽霞,戚金亮,等.甘薯品种抗旱适应性的主成分分析[J].贵州农业科学,2006,34(1):11-14.

[53]潘相文,李文滨,李艳华,等.主成分分析在大豆抗旱性评价上的应用[J].大豆科学,2006,25(4):379-384.

[54]徐心诚.主成分分析法对番茄品种耐光性的综合评价[J].中国农学通报,2012,28(4):135-140.

[55]Golzarian M R,Frick R A .Classification of images of wheat,ryegrass and brome grass species at early growth stages using principal component analysis[J].Plant Methods,2011,7:28.

[56]Wu W,Zhang Q,Zhu Y,et al.Comparative metabolic profiling reveals secondary metabolites correlated with soybean salt tolerance[J].J Agric Food Chem,2008,56:11132-11138.

[57]杨 飞,张 柏,宋开山,等.大豆叶面积指数的高光谱估算方法比较[J].光谱学与光谱分析,2008,28(12):2951-2955.

S11+4

A

1673-1409(2012)05-S008-04

2012-04-11

湖北省教育厅优秀中青年人才项目(Q20101318)。

宋登蓉(1989-),女,湖北恩施人,研究方向为作物分子育种。

张文英,E-mailwyzhang2006@gmail.com。

10.3969/j.issn.1673-1409(S).2012.05.003

猜你喜欢
农艺学报大豆
注意防治大豆点蜂缘蝽
《北京航空航天大学学报》征稿简则
从大豆种植面积增长看我国粮食安全
巴西大豆播种顺利
大豆的营养成分及其保健作用
农机需要农艺“标准”,农艺需要农机“灵活”——2021国际农机展不容错过的果蔬茶机械化论坛
水稻主要农艺性状与产量的相关性分析
致敬学报40年
14份蒌蒿种质资源主要农艺性状及营养成分评价
90团举办初级农艺工培训班