帅春江, 聂 翔, 何 伟
(陕西理工学院物理与电信工程学院,陕西 汉中 723000)
茶毛虫是我国茶区重要食叶类害虫之一,其为害造成的茶叶损失约10% ~30%,严重时高达60%,给茶园带来极大的经济损失。目前茶毛虫仍以化学防治为主,但由此带来的茶叶农药残留、害虫抗药性以及猖獗的“3R”问题(resistance,resurgence,redidue,抗性、再增猖獗、残留)已经非常明显[1]。物理灭虫方法,在检疫学上被称作害虫的辐照处理,概括地说,就是用各种电磁波例如紫外线、红外线、超声波、Y射线、X射线、微波等照射昆虫卵、幼虫、蛹、成虫等,昆虫在受到辐照后体内会发生一系列生理变化,进而导致其代谢紊乱、丧失生殖能力并最终死亡,由此达到消灭害虫的目的[2]。然而,众多防治技术中没有提到采用一些静电作用、电磁辐照等进行干扰防治的方法,本文就是针对电磁辐照技术,采用主成分分析法对茶毛虫生长发育的实验数据进行分析研究。主成分法是指将一些具有相关性的多个指标,重新进行整合、组合成为一组不相关的综合指标,以取代原有指标进行评价的模拟方法,已经在工业企业经济效益[3]、公路网综合评价[4]等评价体系中广泛应用。
本文采用的数据均来自于电磁辐照对茶毛虫生长发育影响的探究性实验。该实验的基本条件和具体操作如下:
(1)电磁辐照对象:茶毛虫越冬卵块,分别采用4组不同频率的电磁波照射茶毛虫越冬卵块相同时间,并设置对照组。
(2)培养条件:温度为30℃,变幅为±2℃,相对湿度为76% ~82%,光周期L∶D=12∶12。
(3)试验观测:利用NBM-550全频段电磁辐射分析仪,经过不同频段强度的电磁波辐照处理48 h。待辐照处理后,将盛有虫卵的培养皿放在养虫笼中培养,使虫卵在接近自然的环境中孵化。观测指标为茶毛虫生长各龄期的虫卵孵化进度、孵化率(=(100-未孵化卵的数量)/100×100%)、发育进度、化蛹进度(=蛹数/100×100%)、羽化进度(=(100-死蛹数-半羽化数)/l00×100%)和蛹的其它生物学特性等进行数据统计,如表1所示。
表1 电磁辐照对茶毛虫生长发育影响数据统计
由于实验观测数据量较大,表1中的数据均是经过一次统计处理后得到的平均值(样本重复数为10),在此数据基础上,采用主成分分析法,分析电磁辐照对茶毛虫生长发育影响的主要观测指标。
以主成分分析法作为本文数据研究的主要方法,其具体的处理步骤如下[5-6]:
步骤一:对统计数据进行标准化。
设原始统计数据矩阵为X=(Xij)n×p,其中Xij为第i个样本的第j个指标的统计值,n为样本容量,p为指标的个数。标准化后记为X*=()n×p;i=1,2,…,n;j=1,2,…,p。其中
步骤二:计算相关系数矩阵
步骤三:计算特征值与特征向量。
求特征方程|λI-R|对应的特征值λi(i=1,2,…,p),并将其从大到小排序,对应每一个特征值的特征向量为 ei(i=1,2,…,p),且=1,eij表示向量ei的第j个分量。
步骤四:求主成分,并根据主成分分析确定电磁辐照对茶毛虫生长发育影响的主要影响指标。
求主成分的贡献率bi,
求累积贡献率Bi,
选取累积贡献率大于0.98的特征值和其相对的主成分,并确定要保留的主成分的个数,即为电磁辐照对茶毛虫生长发育影响的主要影响指标。
步骤五:求各主成分的载荷。
计算公式为:
由表1的原始统计数据可知,评定不同频率电磁波辐照对茶毛虫生长发育影响的指标有10个:X1为幼虫日发育速率,X2为蛹日发育速率,X3为成虫日发育速率,X4为孵化率,X5为雌蛹的平均体长,X6为雄蛹的平均体长,X7为雌蛹化蛹率,X8为雄蛹化蛹率,X9为雌蛹羽化率,X10为雄蛹羽化率。这10个指标即表示了对电磁辐照茶毛虫生长发育阶段不同的评价。
对表1中的原始数据应用MATLAB软件[7-10]编程进行标准化处理,然后求出各指标间的相关系数矩阵R,如表2所示。计算R的特征值和累积贡献率,结果如表3所示。
表2 各变量间的相关系数矩阵
表3 系数矩阵R的特征值和累积贡献率
此处,为了很好地体现主成分的综合性程度,本文选取方差的累积贡献率大于98%时的成分作为主成分,即保留了两个主成分,记为Y1和Y2。则可求出前两个特征根对应的特征向量,见表4。
即两个主成分 Y1和 Y2特征根对应的特征向量为 e1=(-0.319,-0.322,-0.320,0.315,0.315,0.294,0.323,0.318,0.315,0.320),e2=(0.253,0.069,0.266,0.241,0.315,- 0.742,0.062,0.191,0.206,0.270)。
由此可得出两个主成分与各指标间的线性关系为:
表4 特征向量表
由表3中系数矩阵R的特征值和累积贡献率可以得出,能综合评价电磁辐照对茶毛虫整个生命过程生长发育影响的主要指标为前两个主成分,累积贡献率达到98.56%,而各个主成分贡献率的比例如图1所示。同时,从这两个主成分的因子载荷矩阵(如表5所示)可以推断出各个评价指标在主成分中的作用和重要程度。因为主成分的因子载荷矩阵主要是主成分与各变量之间的相关系数,一定程度反映出各变量在主成分中的权重比例。
表5 两个主成分的因子载荷矩阵
图1 各个主成分的贡献率饼状图
从图1可以得出,第一主成分Y1包含了96%的贡献率,是综合评价指标的主控因子。参考其它研究中的一些做法[4],为了更加直观地反映出各个评价指标与主成分的相关性,文中将主成分的因子载荷矩阵中的负值转化为正值进行分析,结合表5,可以得出构成第一主成分的主要因子的系数相近,即第一主成分可将所有评价指标的信息都能反映出来,尤其是指标X7雌蛹化蛹率,显然此综合指标反映了雌蛹化蛹率在茶毛虫为害的主要性。而第二主成分占有3%的贡献率,从表5中可知,构成第二主成分的主要因子是雄蛹的平均体长X6,相对于第一主成分的综合程度明显降低。
从表5可知,X1,X2,X3与第一主成分负相关,X1,X2和X3的数值越大,表明电磁辐照对茶毛虫生长发育的影响程度越高。而结合原始统计数据,X3的数值随着电磁辐照频率的增加而增大,且当电磁辐照的频率从100 kHz递增到10 MHz时,X1,X2的数值越来越大,符合分析结果,而对照组(无电磁辐照)X1,X2的数值却大于有10 kHz电磁辐照的数据,与分析结果不符。造成该微小误差的原因可能为:(1)试验条件控制的不严格,在对照组时统计幼虫日发育速率X1和蛹日发育速率X2值的时候,受到周围介质电磁波干扰;(2)因表1中给出的数据为经过处理的平均值,可能存在计算误差;(3)主成分分析法是将多个指标综合成更少数指标的模拟方法,其准确程度在精确统计中存在误差。
主成分分析法模型已经在许多领域得到广泛的应用[11],对于一些生物实验数据的处理与评价分析,采用主成分分析法也是一个极有实际操作价值和评价可信度的模型。一方面,主成分分析法能将10个茶毛虫生长发育评价指标综合简化为只有两个;另一方面,通过主成分分析,可以获得各指标的因子载荷,更清楚地认识电磁辐照频率与各指标间的关系,而且分析结果有利于推断与验证试验操作的规范和数据的可信度。
[1]汪云刚.茶树病虫害防治应注意的问题[J].云南农业科技,2002(S1):218-219.
[2]王力,陈林,马青.家兔全血细胞电阻抗频率特性[J].浙江大学学报:医学版,2009,38(4):57-60.
[3]金星日,尹锡杰,许虎男.主成分分析法在工业企业经济效益综合评价中的应用[J].数理统计与管理,1997,16(6):14-17.
[4]顾政华,李旭宏.主成分分析法在公路网综合评价中的应用[J].公路交通科技,2003,20(5):71-74.
[5]宁正元,王李进.统计与决策常用算法及其实现[M].北京:清华大学出版社,2009:226-234.
[6]邹凤琼,陈金泉.基于主成分法的新专业毕业生就业焦虑因素分析——以GIS专业为例[J].江西理工大学学报,2013,34(2):41-45.
[7]李瑞妹.运用聚类分析法进行管理对象分类[J].中国高新技术企业,2010(27):128-129.
[8]帅春江.基于MATLAB的多边形电解槽静电场分析[J].陕西理工学院学报:自然科学版,2012,28(2):59-62.
[9]帅春江.基于层次分析法的光接口方案选取研究[J].数学的实践与认识,2013(17):188-194.
[10]李瑞妹.上市公司股票价格的ARIMA预测[J].山东青年,2013(3):137-139.
[11]高健.主成分分析模型在衡量物流客户服务水平中的应用[J].统计与决策,2009(15):156-157.