张莉莉 赵喜梅
摘 要:本文从建模的角度分析“碧玉”猕猴桃果实纵横径的生长数据,给出适合该数据的一种非线性SUR模型。将纵径和横径的生长看成一个整体,利用非线性SUR模型模拟其生长过程,通过R语言编写程序,求出模型中参数的极大似然估计及模型的拟合优度。得到猕猴桃果实纵径和横径的生长曲线,说明本文非线性SUR模型的有效性。
关键词: 非线性;SUR模型;猕猴桃;生长曲线
中图分类号:O212 文献标识码:A DOI:10.11974/nyyjs.20180333003
引言
SUR(Seemingly Unrelated Regression)回归模型[1]也称半相依回归模型,是联立方程模型,方程之间因误差项的跨方程相关而互相联系,在生物、遗传、医学等领域都有重要应用[2]。有关SUR模型的统计研究已有很多成果,如文献[3-5],其中文献[5]系统研究了线性和非线性SUR模型及其在医学中的应用,并指出当模型中方程间的非线性函数形式不同时,SUR模型下的参数估计优于普通非线性最小二乘估计。
对植物及其果实的生长动态进行研究有助于掌握植物的生长发育规律,而植物生长曲线的拟合可以直观的表现其生长动态。目前有关植物生长动态的研究已有大量成果,如文献[6]在温室与露地2种环境下对无核早红葡萄的生长动态进行了比较研究,文献[7]利用二次曲线分别对“碧玉”猕猴桃果实纵径和横径的生长动态进行了曲线拟合。
针对文献[7]提供的生长数据,本文基于非线性SUR模型,充分利用模型中不同方程提供的信息,将纵径和横径的生长看成一个整体,利用R语言(版本3.3.3)编写程序,运用拟牛顿算法(BFGS)得到了非线性SUR模型参数的极大似然估计值,绘制出“碧玉” 猕猴桃果实纵径和横径的生长曲线,进一步分析了猕猴桃果实纵径和横径的生长规律。
1 非线性SUR模型
一般的,非线性SUR模型的形式[8]为
(1)
其中,yi=(yi1,yi2,…,yin)为的观测数据,ti=(ti1,ti2,…,tin)为的观测时间,是待估参数向量,是非线性函数,ei=(ei1,ei2,…,ein)为的误差向量,i=1,2,…,m,V为协方差矩阵。
本文考虑如下含2个方程的非线性SUR模型
(2)
其中是第1个方程中的待估参数,ai(i=0,1,2,3,4)是第2个方程中的待估参数;协方差矩阵表示∑与In的
Kronecker乘积,
模型(2)中的2个方程的非线性函数表达式不统一,且随机误差具有相关性 。如果不同方程的非线性函数表示不同群体的拟合曲线,则此模型表示第1个群体的拟合曲线为Logistic曲线,第2个群体的拟合曲线为多项式曲线,均可表示群体的“S”型生长曲线。
如记
则模型(2)可表示为
(3)
2 参数估计及拟合优度检验
记模型(3)中的未知参数向量为
,其对数似然函数为
其中,
本文中,模型(3)中未知参数向量包含11个参数,极大似然估计记为
要求其具体表达式很繁琐,甚至有些参数的极大似然估计并求不出显式解,對于具体的实际问题,可借助于计算机软件求解更为方便。本文基于R语言利用拟牛顿算法(BFGS)求各参数的极大似然估计值。
将参数的极大似然估计值代入模型中各方程,便可得2个相关群体的拟合曲线,进而可对2群体的生长动态进行整体把握。对每一方程或群体的拟合曲线,利用决定系数
和统计量来
判断曲线拟合的优劣程度,其中表示第个个体的实测数据,为拟合值。越接近于1,或对给定的显著性水平,若,则表示曲线拟合的越好[9]。
3 猕猴桃果实生长趋势分析
不同品种的猕猴桃果实,其生长曲线可能会不同。一般猕猴桃果实纵横径的生长趋势呈“S”或“双S”型曲线[10]。有关不同品种猕猴桃果实的生长曲线已有大量文献对其研究,但大多都是单独描述某一性状且只描述其生长的动态变化过程,绘制出折线图,并没有给出拟合度较高的生长曲线。文献[7]以直线和二次多项式分别对猕猴桃果实纵径和横径的生长曲线进行拟合,尽管二次多项式的拟合优度R2较高,均在0.9以上,但实际上其拟合效果并不好。
同一果实的纵径和横径的生长存在高度相关性,将纵径和横径的生长看成一个整体,而不是孤立的分析他们各自的生长过程更符合实际。针对文献[7]中的“碧玉”猕猴桃果实纵横径的生长数据(图1、表1),纵径与横径的相关系数为0.9883095,通过其散点图(图1)发现,纵横径的生长趋势均呈“S”型曲线,利用R语言编写程序对纵横径生长数据单独进行曲线拟合,发现利用Logistic曲线和四次多项式曲线分别描述其生长趋势效果较好。为使得拟合效果更好,本文选择在非线性SUR模型(2)的框架下,将纵径和宽横径的生长看成一个整体,充分利用不同方程提供的信息,在R语言中,根据拟牛顿算法,求出模型(2)中各参数的极大似然估计值(表2),进而得到纵 径和横径生长的拟合数据(表1),拟合纵径和横径的生长曲线(图1),并求出模型的拟合优度(表2),为猕猴桃果实的生长发育过程提供一定的参考,也进一步说明本文模型的有效性。
根据参数的估计值(表2)可得,纵径的拟合曲线为,横径的曲线为
。
两曲线的拟合效果都很好(图1),且拟合优度也较高,统计量都小于0.05水平下的临界值,也都接近于1,优于文献[7]的结果。
4 讨论与结论
本文以“碧玉”猕猴桃果实纵横径的生长数据[7]为例,给出拟合曲线及曲线的拟合优度,从建模的角度描述了猕猴桃果实纵横径的生长过程,也说明了本文模型的有效性。
非线性SUR模型(1)将联立的非线性方程看成整体来研究,不仅利用了其他方程提供的附加信息,而且可以得出模型中各方程的参数估计及不同方程间相关程度的估计,可用于描述方程内部具有方差齐性而跨方程间具有相关性的实际问题。
参考文献
[1] Zellner A.An efficient method of estimating seemingly unrelated regressions and tests for aggregation bias[J].J.American Statistical Association,1962,298(57):348-368.
[2]张莉莉.简约SUR模型参数的协方差改进估计[J].大学数学,
2011,27(2):119-122.
[3]马铁丰,王松桂.半相依回归模型参数的协方差改进估计[J].工程数学学报,2008,25(6):1074-1080.
[4]张莉莉,史建红.半相依线性回归模型的影響分析[J].数学杂志,2010,30(1):137-144.
[5]梁洪川.似乎不相关回归模型及其在医学中的应用[D].太原:山西医科大学公共卫生学院,2006.
[6]高美英,程丽丽,闫虎斌.温室与露地无核早红葡萄果实生长动态比较研究[J].山西农业大学学报(自然科学版),2007,27(1):42-45.
[7]张欣倩,尚永胜,李成业.“碧玉”猕猴桃果实生长动态及相关性分析[J].吉林林业科技,2016,45(2):10-13.
[8] Judge,Hill,Grittiths,et al.lntroduction to the theory and practice of econometrics(Second Edition)[M].New York:John Wiley & Sons,Inc,1988.
[9]范国兵.一种估计Logistic模型参数的方法及应用实例[J].经济数学,2010,27(1):105-110.
[10]金方伦,周光萍,黎明,等.中华猕猴桃新蔓生长与果实生长发育动态分析[J].北方园艺,2013(21):12-17.
[11]茆诗松,王静龙,濮晓龙.高等数理统计(第二版)[M].北京:高等教育出版社,2006.
[12]薛毅,陈立萍.统计建模与R软件[M].北京:清华大学出版社,2007.
作者简介:张莉莉(1981–),女,山西广灵人,硕士,讲师,研究方向:概率统计及其应用。