刘赵发,郑金萍,刘汉明
(赣南师范大学 数学与计算机科学学院,江西 赣州 341000)
随着我国农业技术的不断提升,综合生产能力迅速提高,去年(2018年)的肉类产量高达8624.63万吨,居世界首位.居民食物消费结构也随着国民经济的发展和人均收入水平的大幅提高发生了显著变化,在畜产品等肉类的消费量增加的同时,粮食消费量逐渐减少.最近10年,尽管我国年肉类总产量趋于相对平稳[1](图1),但肉类价格却产生较大幅度的波动,特别是2019年6-7月以来,猪肉价格大幅上扬.价格的不稳定不仅对畜牧业生产以及消费者购买行为产生重大影响,而且加剧了经济运行的通货膨胀预期.因此,深入研究我国消费性肉类价格之间的关联效应,不仅有助于了解市场运行规律,同时也有助于相关政策的合理制定,对我国肉类产业的发展具有一定的指导意义.
图1 2009-2018年的全国各种肉类的产量(根据国家统计局数据制图,单位:万吨)
国内学者对我国肉类消费趋势、肉类价格的预测及价格的关联因素作了许多有益的研究[2-7].这些研究主要从以下2个角度出发:一是基于供求关系,对畜禽产品的消费系统进行分析.研究多采用扩展的线性支出系统模型(Extend Linear Expenditure System,ELES)、二次近乎完美需求系统模型(Almost Ideal Demand System,AIDS),以交叉价格弹性来反映禽畜产品之间的相关关系[2-3].二是从时间序列的角度出发,通过建立时间序列的相关数学动态模型研究价格之间的传导机制及禽畜产品价格之间的关联效应[4-7].田露等认为在肉类价格之间,猪肉和羊肉的市场价格对牛肉市场价格影响显著[6];王静怡等发现所有环节的市场价格间有着长期均衡关系[7];毛学峰等认为4大肉类产品之间在波动层面上呈现出较为明显的动态相关关系,4种肉类之间的波动联系由大到小依次为牛羊间、猪牛间以及鸡肉和其他肉类[8].
虽然现有研究可以为我国畜牧业的发展提供有价值的参考,但也存在一些不足,主要体现在以下2个方面.一是部分研究[2-3]分析的只是年度数据,导致不能充分反映畜牧业价格变化的时效性和动态性;二是研究中人为假定线性或者非线性中的特定种函数关系[4-6],不能够客观地反映各种肉类价格之间的相关性.鉴于这些不足,本研究基于最大信息系数(Maximal Information Coefficient,MIC)[9],使用月度价格指标对不同肉类价格之间的动态变化作关联研究.最大信息系数具有函数无关性,即该种方法,在大样本数据的挖掘中,无需假定任何函数模型[9].
选取的研究对象是猪、羊、牛和鸡等居民消费量较大的肉类价格,时间跨度为2009年1月~2019年5月.数据来自历年《中国畜牧业价格年鉴》及《中国畜牧业2019》期刊发布的价格,每个价格序列含有125个样本[10-11].基于这些价格数据可得价格变动情况(图2).
图2 我国肉类价格的变动(2009年1月-2019年5月)
为便于数据挖掘,我们将所有“环比”属性转换成二元数据.具体做法是将当前数据与前一数据比较,值不变或变大的“环比”记为“1”,反之,记为“0”(表1).
表1 部分肉类价格相关数据(单位:元/kg)
最大信息系数是2011年David N.Reshef 等提出的用于挖掘2个变量间的关系,这种关系通常是目前尚未发现、可能存在、重要的[9].它是非参数统计工具可以直接输出变量之间的、量化了的关联程度而不要假设变量间的数学模型.David N.Reshef 等通过把2个变量看成是水平和垂直方向划分成x和y个箱的点来实现MIC的计算.这样,2个变量就在平面上形成了x×y大小的格栅.2个变量数据集D的MIC定义为[9]:
(1)
这里,n表示样本大小,B(n)为x×y格栅大小的上限(通常,ω(1)
(2)
I*表示D的双变量之间的互信息.
研究拟挖掘其他肉类价格与猪肉价格之间的关联,仅基于表1数据建立猪肉价格与其他肉类价格之间的数学模型十分困难.MIC作为一种新型的数据分析方法[9],曾在差异表达基因、全基因组关联研究和差异表达miRNA识别方面取得了成功的应用,同时,也取得了比较好的效果[12-16].该方法能从复杂的数据中很好地挖掘出尚未发现的关联关系.MIC方法是基于互信息这种与变量的数学模型无关的模型来代表2个变量间的关系.这里利用MIC,对我们所收集的肉类价格数据进行分析,以期发现猪肉价格与其他肉类价格的关联性.这样,我们只需要先算出变量“猪肉价格”和变量“其他肉类价格”间的MIC值,最后,根据MIC值的大小就可以推断出猪肉价格与其他肉类价格的关联程度.
MIC 统计方法在软件Matlab 2019b上运行,其Matlab源代码来自于D.Albanese等[17]的研究.对表1数据处理,结果如表2所示.
表2 MIC值数据表
表2结果显示,猪肉价格与羊肉价格间的MIC最大,但猪肉价格与牛肉价格、鸡肉价格的MIC相当.
从以上实验结果,我们可以得到以下主要提示:
胡月等运用格兰杰因果检验研究方法发现,猪、牛和羊肉价格之间存在着双向的格兰杰因果关系,但鸡肉与其他肉类价格之间存在着单向的格兰杰因果关系[18].该研究佐证了我们研究结论的正确性.
研究结果表明,充分利用肉类(或其它商品)价格序列的时变特征,可以更好地分析商品间价格的关联性.最大信息系数的模型无关等特性很适合于诸如价格波动等复杂变量间的关联性挖掘.另外,政府在制定政策时,需综合考虑不同肉类价格间的动态关联性,尽可能避免孤立地对某一肉类价格进行干预.