霍冉 王晓丽 侯智力
摘 要:本文以丹参、三七、黄芪、当归、金银花的价格为研究对象。收集了2009年到2018年我国市面上用途较广,需求量较多的五种中草药的月度价格数据(五种药材分别为丹参、三七、黄芪、当归、金银花)。运用因子分析、相关分析、时间序列分析等方法并采用SPSS 24和SAS 9.4软件对数据进行定量分析。根据最终模型对我国未来10个月的金银花价格进行预测,结果显示,模型的拟合效果较准确,误差在可控范围内。
关键词:中草药;因子分析;相关分析;时间序列分析;ARIMA模型
一、准备工作
近年来,中医药被社会更加关注。中草药的价格发生了翻天覆地的变化。国内中草药价格飙升,中药产品成本上升。根据研究资料显示,2018年人均医疗保健消费支出为1685元,同比增长了16%。2009年10月至2018年10月,国内中草药价格涨幅在51%-100%的草药品种占37%,占涨价草药的大多数;涨幅在101%-180%和21%-50%的草药占24%;涨幅在5%-20%的草药品种占国内中草药的20%;涨幅为181%-300%的草药品种占 6%;300%以上的品种占2%;仅仅有11%的草药品种价格不变。随着中草药价格的不断上涨,“用药难,用药贵”给不少依赖中药的患者带来了困扰。
本文对2009年到2018年我国市面上用途较广,需求量较多的五种药材的月度数据,运用三种方法并利用两种软件SPSS 24和SAS 9.4从价格的角度分析并预测其中金银花未来的价格。首先运用Q型因子分析对五种中草药价格进行处理,通过对样品的相似系数矩阵内部结构的研究,找出能控制所有样品的少数几个随机变量去描述多个样本之间的相似关系。然后根据相似性的大小把样品分组,使得同组内的样品之间的相似性较高,不同组的样品相似性较低。结合专业知识对分组的两大类进行影响因素总结。然后采用相关分析对得到的两个公共因子FAC1-1和FAC2-1进行处理,以验证因子分析所得出的降维结果是否正确。最后,采用时间序列分析方法对中草药中的金银花进行分析建模并预测金银花将来几个月的价格变动情况。
二、主要结果
1.因子分析
因子分析前首先要对数据进行KMO检验和Bartlett球形度检验,认为只有当KMO的值>0.6(Bartlett球形检验的显著性概率<0.05)时,数据才具备结构效度,才合适进行因子分析。本文中KMO值为0.728,可进行因子分析。
因子分析的总方差解释是相关系数矩阵的特征值及累计方差贡献率的计算结果。系统默认提取了2个主因子,前两个因子的累计贡献率达到了77.847%,表示前2个因子解释了原有5个变量总方差的77.847%。
从因子分析的碎石图中可以看出前两个特征值明显大于后面的特征值,说明提取前两个因子是正确的。系数的大小可以分析不同公共因子所反映出的主要指标的区别。从结果可以看出,第一个因子在第1、2、3样品中的载荷阵较大,第2个因子在第4、5样品中的载荷阵较大。可结合专业知识给出各因子的命名。
用回归方法估计的因子得分系数。同时在数据窗口得到了变量 FAC1-1和FAC2-1,它们表示通过因子分析将五个因子综合为两个因子。
2.相关分析
相关分析是考察两个变量之间是否具有线性关系及变量之间的线性关系强度的一种统计方法,需要计算相关系数来做深入的定量考察。本文采用相关分析对得到的两个公共因子FAC1-1和FAC2-1进行处理,以验证因子分析所得出的降维结果是否正确。
对数据进行正态性检验。正态性检验的原假设为H0:数据服从正态分布,经计算可得两者P值都<0.05,即拒绝原假设,认为该数据不服从正态分布。所以采用Spearman秩相关检验方法。对两组数据进行Spearman秩相关检验,Spearman秩相关检验的假设为H0:X与Y是不相关的。可以看出两组数据的P值为0.659>0.1,所以认为接受原假设,认为两者是不相关的。印证了因子分析的降维结果是正确的。
3.时间序列概述
时间序列就是按照时间的自然顺序记录的一列有序数据,它的分析遵循着数理统计学的基本原理,利用样本估计总体的性质。由于时间的不可重复性,使得我们在任意时刻只能获得唯一的观察值。我们对时间序列进行观察、研究,找出它的变化规律,预测样本将来的走势。这种特殊的数据结构使得它有一套自成体系的分析方法。本文将从五种常用药材中选取金银花进行分析建模并预测金银花将来几个月的价格变动情况。
首先对数据进行平稳性分析,从时序图可以看出序列非平稳且不具有线性趋势。检验该序列是否具有季节效应,并计算季节指数Sk(月平均/总平均)。季節指数反映了该季度与总平均值之间的一种比较稳定的关系。若季节指数大于1,说明该季节的值常常会高于总平均值;若季节指数小于1,则说明该季节指数常常低于总平均值;如果季节指数都近似等于1,则说明该序列没有明显的季节效应。该序列的季节指数如表9所示,季节指数都近似于1,认定该序列无季节效应,所以可建立ARIAM模型。对原序列进行一阶差分。一阶差分后序列在零均值附近较稳定的波动。为进一步确定序列的平稳性,对序列进行增广DF检验,即ADF检验。
ADF检验的原假设为序列非平稳P<0.05,所以拒绝原假设,认为该序列平稳。对序列进行白噪声检验,白噪声检验的原假设为:序列是白噪声序列。在各阶延迟下LB检验的统计量的P值都小于0.001,所以我们有很大的把握认为该序列为非白噪声序列。即满足纯随机性和方差齐性。
由列的自相关图和偏自相关图,结合相对最优定阶,考虑用 MA(6)模型拟合一阶差分后序列,即用ARIMA(0,1,6)模型拟合原序列。
对残差序列进行检验,拟合检验统计量的P值都显著大于显著性水平0.05,所以认为该残差序列为白噪声序列。即 ARIMA(0,1,6)模型对该序列建模成功。
对金银花未来10个月进行预测,1月-4月的真实价格数据为74.95、75.13、78.48、79.1,预测值与真实值较接近,所以可认为预测的结果具有实际意义。所以在未来几个月排除突发性因素,金银花价格将会有小幅度的上升,但整体趋于稳定状态。
三、结论
本文分为两个部分,第一部分首先对数据进行KMO检验,检验通过后进行Q型因子分析。将五种中草药分为两个因子,结合专业知识,将影响丹参、三七、黄芪价格的因素命名为非自然因素,将影响当归、金银花价格的因素命名为自然因素,并得到两个公共因子。然后对得到的两个组数据进行正态性检验,数据不服从正态性检验,采用Spearman秩相关检验,验证了因子分析分类是准确的。
所以可认为丹参、黄芪、三七价格都出现多次剧烈波动,出现这种现象的原因是因为随着生活水平的提升,人民越来越重视养生,保健品的需求量与日俱增,更多的人追捧它;药材利润空间的增加使得越来越多的人涌入了经销链条中,当供需市场出现失衡,就会出现炒作的现象,使得本来可以自我调节的市场出现失衡;部分药材体积较大,单位面积利润小,导致种植该种药材的人少,市场出现空缺;当药材价格出现高峰,种植户的积极性便会回拢,药材的产量会增大库存,经过几年的消耗后会再次出现价格高峰,造成恶性循环。金银花、当归价格仅偶尔进行变动,出现这种现象的原因是因为对于金银花而言对土壤无过多要求,古语说“涝死庄稼旱死草,冻死石榴晒伤瓜,不会影响金银花”,可见金银花的生存能力极强。且在5月、7月、8月、10月等都可对金银花进行采摘,库存充足。偶尔的价格突发性增长是因为突发性的流感、病毒传染等。而当归主要生产于甘肃东南部,库存丰厚,产量不减。大浮动波动主要来源于地区性冰雹和突发性泥石流。
第二部分为对金银花的建模及预测。金银花序列无季节效应且通过了平稳性检验和白噪声检验。对金银花序列建立ARIMA模型并据此进行了未来10个月的预测,由预测结果看,预测值与实际值的误差在可控范围内,所以可认为预测的结果具有实际意义。该模型也可对其他同类型中草药进行预测。本文还存在着一定的不足之处,中草药价格的稳定影响着中成药成本的变化以及中药行业的可持续发展。中药材价格的良好调控需要政府、企业及相关从业人员的共同努力,只有这样才能保障广大人民群众的日常用药安全。
参考文献:
[1]张晋之,杨元娟,许燕.中药材价格波动的原因及优化策略[J].价格月刊,2016,2:35-38.
[2]袁静,汤少梁.基于时间序列模型的我国中药出口预测分析[J].中草药,2018,9(14):3452-3456.
[3]于秀林,任雪松.多元统计分析[M].北京:中国统计出版社,1999: 205-217.
[4]Merry,Concepta. Chinese Herbal Medicine in Chronic Hepatitis B Infection[J].Integrative Medicine Alert,2018,Vol.21(No.1):14-16.
[5]Cunningham A B, Long Xingchao. Linking resource supplies and price drivers: lessons from Traditional Chinese Medicine (TCM) price volatility and change,2002-2017[J].Journal of ethno pharmacology,2018,Vol.16(4):17-19.
[6]刘晓行,李宏.云南文山三七市场价格变动分析和产业可持续发展研究[J].农村经济与科技,2015,9:145-147.
[7]陈达,王火旺.对近几年我国中药材价格波动情况的分析与思考[J].价格理论与实践,2012(11).
[8]赵智,郑循刚,刘琳,欧定华.我国中药材价格波动特征实证研究——以巴戟天、白前、百合等九种药材为例[J].价格理论与实践,2014,07:69-71.
[9]张晋之,杨元娟,许燕.中药材价格波动的原因及优化策略[J].价格月刊,2016,2:35-38.
[10]张淑丽,陈春,刘建.浅析中药价格与市场稳定性的关系[J].中国医药指南,2011,9(8):342-343.
[11]任长秋.中药材价格变动成因及影响[J].人民论坛,2011(2):142-143.
[12]王燕.應用时间序列分析[M].中国人民大学出版社,2005(7):110-116.
作者简介:霍冉(1981- ),男,内蒙古农业大学理学院讲师