朱苗苗,牛国锋,乐德广
(常熟理工学院 计算机科学与工程学院,江苏 常熟 215500)
如今,互联网已经成为人们生活中不可或缺的一部分,它的出现不仅改变了人们传统的交流方式,开阔了人们的视野,而且改变了传统企业的营运模式,催生出大量新兴企业,对人们的生活和社会发展带来了巨大的影响。分析预测互联网上网人数,可以全局掌握网络的应用情况,为网络建设、应用、管理及与网络相关的各种技术和业务提供决策依据[1]。
Verhulst预测理论是1837年德国生物学家Verhulst在研究生物繁殖规律时提出的。其基本思想是生物个体数量是呈指数增长的,受周围环境的限制,增长速度逐渐放慢,最终稳定在一个固定值。Verhulst模型主要用来描述具有饱和状态的过程,即“S”型过程,常用于人口预测、生物生长、繁殖预测及产品经济寿命预测等[2]。
本文在分析最近几年我国互联网上网人数实测数据的基础上,根据数据本身所具有的特征,引入灰色Verhulst预测理论,通过分析建立了我国互联网上网人数的灰色Verhulst动态模型,并通过所建立的模型对2000~2005年我国互联网上网人数进行实例验证和误差检验。检验结果表明,所建立的灰色Verhulst预测模型对实测数据的预测优于GM(1,1)模型、线性回归、指数曲线等其他方法。
灰色系统是指既含有已知信息、又含有未知信息的系统,因为它具有对各种现象进行分析判断的能力、对宏观系统进行规划与决策的功能,其立足点是对系统输出序列进行研究,而不过多地涉及系统输入序列的研究,对原始数据序列长度要求也不高。它的特点是所需信息量少,不仅能够将无序离散的原始序列转化为有序序列,而且预测精度高,能够保持原系统的特点特征,较好地反映系统的实际情况[2]。
灰色Verhulst模型主要是用来描述非单调的摆动发展序列或具有饱和状态的S型序列。表1和图1分别显示了从2000~2005年我国互联网上网人数的统计。从图1可以很明显地看出,自从2000年以来,我国互联网上网人数一直保持着比较强劲的增长势头,并在一定时间段上是呈部分“S”型变化的,所以在一定程度上互联网上网人数的变化情况可以通过建立灰色Verhulst模型进行预测。
设在一个模型预测中,原始数据数列为X(1),为了弱化呈离散状态的原始数据,对原始时间序列进行数据的一次累减处理,经过处理的时间序列称为生成累减序列X(0)=(x(0)(1),x(0)(2),…,x(0)(n));然后通过对原始数据序列累加生成的递增序列实行紧邻均值生成Z(1),同时令X(0)(1)=X(1)(1),这时所建立的灰色模型为[3]:
相应的白化方程为:
解得:
所求的灰色Verhulst模型时间响应式为:
式(4)中,k为时间序数,a、b都为待求系数,a为发展系数,其大小及符号反映 X(1)及 X(0)的发展态势,b为系统的输入,其内涵是具有灰色信息覆盖的系统作用量[4],不能直接观测得到,在灰色理论中,a、b的值可以用最小二乘法求取,即:
其中,Z(1)为由原始数据进行累加生成的紧邻均值生成序列 ,即:
式(5)中,Y=[x(0)(2),x(0)(3),…,x(0)(K)]T。
然后将所求的a、b值分别代入式(4)中,即求得原始数据序列的预测值。
互联网上网人数预测对于整个互联网发展和相对业务决策有着至关重要的意义。近年来对于互联网上网人数的预测方法比较多,有线性回归、指数曲线等方法。虽然这种方法能够简单、直观地得到预测结果,但由于它一般采用线性或者指数形式,而不完全符合某些事物的发展趋势,所以预测精度存在一定的缺陷。同样对于参考文献 [2]所介绍的GM(1,1)模型方法,由于GM(1,1)模型适用于具有较强指数规律的序列,只能描述单调的变化过程,预测精度同样也存在一定的缺陷。下面根据表1中的原始数据,利用本文所建立的Verhulst模型对我国近几年来的互联网上网人数进行预测。
(1)根据表1中的数据,其原始数列:
(2)X(1)的一次累减(1-IAGO)序列:
(3)紧邻均值生成序列:
(4)求得 B及 Y:
(5)将 B和 Y分别代入式(5)中,通过 MATLAB软件求得 a和 b,即:
(6)取X(1)(0)=X(1)(1)=4 456
根据式(4),求得Verhulst互联网上网人数预测时间响应式为:
(7)由此可以对2000~2005年我国互联网上网人数进行模拟、预测:
(8)原始数据和预测数据比对,比对结果如图2所示。
一种模型要经过多种检验才能判断其是否合理、合格,也只有通过检验的模型才能用来做预测[5]。本节中,为了验证所建灰色模型是否能更准确对互联网上网人数进行预测,针对表2中的数据分别采用残差检验法和后残差检验法进行检验。
表2 2000~2005我国互联网上网人数预测结果
根据计算出来的预测值和原始数据求出残差和相对误差:
残 差 :q(1)(k)=x(1)(k)-xˆ(1)(k)
相对误差:e(k)=|q(1)(k)/x(1)(k)|×100%
通过上述检验方法,分别对本文的Verhulst模型和GM(1,1)模型计算出误差检验结果,表3显示了Verhulst模型和 GM(1,1)模型预测结果对比。
表3 Verhulst模型和GM(1,1)模型预测结果对比
从表3可以看出,即使参考文献[2]中通过建立残差对GM(1,1)模型进行修正,其预测结果也没有本文所介绍的Verhulst模型预测精度高。
表4 预测精度等级衡量
通过以上方法对所建立的互联网上网人数模型进行检验拟合,其结果显示:本文所建立的灰色Verhulst动态模型后检验比值 C=0.030 8、P=1,根据表 4判断依据,此模型预测效果为好。
合理科学地对我国互联网上网人数进行预测,可以为网络产业的发展提供科学有效的参考,同时,对于整个社会经济的发展也具有重要的意义。
本文通过分析研究动态Verhulst模型的思想、特征和我国互联网上网人数逐年增长,并在一定时间段上原始数据呈部分“S”型变化的趋势前提下,提出将Verhulst模型应用于我国互联网上网人数的预测。通过建立模型和结果检验,证明此方法具有方法简单、预测精度高、可进行中长期预测等特点,是一种值得推广的预测方法。
虽然通过此模型的建立,模拟的精度还是比较高的,但是根据灰色理论研究的原理和方法,若想提高预测精度、保证结果的可靠性,可以将Verhulst模型与其他预测方法结合使用,同时应该根据不断得到的新数据对预测模型进行不断的修正,因为随着时间的推移和一些外界因素的影响,数据的变化趋势会发生一定的变化,只有这样才能够更加准确地对我国互联网上网人数进行科学准确的预测,从而产生一系列的实用价值。
[1]陈晶晶,毛谦,刘国辉.我国互联网互用数预测研究[J].光通信研究,2007(1).
[2]连飞.基于 GM(1,1)模型的我国互联网上网人数灰色预测[J].统 计 与 咨 询 ,2007(4).
[3]邓聚龙.灰色系统理论教程[M].武汉:华中理工大学出版社,1999.
[4]WU W Y,CHEN S P.A prediction method using the Grey model GMC(1,n)combined with the grey relational analysis: a case study on Internet access population forecast[J].Applied Mathematics and Computation, 2005,169(1).
[5]蒿建华.灰色模型在人口预测中的应用[J].西安文理学院学报,2008,11(3).