基于时间序列模型预测点对点短消息业务量

2014-07-29 01:55朱立君张瑞
中国新通信 2014年1期
关键词:短消息点对点业务量

朱立君 张瑞

一、引言

目前短消息业务与话音业务一样,已经成为移动通信网络提供的基本电信业务之一。通常短消息业务可分为点对点短消息和梦网、行业短消息两大类,这两类短消息都与人们的日常生活密切相关,特别是点对点短消息,已经成为人们日常通信中不可或缺的一部分。

二、时间序列模型

2.1 时间序列模型的定义

时间序列是随时间改变而随机地变化的序列,时间序列预测模型的目的是找出它的变化规律,从而利用规律来预测将来的走势,现有的时间序列预测模型通常包括三类:

(1)自回归模型(AR):反映数据变量的当前值与其过去值的关系

其中p为AR(p)模型的阶数,ut为均值为0,方差为某值的白噪声信号。

(2)移动平均模型(MA):反映数据变量当前值与当前及过去误差项的关系

其中q为MA(q)模型的阶数,ut为均值为0,方差为某值的白噪声信号。

两者结合的模型(ARMA),如果时间序列Yt是它的当期和前期的随机误差项以及前期值的线性函数,即可表示为:

则称该序列为(p,q)阶自回归移动平均模型,ut为均值为0,方差为某值的白噪声信号。记为ARMA(p,q)。

2.2 时间序列分析模型的识别

对于AR、MA、ARMA模型,在进行参数估计之前,需要进行模型的识别。识别的基本任务是确定时间序列样本属于哪种模型,并找出ARMA(p,q)、AR(p)、MA(q)模型的阶。识别的方法是利用时间序列样本的自相关函数和偏自相关函数进行判断,判断方法如表1所示。

拖尾是指函数值随着自变量的增大以负指数速度趋向于0,截尾是指函数值在自变量为某值时不为0,在此值以后等于0。

三、某省短消息业务量预测示例

3.1 历史数据分析

根据某省移动(简称A省)报表数据,统计该省从2005年1月起至2011年12月每月最忙天点对点短消息业务量,如图1所示:

可以看出,A省点对点短消息话务量存在以下特点:(1)存在假日效应——即每逢“春节”、“中秋”、“圣诞”等节假日到来之际,业务量会呈现突发性增长,每年春节达到该年业务量峰值。(2)非节假日时点对点短消息业务量处于较低水平。(3)点对点短消息业务量历年峰值呈逐年上升趋势。

3.2 点对点短消息业务量预测

A省点对点短消息业务量可看作为时间序列,下面将利用时间序列预测模型,通过MATLAB软件仿真,对A省点对点短消息业务量进行预测。

(1)统计A省点对点短消息业务量历史数据,如表2所示:

(2)由于除夕峰值数据较少,为了提高预测的准确性,在相邻两年除夕业务量间做3个点的插值,增加数据量,具体程序如下:

mtbf=xlsread('E:\000.xlsx','A1:A7');

length_of_x=length(mtbf);

x=1:4:length_of_x+3*length_of_x;

scalar_x=x(1):1:x(length_of_x);

length_of_sx=length(scalar_x);

for i=1:length(scalar_x);

mtbf_spline(i)=fix(interp1(x,mtbf,scalar_x(i),'spline'));

end

z=mtbf_spline;

(3)由于时间序列预测模型要求样本为平稳序列,所以判断样本数据序列是否为平稳序列,若为非平稳序列则对序列进行差分,转化为平稳序列,具体程序如下:

f=[];

for n=1:20;

H=adftest(z);

if H==1;

break;

end

f(n)=z(1);

z=diff(z);

end

得出n=5,即对原序列做4次差分后,序列转化为平稳序列。

(4)求平稳序列的自相关和偏相关函数,如图2所示。

autocorr(z)

[a,b] = autocorr(z)

subplot(2,1,2);

parcorr(z)

[c,d] = parcorr(z)

可以看出自相关函数拖尾,偏相关函数截尾,所以该序列适用于AR模型。

(5)确定AR模型的阶数及系数,具体程序如下。

test=[];

for q=1:10

m=ar(z,q,'gl');

AIC=aic(m)

test=[test;q AIC];

end

for k = 1:size(test,1)

if test(k,2) == min(test(:,2))

q_test = test(k,1)

break;

end

end

m=ar(z,q_test,'gl');

MATLAB输出模型为A(q)=1-0.4444q^-1,即AR模型为

Yt=0.4444Yt-1+ut

ut为均值为0,方差为某值的白噪声信号。

(6)对平稳序列进行预测,并对结果做反差分运算,得出样本数据的预测数据,具体程序如下。

m=ar(z,q_test,'gl')

z1= iddata([z 0 0 0 0 0]');

P1=predict(m,z1,1);

PreR=P1.OutputData;

for i=n-1:-1:1

PreR=[f(i);PreR];

PreR=cumsum(PreR);

end

得出预测序列统计表如表3所示:

3.3 与实际业务量的比较

根据2005年除夕至2012年除夕A省实际点对点短消息业务量数据及表3中预测值绘制曲线如图3所示:

2012年除夕点对点短消息业务量预测值为629600000,实际值为643289929,预测误差为2.1%,因此时间序列预测模型较准确地预测了2012年除夕点对点短消息业务量。

四、结束语

短消息业务量的预测可以采用多种方法,本文基于时间序列模型,通过MATLAB软件仿真,对A省2012年除夕点对点短消息业务量进行了预测,取得了较好的预测结果,对后续短消息中心的建设具有一定的参考意义。

一、引言

目前短消息业务与话音业务一样,已经成为移动通信网络提供的基本电信业务之一。通常短消息业务可分为点对点短消息和梦网、行业短消息两大类,这两类短消息都与人们的日常生活密切相关,特别是点对点短消息,已经成为人们日常通信中不可或缺的一部分。

二、时间序列模型

2.1 时间序列模型的定义

时间序列是随时间改变而随机地变化的序列,时间序列预测模型的目的是找出它的变化规律,从而利用规律来预测将来的走势,现有的时间序列预测模型通常包括三类:

(1)自回归模型(AR):反映数据变量的当前值与其过去值的关系

其中p为AR(p)模型的阶数,ut为均值为0,方差为某值的白噪声信号。

(2)移动平均模型(MA):反映数据变量当前值与当前及过去误差项的关系

其中q为MA(q)模型的阶数,ut为均值为0,方差为某值的白噪声信号。

两者结合的模型(ARMA),如果时间序列Yt是它的当期和前期的随机误差项以及前期值的线性函数,即可表示为:

则称该序列为(p,q)阶自回归移动平均模型,ut为均值为0,方差为某值的白噪声信号。记为ARMA(p,q)。

2.2 时间序列分析模型的识别

对于AR、MA、ARMA模型,在进行参数估计之前,需要进行模型的识别。识别的基本任务是确定时间序列样本属于哪种模型,并找出ARMA(p,q)、AR(p)、MA(q)模型的阶。识别的方法是利用时间序列样本的自相关函数和偏自相关函数进行判断,判断方法如表1所示。

拖尾是指函数值随着自变量的增大以负指数速度趋向于0,截尾是指函数值在自变量为某值时不为0,在此值以后等于0。

三、某省短消息业务量预测示例

3.1 历史数据分析

根据某省移动(简称A省)报表数据,统计该省从2005年1月起至2011年12月每月最忙天点对点短消息业务量,如图1所示:

可以看出,A省点对点短消息话务量存在以下特点:(1)存在假日效应——即每逢“春节”、“中秋”、“圣诞”等节假日到来之际,业务量会呈现突发性增长,每年春节达到该年业务量峰值。(2)非节假日时点对点短消息业务量处于较低水平。(3)点对点短消息业务量历年峰值呈逐年上升趋势。

3.2 点对点短消息业务量预测

A省点对点短消息业务量可看作为时间序列,下面将利用时间序列预测模型,通过MATLAB软件仿真,对A省点对点短消息业务量进行预测。

(1)统计A省点对点短消息业务量历史数据,如表2所示:

(2)由于除夕峰值数据较少,为了提高预测的准确性,在相邻两年除夕业务量间做3个点的插值,增加数据量,具体程序如下:

mtbf=xlsread('E:\000.xlsx','A1:A7');

length_of_x=length(mtbf);

x=1:4:length_of_x+3*length_of_x;

scalar_x=x(1):1:x(length_of_x);

length_of_sx=length(scalar_x);

for i=1:length(scalar_x);

mtbf_spline(i)=fix(interp1(x,mtbf,scalar_x(i),'spline'));

end

z=mtbf_spline;

(3)由于时间序列预测模型要求样本为平稳序列,所以判断样本数据序列是否为平稳序列,若为非平稳序列则对序列进行差分,转化为平稳序列,具体程序如下:

f=[];

for n=1:20;

H=adftest(z);

if H==1;

break;

end

f(n)=z(1);

z=diff(z);

end

得出n=5,即对原序列做4次差分后,序列转化为平稳序列。

(4)求平稳序列的自相关和偏相关函数,如图2所示。

autocorr(z)

[a,b] = autocorr(z)

subplot(2,1,2);

parcorr(z)

[c,d] = parcorr(z)

可以看出自相关函数拖尾,偏相关函数截尾,所以该序列适用于AR模型。

(5)确定AR模型的阶数及系数,具体程序如下。

test=[];

for q=1:10

m=ar(z,q,'gl');

AIC=aic(m)

test=[test;q AIC];

end

for k = 1:size(test,1)

if test(k,2) == min(test(:,2))

q_test = test(k,1)

break;

end

end

m=ar(z,q_test,'gl');

MATLAB输出模型为A(q)=1-0.4444q^-1,即AR模型为

Yt=0.4444Yt-1+ut

ut为均值为0,方差为某值的白噪声信号。

(6)对平稳序列进行预测,并对结果做反差分运算,得出样本数据的预测数据,具体程序如下。

m=ar(z,q_test,'gl')

z1= iddata([z 0 0 0 0 0]');

P1=predict(m,z1,1);

PreR=P1.OutputData;

for i=n-1:-1:1

PreR=[f(i);PreR];

PreR=cumsum(PreR);

end

得出预测序列统计表如表3所示:

3.3 与实际业务量的比较

根据2005年除夕至2012年除夕A省实际点对点短消息业务量数据及表3中预测值绘制曲线如图3所示:

2012年除夕点对点短消息业务量预测值为629600000,实际值为643289929,预测误差为2.1%,因此时间序列预测模型较准确地预测了2012年除夕点对点短消息业务量。

四、结束语

短消息业务量的预测可以采用多种方法,本文基于时间序列模型,通过MATLAB软件仿真,对A省2012年除夕点对点短消息业务量进行了预测,取得了较好的预测结果,对后续短消息中心的建设具有一定的参考意义。

一、引言

目前短消息业务与话音业务一样,已经成为移动通信网络提供的基本电信业务之一。通常短消息业务可分为点对点短消息和梦网、行业短消息两大类,这两类短消息都与人们的日常生活密切相关,特别是点对点短消息,已经成为人们日常通信中不可或缺的一部分。

二、时间序列模型

2.1 时间序列模型的定义

时间序列是随时间改变而随机地变化的序列,时间序列预测模型的目的是找出它的变化规律,从而利用规律来预测将来的走势,现有的时间序列预测模型通常包括三类:

(1)自回归模型(AR):反映数据变量的当前值与其过去值的关系

其中p为AR(p)模型的阶数,ut为均值为0,方差为某值的白噪声信号。

(2)移动平均模型(MA):反映数据变量当前值与当前及过去误差项的关系

其中q为MA(q)模型的阶数,ut为均值为0,方差为某值的白噪声信号。

两者结合的模型(ARMA),如果时间序列Yt是它的当期和前期的随机误差项以及前期值的线性函数,即可表示为:

则称该序列为(p,q)阶自回归移动平均模型,ut为均值为0,方差为某值的白噪声信号。记为ARMA(p,q)。

2.2 时间序列分析模型的识别

对于AR、MA、ARMA模型,在进行参数估计之前,需要进行模型的识别。识别的基本任务是确定时间序列样本属于哪种模型,并找出ARMA(p,q)、AR(p)、MA(q)模型的阶。识别的方法是利用时间序列样本的自相关函数和偏自相关函数进行判断,判断方法如表1所示。

拖尾是指函数值随着自变量的增大以负指数速度趋向于0,截尾是指函数值在自变量为某值时不为0,在此值以后等于0。

三、某省短消息业务量预测示例

3.1 历史数据分析

根据某省移动(简称A省)报表数据,统计该省从2005年1月起至2011年12月每月最忙天点对点短消息业务量,如图1所示:

可以看出,A省点对点短消息话务量存在以下特点:(1)存在假日效应——即每逢“春节”、“中秋”、“圣诞”等节假日到来之际,业务量会呈现突发性增长,每年春节达到该年业务量峰值。(2)非节假日时点对点短消息业务量处于较低水平。(3)点对点短消息业务量历年峰值呈逐年上升趋势。

3.2 点对点短消息业务量预测

A省点对点短消息业务量可看作为时间序列,下面将利用时间序列预测模型,通过MATLAB软件仿真,对A省点对点短消息业务量进行预测。

(1)统计A省点对点短消息业务量历史数据,如表2所示:

(2)由于除夕峰值数据较少,为了提高预测的准确性,在相邻两年除夕业务量间做3个点的插值,增加数据量,具体程序如下:

mtbf=xlsread('E:\000.xlsx','A1:A7');

length_of_x=length(mtbf);

x=1:4:length_of_x+3*length_of_x;

scalar_x=x(1):1:x(length_of_x);

length_of_sx=length(scalar_x);

for i=1:length(scalar_x);

mtbf_spline(i)=fix(interp1(x,mtbf,scalar_x(i),'spline'));

end

z=mtbf_spline;

(3)由于时间序列预测模型要求样本为平稳序列,所以判断样本数据序列是否为平稳序列,若为非平稳序列则对序列进行差分,转化为平稳序列,具体程序如下:

f=[];

for n=1:20;

H=adftest(z);

if H==1;

break;

end

f(n)=z(1);

z=diff(z);

end

得出n=5,即对原序列做4次差分后,序列转化为平稳序列。

(4)求平稳序列的自相关和偏相关函数,如图2所示。

autocorr(z)

[a,b] = autocorr(z)

subplot(2,1,2);

parcorr(z)

[c,d] = parcorr(z)

可以看出自相关函数拖尾,偏相关函数截尾,所以该序列适用于AR模型。

(5)确定AR模型的阶数及系数,具体程序如下。

test=[];

for q=1:10

m=ar(z,q,'gl');

AIC=aic(m)

test=[test;q AIC];

end

for k = 1:size(test,1)

if test(k,2) == min(test(:,2))

q_test = test(k,1)

break;

end

end

m=ar(z,q_test,'gl');

MATLAB输出模型为A(q)=1-0.4444q^-1,即AR模型为

Yt=0.4444Yt-1+ut

ut为均值为0,方差为某值的白噪声信号。

(6)对平稳序列进行预测,并对结果做反差分运算,得出样本数据的预测数据,具体程序如下。

m=ar(z,q_test,'gl')

z1= iddata([z 0 0 0 0 0]');

P1=predict(m,z1,1);

PreR=P1.OutputData;

for i=n-1:-1:1

PreR=[f(i);PreR];

PreR=cumsum(PreR);

end

得出预测序列统计表如表3所示:

3.3 与实际业务量的比较

根据2005年除夕至2012年除夕A省实际点对点短消息业务量数据及表3中预测值绘制曲线如图3所示:

2012年除夕点对点短消息业务量预测值为629600000,实际值为643289929,预测误差为2.1%,因此时间序列预测模型较准确地预测了2012年除夕点对点短消息业务量。

四、结束语

短消息业务量的预测可以采用多种方法,本文基于时间序列模型,通过MATLAB软件仿真,对A省2012年除夕点对点短消息业务量进行了预测,取得了较好的预测结果,对后续短消息中心的建设具有一定的参考意义。

猜你喜欢
短消息点对点业务量
快递业务量累计完成480.9 亿件
“点对点”帮2万名农民工返岗
2020年业务量达830亿件快递跑出经济活力
OptiX155622H设备点对点以太网透传业务故障分析
试论电视新闻短消息的采写策略
浅谈广播短消息的采写
8月全国快递业务量完成32.6亿件同比增29.4%
Android手机系统中的短消息加密研究与实现
便携式点对点可见光通信终端的实验研究
点对点红外通讯装置的设计