一种新的时间序列周期检测算法

2017-10-14 06:11计萍宋焱燚
关键词:客流量相似性水文

计萍, 宋焱燚



一种新的时间序列周期检测算法

计萍, 宋焱燚

(安徽财经大学统计与应用数学学院, 安徽蚌埠, 233030)

提出了一种SJ周期检测算法, 利用计算机虚拟了3个序列来评价SJ算法的可行性和需要改进的地方。将SJ算法应用到铁路客流量数据上, 检测到客流量数据存在4、7和26的周期规律。

时间序列周期; SJ周期检测算法; 客流量周期

时间序列的周期性检验是非常重要的, 对于一些简单的时间序列, 例如水文序列[1-3]、天气序列和客流量序列等, 其周期性更是人们关注的焦点。已有的周期检验方法有简单分波法、傅里叶分析法、功率谱分析法、最大熵谱分析法和小波方差法等[4-5]。针对适用于简单序列的周期检测,本文将介绍一种新的算法——SJ周期检测算法。此算法是作者在一次数据挖掘竞赛(第四届泰迪杯全国大学生数据挖掘竞赛B题)中开发的, 挖掘的目标是“铁路客流量的分析与预测”, 在分析过程中, 发现客流量虽然在节假日发生突变, 但其仍然具有一定的周期规律, 于是本文着手于客流量的周期分析, 这也是SJ周期检测算法的初衷。

1 SJ周期检测算法原理及模型

SSJ本质上是一种遍历搜索算法, 由于分析的序列大多为1 d或者1 yr之类的离散性序列, 这使得SJ的周期为整数而不存在小数情况。

2 SJ算法的流程及伪代码

SJ算法的流程[6]如下:

step3. 采用Pearson线性相关系数作为向量相似性的度量, 计算的各个向量之间的相似性;

SJ算法的伪代码如下:

begin

end(for)

end(for)

end(for)

end(for)

end(while)

end(begin)

3 SJ的2个实验

图1 2个虚拟时间序列(周期为8)

图2 第1个虚拟时间序列的SJ检测结果

图3 第2个虚拟时间序列的SJ检测结果

4 实例分析

数据来源于第四届泰迪杯全国大学生数据挖掘竞赛B题整理数据[9-10], 是ZD111市2015年1月1日到2016年3月20日共439 d (有7 d的缺失值)的客流量数据。其客流量情况如图4所示, 在360 d用竖线进行标记(1~360是2015全年的情况)。从图4可以看出, ZD111客流确实具有一定的周期规律, 且周期约为7 d。

图4 ZD111市2015/01/01-2016/03/20的客流量

利用adftest对ZD111市的客流量进行平稳性检验,检验结果表明ZD111市的客流量平稳。在此基础上分析序列的自相关和偏自相关[11], 自相关和偏自相关的定义为。

图5 ZD111客流量的自相关及偏自相关图

为验证客流量的周期为7, 利用设计的SJ周期检验算法对ZD111的周期进行检验。设置初始周期为3, 浮动量为1, 最大周期为30。SJ检测的结果如图6所示, 检测到的ZD111客流量周期为4、7和26, 它们的SJ相似性分别为0.072 6、0.060 7和0.065 2, 3个周期的相似性伴随概率均小于0.05, 说明相似性显著。为了研究小周期内客流的变化规律给出3个星期(305~326) ZD111的客流量, 如图7所示。从图7可以看出: ZD111客流量以7为周期的变化规律明显, 即周期为7。ZD111的客流量在一个星期内的变化规律是周1的客流量最小, 从周1~周5, 客流量逐渐增加, 在周5 (第305 d)时, 客流量最大, 周6会变小, 之后周日又有所增加。

图6 ZD111客流量的SJ周期检测结果

图7 ZD111客流量的3周的客流规律图

5 结论

本文指出一种新的周期检测算法(SJ), 并介绍了其原理、模型、步骤以及伪代码。用2个简单周期序列验证了本算法的准确性。用该算法对某市一段时间内的客流量进行了周期分析, 结果显示, 该市客流量具有7 d的周期, 并得到了一周内客流量的变化规律。

[1] 于浩. 基于时间序列的延河流域水沙周期分析及趋势预测[D]. 西安: 西北农林科技大学, 2008.

[2] 杨华. 水文时间序列周期分析方法的研究[J]. 中国水能及电气化: 科学研究及工程设计, 2015(5): 63-66.

[3] 杨玲霞, 孙东永, 张莉. R/S在径流时间序列周期分析中的应用[J]. 人民黄河: 水文·泥沙, 2013(9): 51-52.

[4] 赵利红. 水文时间序列周期分析方法的研究[D]. 青岛: 中国海洋大学, 2007.

[5] 肖志国. 几种水文时间序列周期分析方法的比较研究[D]. 青岛: 中国海洋大学, 2006.

[6] 郁磊, 史峰, 王辉. MATLAB智能算法30个案例分析[M]. 北京: 北京航空航天大学出版社, 2015: 178-182.

[7] 赵海青. 动态时间序列周期分析预测模型[J]. 郑州: 郑州大学, 2002.

[8] 郭龙. 时间序列数据的周期性研究[D]. 成都: 电子科技大学, 2013.

[9] 张良均, 杨坦, 肖刚,等. MATLAB数据分析与挖掘实战[M]. 北京: 机械工业出版社, 2015: 123-129.

[10] 盛骤, 谢氏千, 潘承毅. 概率论与数理统计[M]. 北京: 高等教育出版社, 2008: 106-108.

[11] 杨桂元, 朱家明. 数学建模竞赛优秀论文评析[M]. 合肥: 中国科学技术大学出版社, 2013: 134-146.

(责任编校:刘晓霞)

A period detection algorithm for time series-SJ cycle detection algorithm

Ji Ping, Song Yanyi

(School of statistics and applied mathematics, Anhui Finance and Economics University, Bengbu 233030, China)

A SJ cycle detection algorithm is put forward. Three sequences are used to evaluate the feasibility and disadvantages of SJ algorithm by the use of computer. By SJ algorithm, it is recognized that the cycle of 4, 7 and 26 exists in traffic data.

time series cycle; SJ cycle detection algorithm; traffic cycle

10.3969/j.issn.1672–6146.2017.01.002

P 171.5

A

1672–6146(2017)01–0005–04

计萍, 2474296173@qq.com。

2016-05-27

国家自然科学基金(11301009); 安徽财经大学教研项目(acjyzd201429)。

猜你喜欢
客流量相似性水文
一类上三角算子矩阵的相似性与酉相似性
继往开来 守正创新——河北省水文工程地质勘查院
浅析当代中西方绘画的相似性
水文
水文水资源管理
基于灰色预测理论在交通枢纽客流量的实际应用
基于灰色预测理论在交通枢纽客流量的实际应用
基于嵌入式系统的商场客流量统计算法
水文
低渗透黏土中氯离子弥散作用离心模拟相似性