顾蕾蕾,张鑫鑫,李 柯,刘 静,贾国柱
随着彩票在中国的不断普及,人们对其投资的热情越来越高。其中奖率一般为几百万分之一[1]。部分没有中奖的人会产生一些心理上的变化,这些变化可能会造成自身已有疾病的发作或者新疾病的诞生。例如:自杀、焦虑症、精神分裂症等。因此,检验彩票与心理疾病之间的长短期相关性是一个有意义的课题。
网络搜索已经成为有关集体健康趋势的宝贵信息来源[2]。中国最大的搜索引擎“百度”使用统计平台 (百度索引)为许多关键字的搜索信息建立索引。它已成为问题研究的重要辅助工具。在经济学中,它有效地衡量了投资者的关注度[3]。在流行病中,它监测并警示了AIDS和手足口等疾病的传播。
结合多重分形去趋势波动分析和去趋势互相关分析,Zhou提出了多重分形去势互相关分析法(MF-DCCA)[4]。它常常被用来分析时间序列之间的互相关性[5]。在本文中,百度指数被用来代替疾病的数值,我们使用MF-DCCA定量地分析了彩票与心理疾病间的互相关性和多重分形特征。
通过Python爬虫从百度指数平台(http://index.baidu.com/)搜集数据。数据的年限为2016年1月至2019年4月,单个长度为1 216。总体上,相比较于2017年和2018年,2016年的彩票搜索指数更高。在整个区间内,焦虑症和自杀的指数值也远远高于其它疾病。
MF-DCCA常常被用来探索两个时间序列的互相关性和多重分形特征。它首先将两列数据构造成两个新数据列,并生成长度为s的Ns个数据块。在进行去趋势处理后,使用Lambda法则得到F0(s),并转化为幂律相关性(Log-log)。通过OLS回归,q=2时对应为狭义Hurst指数。在Renyi指数被计算后,Legendre变换将得到奇异谱函数[5]。
互相关统计量Qcc(m)被用来检测彩票和心理疾病之间的互相关性[5]。如果两个序列之间不存在互相关性,统计量将会沿着卡方分布的标准值变化。如图1所示,它在5%显著性水平下的临界值由黑色虚线表示,自由度m为0到300。随着m的增加,六条线都高于虚线,这表明任意两个时间序列间均具有显著的互相关性。
图1 心理疾病与彩票间的交叉相关性检验
参数设置为8S*时不同疾病的广义Hurst指数。当q=2时,狭义Hurst指数被展示在表1中。
短期的互相关行为主要被外部力量影响,而长期的主要与其内在因素有关。当SS*,心理疾病与彩票之间的Hurst指数都大于0.829,其中精神分裂症的最大值为0.973,呈现出最强的持续性特征。自杀的分形程度最大,为0.768。当二者进行对比时,我们发现长期下的Hurst指数总要高于短期,6个序列与彩票之间具有更加明显的长程正相关性。
表1 各疾病与彩票间的Hurst指数、多重分形度( ∆h)和分形谱宽度( α∆)
多重分形的大小如表1所示。除焦虑症和狂躁症外,短期内的心理疾病与彩票间的分形谱宽度值较长期内更低,分形能力较弱。特别地,短期内的焦虑症和长期内的自杀与彩票间互相关性的分形能力最强。
进一步,为了获得彩票与各个指数间互相关性的每日动态变化,采用了滚动窗口的方法。它被广泛用于探索动态特征,检查外部冲击的影响和预测趋势。我们以年的倍数为窗口尺寸探索了一年和两年窗口大小下的互相关性演变趋势。步长均设置为1天。结果如图2,随着窗口大小的扩大,不同疾病与彩票间展示出了不同的互相关性特征。特别地,自杀与彩票间持续的互相关性逐渐显著,在两年时,该特征在所有时间内普遍明显。
在本文中,我们运用多重分形去趋势互相关(MF-DCCA)和滚动窗口定量地调查了心理疾病和彩票之间的动态关系。由此得出了以下结论。
1)心理疾病与彩票之间呈现出较为明显的持续互相关性。内部因素的影响远远高于外部力量;
2)这种互相关性是多重分形的。短期内的焦虑症和长期内的自杀与彩票间互相关性的分形特征最显著;
3)不同窗口大小下的滚动窗口展现的互相关趋势不同;
4)彩票可以作为影响心理疾病产生的来源之一。
各疾病与彩票间的关系受到各种因素的影响,且他们可能在一定时期内强化或抵消。本研究忽略了疾病对彩票的较小影响,这将在下一步工作进行探索。
图2 以年总天数为窗口大小下的心理疾病与彩票间的滑动窗口图