我国COVID-19日新增确诊病例存在“泡沫”行为吗?

2021-03-22 03:43江海峰胡根华梅昱楠

江海峰,胡根华,梅昱楠

(1.安徽工业大学商学院,安徽马鞍山243032;2.昆山杜克大学,江苏昆山215316)

自2019年底武汉爆发新冠病毒肺炎(COVID-19)以来,中国政府果断采取应对措施,疫情在短时间内得到有效控制,在抗击疫情行动中向世界人民递交了一份满意的答卷。为分析疫情对社会和经济的冲击,学者们展开了多方面的研究。例如在经济发展领域,杨扬等利用多元线性回归模型和组合预测模型考察新冠疫情对我国社会消费品零售额的影响;周新辉等利用回归算法优化模型评估新冠疫情对中小服务企业的冲击;刘学良等以非典疫情模型为基础测度新冠疫情对全国经济增长的影响等。还有学者采用各种模型对新冠疫情中病例数发展趋势进行研究,主要有SIR(susceptible-infective-removed)模型与改进的SIR模型、时滞动力学模型、时滞卷积模型和离散卷积模型、ARIMA(auto-regressive integrated moving average model)与指数平滑模型等。从使用数据来看,相关研究都使用早期的新冠疫情病例,数据量偏少,仅能构建短期预测模型,在长期内相关结论可能需要修正。从模型选择来看,主要是利用传染病预测模型和时间序列分析模型,考虑到影响新冠疫情因素的多样性,客观上需从其他角度研究其变化趋势。疫情的发展往往会经历酝酿、爆发、缓解、控制、消失几个阶段,其时间序列图显示出具有持续一定时间的激增和随之而来的急剧下降形式,这种情况有时会出现周期性的反复,这两点特征与经济泡沫的演化规律相似。鉴于此,文中从泡沫检验角度研究新冠疫情病例序列的动态演化规律,重点检验病例序列是否存在激增的“泡沫”行为、有几个“泡沫”周期及其发生时期识别,为新冠疫情的防控决策提供理论参考。

1 时间序列泡沫行为检验模型与时期识别

为检验时间序列否是存在激增泡沫行为,Phillips等先后提出右侧递归上确界ADF(super augmented dickey fuller,SADF)检验和一般上确界ADF(general super augmented dickey fuller,GSADF)检验,张力等还研究了固定窗宽滚动检验模式,和经典的单位根检验不同,这两类检验均采用右侧单位根上确界模式,当检验出存在泡沫行为时,该方法还给出泡沫行为起止时期的识别方法,可进一步揭示序列的演化规律。

1.1 泡沫行为检验模型

假设时间序列为y(t=1,2,…,T),数据生成过程为

其中W(.) 为定义在[0,1]上的标准布朗运动。由于经典的SADF检验估计模型(2)中不含截距项,这里沿用经典检验量分布结果。和传统单位根检验量分布一样,SADF检验量在大样本下收敛到非标准的分布,因此需使用模拟方法获得临界值。该检验采用右侧检验模式,因此需使用右侧临界值替代传统的左侧单位根检验临界值。当拒绝原假设时,表明序列y(t=1,2,…,T)存在激增的爆炸行为,即序列存在泡沫成份。

当被检验序列存在多个泡沫成份时,SADF检验功效低下,为此Phillips等提出了更为一般的SADF检验,即GSADF检验,在该检验中,也让样本初始比例r变动,由此得到GSADF检验量为

和SADF检验一样,GSADF检验也是右侧检验,需使用模拟方法获得临界值。当拒绝原假设时,表明被检验序列存在泡沫行为。

1.2 泡沫行为发生时期识别

则r,r的估计值分别为

1.3 Bootstrap检验

经典SADF检验和GSADF检验要求扰动项ε为独立同分布过程,这可能与实际不符,为降低检验水平扭曲程度,文中使用Harvey等的Wild Bootstrap检验替代临界值检验,步骤如下:

1)使用全部样本在原假设成立下估计模型(2),得到残差估计,如

5)反复进行步骤2)至步骤4),得到系列SADF和GSADF检验量,根据这些值计算90%,95%和99%分位数值,用以代替蒙特卡洛模拟方法得到的临界值,完成检验。

2 数据选取及泡沫识别

2.1 数据选取与描述性分析

选择我国每日新增确诊病例序列为疫情表征变量,起止时间为2020年1月3日至2020年12月31日,共364个观测,图1,2分别为该序列全部样本和2020年3月份后的时序。图1显示,在样本开始阶段,COVID-19每日新增确诊病例呈迅速上升趋势,至2020年2月12日达到峰值,为15 152例,2月份均维持较高水平,然后整体进入下降趋势。为清晰展示3月份后每日新增病例数变动规律,图2给出了从2020年3月1日至2020年12月31日的时序。图2显示,在此阶段,每日新增确诊病例数仍有较大的变动幅度,周期性明显,其中有3个极大值,分别为2020年4月16日、2020年7月30日和2020年12月19日,对应的病例数分别为352例、276例和136例。图1,2显示,每日新增确诊病例变动具有一定的周期特征,分别在2月份、4月份、7月份和12月份呈现峰值。值得注意的是,图2显示,自2020年11月份以来,每日新增确诊病例再次呈反弹趋势。从整个序列的变动趋势看,与Evans描述的周期泡沫行为相似,说明每日新增确诊病例可能有多个“泡沫”行为和波动周期。

图1 2020年全部样本每日新增确诊病例时序Fig.1 Time of daily confirmed cases in all samples for 2020

图2 2020年3月份后每日新增确诊病例时序Fig.2 Time of daily confirmed cases after March 2020

该序列全部样本和分组样本常见描述性统计量结果如表1。表1显示,在整个样本阶段,最大日新增确诊病例数为15 152例,最小值为0例,日平均新增确诊病例约为266例。分组统计显示,日新增确诊病例数以区间[51,100],[21,30]最多,分别占全部样本的17.03%和14.29%,而日新增10 例以下、区间[11,20]和[101,150]占比相当,基本在12%左右,整个日新增确诊病例在150例以下的天数比例高达87.91%。描述性统计分析表明,新冠疫情初期形势严峻,但我国采取了强有力的防控措施,以较快的速度控制疫情发展,使得日新增确诊病例基本维持在两位数水平。

表1 全部样本和分组样本下常见描述性统计量Tab.1 Common descriptive statistics for all samples and grouped samples

2.2 日新增确诊病例数的“泡沫”行为检验

利用SADF 和GSADF 检验我国日新增确诊病例数是否存在“泡沫”行为,考虑到该序列在初期增长迅速,不宜设置较长的最小窗宽,文中设置最小窗宽为25;一般来说,较大的滞后期能够消除扰动项的自相关性,但也会造成较高的水平扭曲程度,考虑到时间序列后的相关性,文中取滞后期为1。为进一步降低检验水平扭曲,文中使用Wild Bootstrap方法替代临界值检验,设置Bootstrap检验次数为500次,检验结果如表2。表2 显示,SADF 检验量和GSADF 检验量值均为10.045,SADF 检验量在90%,95%,99%显著性水平下的Wild Bootstrap临界值分别为2.177,2.819,5.358,有检验量值大于3个显著性水平下的临界值,因此检验概率近似为0。GSADF检验上述3个显著性水平的Wild Bootstrap临界值分别为5.311,6.094,11.097,有检验量值大于95%显著性水平下的临界值而小于99%显著性水平下的临界值,所以检验概率为0.012,大于0.01而小于0.05。总体来说,两种检验量都支持我国日新增确诊病例至少在95%的显著性水平下存在“泡沫”行为,即新冠疫情在演化过程中有激增的爆发态势。

表2 日新增确诊病例数的“泡沫”行为检验结果Tab.2 Results of“bubble”behavior tests for newly confirmed cases

为进一步揭示我国日新增确诊病例序列演化规律,对“泡沫”行为发生的时间段进行识别,结果分别如图3,4。图3中,从上到下3条线分别为日新增确诊病例序列、95%显著性水平下的临界值序列、SADF检验量值序列,其中日新增病例数对应右边坐标轴,而SADF检验量和GSADF检验量及其临界值对应左边坐标轴。当SADF检验量值序列位于95%显著性水平临界值之上时,表示日新增确诊病例序列存在“泡沫”行为,否则表示不存在“泡沫”行为,首次超越点和随后的首次低于点即为“泡沫”行为的起点和终点。据此可看出,SADF检验表明存在两个“泡沫”阶段,文中用阴影来标识。图4中3条线表示的含义与图3同。图4显示,我国日新增确诊病例在整个样本存在5个“泡沫”阶段。

图3 SADF检验“泡沫”行为起止期识别Fig.3 SADF identification for the origination and rmination of“bubble”behavior

图4 GSADF检验“泡沫”行为起止期识别Fig.4 GSADF identification for the origination and termination of“bubble”behavior

表3为每个“泡沫”阶段的起止日期、维持天数以及病例数上涨幅度。

表3 2020年日新增确诊病例数的“泡沫”行为持续时间识别Tab.3 Identification of“bubble”behavior duration for newly confirmed cases on 2020

表3 显示:SADF 和GSADF 检验均表明第一次“泡沫”行为发生在2020 年1 月27 日,止于2020 年2 月7日,持续12 d,该时间段对应图1中第一个上升阶段,平均日新增确诊病例为1 877例,较“泡沫”行为前一天平均增加241.89%,因此第一阶段具有持续周期长且增幅大的特征;第二阶段对应的时间段为2020 年2 月12日至2020年2月13日,对应图1中最大值及其后一天所在的时间段,该阶段持续仅2 d,但平均日新增确诊病例高达7 579例,较“泡沫”行为前一天平均增加374.83%,因此“泡沫”持续时间短但增加迅猛。这两个“泡沫”阶段表示新冠疫情已进入全面爆发时期。此外,GSADF检验还检测到其他3个“泡沫”阶段,其中第三个“泡沫”阶段发生在2020年7月19日,仅持续1 d,较“泡沫”前一天增加51例确诊病例,增幅为63.75%。第四个“泡沫”时间段为2020年7月24日至2020年7月31日,持续8 d,较“泡沫”前一天平均增加64例确诊病例,平均增幅为45.86%,这两个时间段对应图2中第二个上升阶段。第五个“泡沫”阶段为2020年11月29日,持续仅1 d,较“泡沫”前一天增加32例确诊病例,增幅为30.77%,对应图2中第三个上升阶段。总而言之,我国日新增确诊病例经历了多个“泡沫”阶段,其中以第一阶段和第四阶段持续时间最长,而第二阶段“泡沫”增长幅度最大,但随着全民抗疫举措深入落实,日新增确诊病例增加的绝对数和相对数据都呈明显下降趋势,显示我国新冠疫情得到有效控制。

3 结 论

采用经济泡沫SADF 检验、GSADF 检验和泡沫周期识别方法,以我国2020 年1 月3 日至2020 年12 月31日的日新增COVID-19确诊病例序列为研究对象,考察新冠疫情发展态势,得到如下几点结论:

1)全部样本和部分样本日新增确诊病例时序图表明,我国日新增确诊病例经历4个比较明显波动周期,分别对应2月份、3月份、7月份和11月份前后所在的时间段,4个周期内日新增确诊病例的增幅随时间的推移呈明显下降趋势,从这个角度来说,我国新冠疫情呈持续好转趋势。图1描述性分析显示,日新增确诊病例出现四位数的情况,甚至还发生过日新增15 152例的极端情况,但整体平均值约266例,实际上日新增确诊病例不超过200例和50例的天数各占87.91%和56.59%,这也表明,我国的抗疫举措有效地遏制了新冠疫情的进一步恶化。

2)SADF检验和GSADF检验表明,我国日新增确诊病例序列存在明显的“泡沫”行为,存在两个明显的扩散过程,持续周期分别为12 d和8 d,另外有持续周期为2 d和1 d的短期扩散过程,持续周期的缩短表明我国已初步控制疫情的发展。

3)实证研究也表明,在我国,来势凶猛的新冠疫情得到有效控制,但也出现反复的情形,“泡沫”行为的存在揭示我国新冠疫情经历了酝酿、爆发、控制与缓解过程,且出现周期性变动规律,但仍没有达到消除的最终目标。

随着无症状感染病例和新冠病毒变异的出现,面对日益严峻的全球疫情形势和增加的境外输入病例,我国抗击新冠病毒肺炎的任务依然艰巨。图2显示日新增病例在2020年年底出现第四次反弹,根据泡沫行为理论,这可能是下一个“泡沫”的酝酿阶段。因此,全国上下仍需保持高度警惕,防止2021年年初疫情的再次爆发。