基于BP神经网络对中国体育彩票销售金额的预测

2022-04-28 07:52周博军黄俊达陈超凡邓玉新马福海
体育教育学刊 2022年2期
关键词:体育彩票体育赛事神经网络

周博军,王 旺,黄俊达,陈超凡,陈 震,邓玉新,马福海

(1.西安体育学院 研究生部,陕西 西安 710000;2.青海体育科学研究所,青海 西宁 810000)

体育彩票起源于中世纪的欧洲大陆,中国的体育彩票由福建省率先发行,随后遍布全国各地。体育彩票销售所筹公益金是我国社会公益事业的重要资金来源之一,广泛用于扶贫助学、公共体育器材捐赠、养老服务、自然灾害救助、补充社会保障金等领域[1-2]。我国体育彩票行业从无到有,从有到强,从国家支持体育彩票发行到体育彩票反哺国家民生发展,都说明体育彩票的壮大对于国家的发展有着重要影响。1995年至今,中国体育彩票累计售出超过21 489.77亿元,截至2020年11月7日,募集公益资金5 554.58亿元,为社会创造直接就业岗位超过50万个。据国家体育总局发布的年度彩票公益金使用明细来看,2019年,我国竞技体育与全民健身工作分别获得了体育彩票公益金11.81亿元和25.28亿元的经费支持,对促进我国体育事业的发展和社会福利保障的提高作出了重要贡献。体育彩票推动了我国体育事业的蓬勃发展,同时体育事业的飞速发展也推动着体育彩票行业的进步[3-4]。

彩票发行已有20多年,相关部门历年公布的数据显示,我国体育彩票销售额增长迅猛,但2020年突发的全球性公共卫生安全事件严重干扰了世界各行各业的发展秩序,全球体育赛事产业链也受到巨大冲击,体育赛事停摆,东京奥运会延期,“无赛可观”境遇下体育竞赛资源匮乏直接影响我国体育彩票销售[3]。为探明此次突发的重大公共卫生安全事件对我国体育彩票行业的影响,本研究拟构建BP神经网络对2020-2023年中国体育彩票销售金额进行预测研究,预估新冠肺炎疫情对我国2020年体育彩票行业所造成的损失,并预测未来3年我国体育彩票的销售金额,为需要体育彩票公益金提供支持的相关行业与领域提供参考。

1 数据来源与研究方法

1.1 数据来源

本研究所使用的数据来源于《中国财政年鉴2018》《中国体育年鉴2018》与中国体彩网(www.lottery.gov.cn),选取1995-2020年中国体育彩票年度销售金额累计值数据(见表1)。采用Matlab软件建模确定最优预测模型,对2020年及后续3年的中国体育彩票售卖金额进行预测。

表1 1995-2020年体育彩票销售金额累计值

1.2 研究方法

1.2.1 预测模型类型的选择

BP神经网络预测模型构建预测研究模型时可分为非线性回归预测和时间序列预测。若采用非线性回归分析预测模型,则需分析国内外不同规模、不同影响力的体育赛事对体育彩票销售的影响,还需进一步探讨体育彩票购买方式、地区人口以及各省份体育彩票销售站点增减数等因素所产生的内生性。但是影响体育彩票销售金额的因素有多个扰动项,难统计、具有不可测性,年度数据难以收集。与非线性回归预测相比,时间序列预测模型假设认定体育彩票售卖金额变化受多项扰动的综合因素决定[5],所以本次研究在该假设基础上采用时间序列预测模式用前期销售总金额来预测估计未来销售总金额。

1.2.2 人工神经网络

神经网络的全称是人工神经网络(Artificialneural network),是一种借助机器算法来模拟生物脑神经传递所建立的一种复杂系统,通过基础数据自身的变化,实现自我鉴别、数据计算等功能,是人工智能、大数据领域的一种方法[6]。该算法是基于误差反向传播算法(BackPropagation),误差逆传播神经网络(Muhiple Layer Feedforward Network)即BP神经网络。BP神经网络进行机器学习时采取阶梯下降算法,具有自学习、高精度的非线性函数计算能力以及较强的非线性映射功能,因其强大的数据处理和多领域的适用性,成为神经网络中应用最广泛的预测模型[7]。该模型常用于受多因素干扰的预测,如货币汇率、农作物产量和销量、股票价格以及其他随时间序列波动的大宗商品。

1.2.3 BP神经网络原理

BP神经网络原理的运算机制是通过多层分析计算预先提供的输入层、隐含层、输出层的多层前馈型神经网络。机器模拟学习输入层、隐含层、输出层的基本特征,并根据这些特征来推算预测新的输入数据可能且合理的输出结果(如图1)。其中S为单极性Sigmoid函数,因单极性Sigmoid函数处处可导且具有非线性饱和的特性,故BP神经网络通常采用单极性Sigmoid函数设为激活函数[8]。

图1 BP神经网络结构

单极性Sigmoid函数与其导函数为①、②。

f′(x)=f(x)·[1-f(x)]

首先是向前传播,见③。

a0表示第i年及之前(m-1)年的源数据,在此次预测中m取值为2,3,4,…,25,26,中间各级输出,见④。

am+1=f(Wm+1)·am+bm+1,m=1,…,m

其中M为神经网络的总层级,aM为最终输出级,通常直接以a表示,式中的m表示第m层,不是指a的幂级数。

最后一层的输出用⑤。

a=aM=P(i+1)

表示第i+1年的体育销售彩票总金额。

接下来通过网络进行反向传播,见⑥。

SM=-2FM(nM)(t-a)

由于具有差异性各层误差反向传播敏感性表达式为⑦。

Sm=FM·nm·(Wm+1)T·Sm+1,m=M-1,…,2,1

其中,Wm+1表示第m+1层的权重。

最后,对权值与阈值修正采用梯度下降算法,即⑧、⑨。

Wm·(K+1)=Wm·K-asm·(a(m-1))T

bm·(K+1)=bm·K-asm⑨

1.2.4 模型结构确定及参数设置

首先将1995-2020年的体育彩票销售累计数据进行规范化处理,其中将前4年的销售数据设定为输入层节点,后续3年为输出变量,形成一个26行乘以3维的变量矩阵,即模型为4个输入层和1个输出层。隐含层的神经元个数会直接干扰预测模型的精确度,神经元数目过多或过少都导致预测可信度下降,因此可根据计算公式⑩进一步确定神经元数量。公式⑩中l为隐含层神经元数量,k为输入层神经元数量,b是常数取值范围为(1≤b≤10),在本次研究中d=4,k=3;所以,初步确定神经元为4-14个。根据训练模型所得,最佳确定隐含层的神经元个数为11(见图2)。由此可得BP神经网络结构为4-11-1。

图2 隐含层节点数

(1)构建网络

net=newf f(inputn,outputn,hiddennum,{’tansig’,’purelin’},’trainlm’);传递函数使用tansig,purelin,采用梯度下降算法训练。

(2)训练网络

训练网络参数设置配置如下:net.trainParam.ep- ochs=1000;net.trainParam.lr=0.1;net.trainParam.goal=0.00001;net.trainParam.show=25;net.trainParam.mc=0.01;net.trainParam.min_grad=1e-6;net.trainParam.max_fail=6;net.trainParam.showWindow=0;将中国体育彩票1995-2020年训练序列数据导入模型进行训练,结果如图3所示。

图3 训练结果

由图4可知,模型的训练数据、验证数据以及测试数据在epoch 1前迅速减小且隐含层节点数为11时的均方误差为1 271.1 516,在epoch=1时达到最小值0.073 677,故最佳的隐含层节点数为11时BP神经网络训练的结果最佳。

图4 均方误差变化

图5可以反映出对数据训练过程中下降梯度和步长的大致变化。根据图5显示梯度和步长呈递减趋势,表明数据随着模拟次数的增加,总体误差趋于一个稳定的区间。

图5 梯度和步长变化

2 预测分析与讨论

2.1 预测分析

由图6训练拟合效果图所示,运算的BP神经网络对数据拟合效果较好,其中体育彩票训练数据拟合值R=0.949 31,验证数据、测试数据及所有数据的拟合值分别为R=0.999 36、R=0.990 46、R=0.967 71,均大于0.94,模拟拟合效果好,可用于预测1995-2020年体育彩票的销售金额。随着我国经济发展、移动终端设备的普及、体育彩票购买者的增多,近10年的体育彩票销售金额已增长数十倍,近26年来体育彩票年销售金额波动幅度较大,为使本次研究更加客观、精确以及更具借鉴意义,本次预测只截取2008-2020年部分预测数据,运行得到预测结果如表2所示。

图6 拟合效果

表2 2008-2020年体育彩票销售金额预测结果

结合表2与图7发现,整体预测与拟合效果较好。当无超大型体育赛事或其他具有影响力的突发事件时预测误差均在10%以内,说明本次构建的预测模型精确性、可靠性较高。但出现世界级等类型的超级体育赛事时预测会出现较大偏差[9],如2014年与2018年世界杯,2014年巴西世界杯举办期间6月与7月体育彩票销售金额分别为192.4亿元和197.78亿元,占全年销售总额的22.21%;2018年俄罗斯世界杯举办期间6月与7月体育彩票销售金额分别为395.48亿元和355.32亿元,占全年销售总额的26.17%,故超大型体育赛事会对我国体育彩票销售产生巨大影响。值得注意的是,在2020年初,我国因受新冠肺炎疫情影响,全国的体育彩票线下销售站点暂停服务,导致二月份体育彩票销售额仅0.01亿元,且受国内外众多大型赛事取消、停办或延期举行等多因素影响,导致第一季度体育彩票累计销售金额仅196.54亿元。由于国内防控良好,各类体育赛事逐渐恢复,该年度体育彩票销售金额仍有1 894.63亿元。根据BP神经网络预测估计,2020年体育彩票销售金额应达2 044.84亿元左右,我国体育彩票行业受新冠肺炎疫情的冲击损失高达两百亿元。

图7 2008-2023年中国体育彩票销售拟合及预测

在原有预测基础上,本次研究还对2021-2023年我国体育彩票销售金额进行了预测,预测结果分别为2 313.99亿元、2 921.33亿元、2 218.77亿元,随着疫苗注射、国内外体育赛事陆续开展以及全球经济复苏,BP神经网络预测值符合未来销售金额走向,随着2022年卡塔尔世界杯的举行我国体育彩票的销售预计会再创新高,极有可能突破3 000亿大关。

2.2 讨论

(1)根据历年销售数据可以直观地看出,我国体育彩票自1995年发行以来发展迅速,未来还将保持一定增速持续发展。我国综合实力的不断上升、国民人均可支配收入的不断增加,以及受教育水平提高使得我国体育人口逐年增加,从而促进了体育竞赛与体育表演行业的发展[10-11],改变了我国居民的消费习惯,丰富了我国产业结构,体育彩票行业的消费势必会随着经济产值的增加而增加。体育彩票公益金为我国乡镇社区体育设施的建设、地方城市综合型体育俱乐部的组建、地方城市公共团体体育活动的举办、高水平运动员的选材与培养、体育团体的体育活动与国际体育赛事的举办、优秀教练员的培养、补充社会保障金、扶贫事业、教育助学、养老服务、医疗救助等事业的发展提供了充足的经济支持,形成了体育彩票产业与社会稳定、经济多元发展相辅相成、相互促进的良好局面。当前,全球正处于经济恢复阶段,体育彩票行业对经济发展具有外部消费的拉动与心理因素的内在驱动双重作用,可以更好地促进人们对体育彩票的消费。体育彩票在促进产业创新、提高劳动生产率、扩大产业规模、加快经济发展等方面也有众多积极影响。

(2)受超大型体育赛事或其他大型突发事件影响,模型的预测精度会明显下降,若能结合相关外界因素通过BP神经网络非线性回归预测进行综合判断结果则会更优。此外,若通过遗传算法进一步优化,预测结果可能也会更加稳定。总而言之,本次研究通过Matlab软件构建BP神经网络模型,利用1995-2020年中国体育彩票销售累加金额为数据,以2008-2020年真实值为参照,误差均在合理范围内,发现该模型对中国体育彩票销售金额的短期预测具有一定可靠性。

3 结语

2020年受新冠肺炎疫情冲击,体育彩票销售金额相比于BP神经网络模型预测估计值少了150.21亿元,在合理误差范围内大型突发公共卫生事件对我国体育彩票行业造成的损失超过100亿元。

通过BP神经网络对2021-2023年进行建模预测,中国体育彩票年度销售金额未来3年的可能结果分别为2 313.99亿元、2 921.33亿元和2 218.77亿元,随着2022年卡塔尔世界杯的举行,我国体育彩票销售金额可能进一步创历史新高。

猜你喜欢
体育彩票体育赛事神经网络
基于神经网络的船舶电力系统故障诊断方法
基于人工智能LSTM循环神经网络的学习成绩预测
基于“三次售卖理论”我国体育赛事营销模式研究
MIV-PSO-BP神经网络用户热负荷预测
体育赛事项目管理对体育赛事形象及其管理的影响
中国体育彩票
中国体育彩票
2022年冬奥会对中国体育赛事转播的影响
桂林市体育彩票消费者消费行为分析与探究
三次样条和二次删除相辅助的WASD神经网络与日本人口预测