数据挖掘技术在经济预测中应用

2018-07-26 03:53刘潭飞徐小艳
环球市场信息导报 2018年18期
关键词:百度数据挖掘预测

刘潭飞 徐小艳

本文着眼于数据挖掘技术在经济预测中的应用问题展开探讨,笔者结合个人在这方面的一些实践工作经验提出几点思考和见解,希望借阅者能够积极提出改进意见。

大时代下的数据挖掘技术作为一门新的交叉学科,它的发展必定会将带来诸多领域的变革。文中对于数据挖掘的实际应用实例做了具体的分析和介绍,希望对在研究数据挖掘技术的发展的工作人员能起到一定的借鉴作用。

一、体育赛事预测

在世界杯进行期间,谷歌、百度和微软以及高盛等这些公司陆续推出了比赛结果的预测平台。而这当中百度的预测结果则更亮眼一些,全程预测64场比赛,预测准确率达到67%,而在进入淘汰赛以后其预测准确率达到了94%。目前的互联网公司具体取代套鱼保罗试水赛事的预测同时也意味着在未来体育赛事会全面的被大数据预测所掌控。

Google的世界杯预测是建立于OptaSports海量的赛事数据的基础上来进一步构建它最终的预测模型。百度在作为过去的5年以内世界范围内987支球队(其中包含国家队和俱乐部队)在内的3.7万场的比赛数据,与此同时,它和中国的彩票网站乐彩网以及欧洲必发指数的数据供应商Spdex展开合作,将博彩市场的预测数据进行导入,继而建立了能够囊括199972名球员以及高达1.2亿条数据的预测模型,并且还在这个基础上进行结果预测。

我们以互联网公司的成功经验看来,只要是有体育赛事的历史数据存在,以及同时和指数公司展开合作,那么就可以展开进行其它赛事的合作预测,像欧冠和NBA赛事等等。

二、股票市场预测

去年的时候,英国华威商学院及美国波士顿大学的物理系相关研究发现,有用户在通过对谷歌搜索金融的关键词和金融市场的走向,其相对应的投资战略的具体收益达到326%。在此之前,又有一些专家曾尝试着通过Twitter博文情绪来进行股市的波动预测。

那么从理论方面来说,股市的预测更加适合美国。而中国的股票市场则没有办法做到双向盈利,也只有在股票上涨的时候才可以盈利,那么就会吸引部分游资利用信息不对称等这些情况来进行人为的股票市场规律的改变,所以,中国的股市相对来说没有较之稳定的规律就预测起来比较困难了,那么与此同时,我们在对一些结果产生决定性影响的变量数据则基本就没有办法被监控进去。

三、市场物价预测

对于CPI表征已经发生的关于物价的浮动情况,统计局的数据并不具备权威性。而相反的大数据则可能能够帮助人们深入的了解未来物价的具体走向,以及提前通知通货膨胀及经济危机。其中最为典型的例子应该就是马云在通过阿里B2B大数据提前知晓亚洲的金融危机,那么实际上这也是阿里数据团队的功劳所在。

事实上,单个的商品价格预测起来更容易一些,特别是机票一类这样的标准化产品,以及去哪儿提供的“机票日历”也是级别的预测,告知客户在几个月以后机票价格的浮动变化和大概位置。此外对于商品的生产和渠道成本以及大概的毛利处于充分竞争的市场来说是相对比较稳定的,而和价格相关的变量又相对来说比较固定,那么商品的供需关系在电子商务平台就可以进行实时的监控,所以其价格又可以进行预测,且根据预测的结果又可以提供其具体购买的时间建议,亦或是指导商家作动态的价格调整及营销活动,为的就是能够达到利益的最大化。

四、用户行为预测

在用户搜索行为和浏览行为以及评论历史及个人资料等数据的基础上,作为互联网业务来说可以洞察消费者在这方面的整体需求,进一步有针对性的进行产品的生产和改进以及营销。而像《纸牌屋》选择的基本都是演员及剧情,并根据百度用户的喜好来进行比较精准的广告营销及阿里依据天猫用户的特征将生产线定制产品承包下来,亚马逊则预测用户的点击行为进行提前发货.都是收益于互联网用户的行为预测。

受益于传感器技术以及物联网的实际发展,在线下的一些用户的行為正处于酝酿时段。而一些免费的商用WIFI和ibeacon技术以及摄像头影像监控和室内的定位技术、NFC的传感器网络和排队叫号系统等,都可以有效的探知用户在线下的移动及停留以及出行规律等出行数据,从而展开比较精准的营销或者是产品的定制。

五、人体健康预测

中医能够通过望闻问切几种手段来发现一些隐藏在人体内部的慢性疾病,甚至于看人体体制分析就可以明确的诊断出一个人在将来有可能会出现什么样的症状。而人体体征的变化是具备一定的规律性的,在一些慢性病发生之前人体都会有比较持续性的异常症状。因此,从理论上来说,假如大数据将这些异常情况有效掌握了,那么就可以展开慢性的疾病预测。

依据部分智能硬件,往往在慢性病的大数据预测会变成可能。那么可穿戴设备以及智能健康设备都能够帮助人们收集人体的相关健康网络数据,同时也包括心率和体重以及血脂和血糖以及运动量及睡眠量等状况的预测。假如这些数据都足以能够准备的精准且较为全面,同时又可以形成算法的具体慢性病的预测模式,也许在未来你自己的设备就能提醒你在你的身体罹患某一种慢性病的实际风险。譬如像KickStarter上的MySpiroo就可以帮助哮喘病人收集他们的吐气数据同时指导医生对其未来的病情趋势做进一步的诊断。而对于急性病来说比较难于预测,其突变性以及随机性促使其比较难于预测。

六、疾病疫情预测

在人们的搜索情况和购物行为可以充分预测比较大面积的疫情爆发的可能性,而最为经典的当属于“流感预测”就属于此类。假如来自于某一区域的流感或者是板蓝根搜索需求逐渐增多,那么也就自然而然地可以有效推测此处应该有流感出没。

在世界杯以及高考和景点城市的预测以后,百度在最近推出了疾病预测产品。在目前来说则又可以就流感和肝炎以及肺结核或者性病这四种类型的病症,针对全国范围内大部分地区的活跃度和趋势图等实际情况,展开全面化的监控。那么在未来,百度疾病的预测监控疾病种类即将从目前的4种逐渐扩展成为30余种,并且覆盖更多比较常见的病症及流行病种。而用户则可以依据当地预测的结果来展开比较有针对性的预防。

通过以上几种大数据技术在经济预测中的实例应用,我们做了简单的分析和了解,也借此说明,大数据技术的应用范畴当即比较广泛,即便如此,其也丞待更进一步的加强。

猜你喜欢
百度数据挖掘预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
Robust adaptive UKF based on SVR for inertial based integrated navigation
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
百度医生
百度“放卫星”,有没有可能?
基于GPGPU的离散数据挖掘研究