张凤玲
(北京物资学院 信息学院,北京 101149)
基于大数据的户外运动产业平台构建
张凤玲
(北京物资学院 信息学院,北京 101149)
在回顾大数据技术在体育产业中应用的相关研究的基础上,设计了大数据技术的户外运动产业平台架构,讨论了自建和与第三方合作的户外运动产业平台运营模式。户外运动产业数据平台建成后,应用大数据分析可以实现如下预期效果:一是可对省级登山协会和户外运动俱乐部开放,为其提供指导性的建议;二是为相关的体育品牌提供未来的产品开发建议,实现精准营销;三是可建立户外运动救援精准定位系统,为应急救援提供技术支持。
户外运动;大数据;产业平台;体育大数据;自建模式;数据挖掘;模式评估
目前,我国户外运动市场具有高成长性的主要特征,并且形成了专业小众化与平民大众化并行的格局。但如何利用大数据技术来搜集、整理、分析由户外运动产生的数据成了我们亟待解决的问题。
从信息科学的角度来说,国际数据公司(IDC)把大数据的特征概括为4个V,即Volume(体量浩大)、Variety(模态繁多)、Velocity(生成快速)和Value(价值巨大但密度很低)[1]。恩伯格(Schonberger)等归纳出大数据的三大特征,即全体性、相关性和混杂性[2]。在很早之前IBM就确立了体育大数据发展的方向,2000年悉尼奥运会上,它就已经为奥运会的赛事活动建立了IT系统,也就是那时起开启了体育赛事大数据挖掘的序幕[3]。
崔久剑(2015)认为,将体育产业发展与大数据进行融合,利用大数据的分析技术,能够为我国体育创造更大的价值[4]。刘奇、贺鑫森(2015)提出,我们需要通过竞技体育大数据平台的建立来顺应该时代下竞技体育内外界限不清的发展趋势;同时,也应该通过建立经济体育大数据的联合机制来顺应该时代下经济体育系统运行方式的协同发展趋势;最后,也应该通过培养竞技体育大数据人才队伍来顺应该时代下竞技体育系统主体之间合作方式多元化趋向[5]。王奇、颜小燕(2016)认为,应当鼓励大数据在竞技体育的选材、训练以及比赛中的应用,同时理论依据的建立也要做到具有前瞻性;构建顺应大数据发展趋势的体育信息收集系统,同时也应该把该系统应用到体育的实践中来;要用于打破传统体育领域研究的路径和方向,要努力做到从“计量范式”向“计算范式”的跨越;如今我国体育路径的正确选择就是要推进大数据和创新研究的协同发展和研究,这一点我们应该努力做到,与此同时也要加强创新驱动、提高信息安全的意识[6]。徐赟、张辉(2012)认为,数据挖掘要在比赛技战术分析、国民体质监测、运动监控数据等方面充分发挥其潜在的价值,目前仍然有大量的研究工作亟需我们去开展。主要有以下三个方面:(1)建立体育大数据的平台;(2)挖掘工具的共享和通用;(3)与其他技术的交叉和融合[7]。雷辉等人(2015)阐述了体育数据可视分析的基本思路:以统计学角度、移动和集群角度、特征检测的角度等为基础的分析;并展望了未来的发展方向[9]。
研究发现,当前的研究资料主要偏重于简单的理论分析,而对于体育相关领域数据库的建立和应用则相对较少,这也造成了结果片面或出现偏差。但是值得肯定的是,国内一些专家和学者已经开始把数据挖掘技术引入到体育项目中,虽然目前的研究还不够深入,但是这对于我们日后研究体育数据挖掘,真正把数据挖掘技术利用到体育技战术制定和体育发展决策,推进数据挖掘技术在体育领域的发展,具有重要意义[8]。上述研究从大数据特征、体育产业大数据挖掘的价值、大数据分析路径选择以及应用实践等方面进行了研究探讨,对基于大数据技术的户外运动产业平台架构研究提供了很好的启示,不过目前有关户外运动大数据的相关研究还不多见,本研究具有重要的理论和应用价值。
由于我国人多地广,且户外运动不仅涉及的项目多,且按海陆空区域划分,可分为陆地户外运动、滨海户外运动和低空户外运动。仅陆地户外运动按海拔又可分为高山户外运动、低海拔户外运动、平原户外运动,按季节又可分为冰雪户外运动,这些户外运动项目归口于国家体育总局下属的中国登山协会管辖。但目前大部分有资质的户外运动项目都依附于旅游景区,旅游景区又属于旅游局管理,户外运动属于体育局管理,而像滑翔伞低空户外运动又涉及航空委员会管理,导致隶属管理部门多,协调管理难度大,数据量大且分散、而且发生频率频繁,一般的统计方法速度慢,难以满足登山协会等管理部门动态掌握户外运动市场、及时制定相关政策措施、及时引导各地协会及民间组织开展户外运动,保障户外运动爱好者的需求。虽然国内外学者已经开始尝试大数据技术在体育产业中的应用研究,且部分研究成果已应用到体育赛事之中,但在户外运动领域的研究较为鲜见。因此,基于大数据技术构建户外运动产业平台(见图1),开展户外行业的未来项目发展状况的预测,为登山中心相应的数据搭建等制定方案,并提供实际可行的政策建议和相关的数据支撑,及时掌握户外运动爱好者偏好,保障其安全地从事户外运动,使登山运动管理中心的各项工作迈入整个行业的前沿,对促进我国户外运动产业发展,具有重要的理论意义和现实意义。
图1 大数据的户外运动产业平台概念模型
一手数据的搜集,包括来自国家旅游局的景区统计数据,航空协会已批准开放可从事滑翔伞、滑翔机、热气球等低空户外运动的区域数据、已经领取滑翔伞、滑翔机、热气球等驾驶证书的信息数据,以及国家体育局水上运动管理中心水上运动数据,纺织协会的户外用品生产厂商、供应商统计数据,中国登山协会下属的各地登山协会、户外俱乐部上报的数据,再有就是为摸清户外运动发展现状而开展抽样调查获得的数据。同时与各地的“人口数据库”、“法人数据库”、“空间地理数据库”、“宏观经济数据库”、“文化资源数据库”形成资源共享池,产生事半功倍的效果。
国外的户外运动二手数据资料收集途径越来越丰富,如成立于1968年的国际市民体育联盟,经历了近半个世纪的发展,其组织体系、步道标准运行机制以及认证体系已经日趋成熟和完善,很多徒步方面的数据可以从中获取。美国户外基金会每年都会开展户外运动参与情况调查,日本每年也发布登山运动调查报告,这些报告对于我们及时了解国外户外运动发展现状,户外运动设施标准和认证体系有重要的参考价值。国内的二手数据资料可从绿野户外网、户外驴友论坛、8264.com户外资料网等户外运动网站,以及大型论坛及相关的微信公众号、微博、淘宝等电商平台等渠道组织的相关活动参与人数、户外运动品牌供应商上获得,构建户外运动资料库。
登山运动管理中心在建立数据库时,需收集海量的数据量。目前世界上主流的处理海量数据的是Hadoop技术,该技术是由Apache基金会开发的,同时也包括那些基于Apache基金开发的技术。用户可以开发分布式程序,特殊的是这种开发的过程并不需要对分布式底层详细的情况有所了解。而高速的运算以及存储则需要通过对集群威力的充分使用来实现。这种软件框架可以实现对大量数据进行分布式的处理,同时数据的处理也是非常具有时效性、可靠性和可伸缩性的。Hadoop是开源的,项目的软件成本因此会大大降低。
登山中心的数据中心平台将收集到海量的登山爱好者数据,这些数据中会涉及到众多的个人隐私和一定的商业机密,需要把数据安全的重要性考虑进来。大数据安全是个很宽泛的领域,可以包括:大数据系统的安全,数据本身的安全(加密)以及隐私保护,大数据应用带来的安全和隐私问题,以及大数据技术应用于安全领域。
登山运动管理中心的大数据平台在获得大量的客户数据后,只有对这些数据进行分析,才能让数据产生价值。数据挖掘技术是实现数据价值的手段和方法。这几年,各界人士也开始把注意力放在数据的挖掘上,主要是因为对于现在的研究领域来说,大量数据的广泛使用是十分必要的,有利于研究人员实现从数据到信息、知识的转换。数据挖掘伴随着信息技术的自然化而产生。我们可以这样理解,数据挖掘就是对大量的数据进行精炼、提取,或者说是对知识的提取和挖掘。数据库中知识发现过程如下图2所示,由以下几个步骤组成:第一,数据清理,旨在消除噪音或不一致数据;第二,数据集成,让多种数据源可以组合在一起;第三,数据选择,从数据库中提取与分析任务相关的数据;第四,数据变换,数据变换或统一成适合挖掘的形式;第五,数据挖掘,使用智能方法提取数据模式;第六,模式评估,根据某种兴趣度度量,识别提供知识的真正有趣的模式;第七,知识表示,使用可视化和知识表示技术,向用户提供挖掘的知识。
图2 基于数据挖掘技术的知识发现过程
由登山运动管理中心组建团队,团队中需包括系统架构师1名、网络维护人员3名、数据采集工程师5名、数据工程师10名、网络安全人员1名、运营工程师2名,远程进行数据采集及运营。
可以采用云计算(cloud computing)的方式来运营管理数据中心平台。这种方式以互联网相关服务的增添和应用以及交易支付的方式为基础。云计算的资源通常不是实实在在的,而是具有虚拟性的,此外也是具有动态易扩展性的,而这些资源一般都是由互联网提供的。通过云计算可以实现计算分布位置的转换,不再是分布在非本地计算机亦或是远程的服务器上面,而是可以分布在分布式的计算机上面,这是云计算的一大特点。源于登山运动管理中心数据中心的运行与互联网具有很大的相似性,为登山运动管理中心实现资源的应用提供了很大的可能性,也就可以针对其需求来进行计算机和存储系统的访问。
登山运动管理中心可采用PPP等方式,与户外运动品牌公司或户外运动网站联合共同建设户外运动产业平台,可对方案进行精准的需求分析,并对以后的平台底层设计的有效性及准确性奠定了基础,帮助行业规范的同时,解决数据采集与数据分析的问题。
登山运动管理中心前期可采用第二种方案进行初步的运行,对方案进行验证。若方案无问题,可与户外品牌公司、户外运动网站等共同联合开发本项目,在节约资金的同时,达到互利共赢的目标,共同建设户外运动大数据中心,对数据进行采集、分析与运营。
户外运动产业大数据平台建成后,登山协会将拥有国内最权威的户外运动数据,可对省级登山协会开放,并提供适当的行业预测,为登山户外运动项目的发展所用,对于今后登山协会的建设可提出指导性的权威建议。可为相关的体育品牌提供未来的产品建设建议,每年可收取一定的咨询费用,为其实现精准营销做好准备。可建立户外运动救援精准定位系统,为应急救援提供技术支持,打破户外运动不规范的局面。
[1] Gantz J,Reinsel D.Extracting value from chaos[R].IDC iview,2011:1-12.
[2] 维托克·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代:生活、工作和思维的变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.
[3] 赵楠.IBM:体育赛事背后的大数据机遇[N].第一财经日报,2013-09-26(C02).
[4] 崔久剑.大数据背景下体育产业发展策略分析[J].电子测试,2015(24):47-48.
[5] 刘奇,贺鑫森.大数据时代竞技体育系统顺应的发展策略[J].首都体育学院学报,2015(3):156-159.
[6] 王奇,颜小燕.大数据时代我国体育发展面临的机遇与挑战[J].体育科学,2016(1):75-80,89.
[7] 徐赟,张辉.数据挖掘在体育领域中的应用[J].武汉体育学院学报,2012(11):27-30.
[8] 赵新辉,沈雅雯,张建丰,等.数据挖掘技术在体育科学研究中应用现状评述[J].中州体育·少林与太极,2014(7):44-48,52.
[9] 雷辉,劳天溢,刘真,等.体育数据可视化综述[J].计算机辅助设计与图形学学报,2015(9):1605-1616.
OutdoorSportsIndustryPlatformConstructionBasedonData
ZHANG Fengling
(Information Dept., Beijing Material Inst., Beijing 101149, China)
Based on relative researches of data technology application in sports industry, the paper designs the outdoor sports industry platform based on data technology and discusses the establishment model of outdoor sports industry platform constructed by itself and the third party. The data analysis can help the platform provide references product exploration strategy for sports brand and technology assist for outdoor aid location system.
outdoor sport; data; industry platform; sports data; self establishment model; data exploration; model evaluation
国家社会科学基金项目(15BTY064),国家体育总局全民健身研究领域课题(2015B097)。
张凤玲(1964-),硕士,副教授,研究方向:统计应用研究。
G80-05
A
1672-268X(2017)06-0016-04
2017-09-25)