朱文斌 上海铁路局新上铁实业发展集团有限公司
铁路客站商业大数据的采集与应用
朱文斌 上海铁路局新上铁实业发展集团有限公司
随着铁路客运配套商业的高速发展,传统数据库技术已无法满足海量的客站商业数据处理运用的需求,客站商业大数据的管理和使用成为突出问题。如何通过大数据技术来采集、分析、处理和应用客站商业数据,及时掌握旅客消费倾向,动态调整客站业态布局,就变得尤为重要。
客站商业;大数据;数据处理技术
客站商业是铁路客运的重要组成部分,直接影响广大旅客出行的消费需求。因此必须准确掌握旅客出行需求,及时动态调整客站业态分布,在服务好旅客的同时也提升了企业的效益。近年来,由于新线新站的大量开发以及电子商务的迅速崛起,传统的技术手段已无法满足庞大的客站商业数据的处理需要,需要引入更先进的大数据处理技术,才能更好地从庞大的数据海中挖掘的更有价值的商业信息。
1.1名家揭开大数据序幕
2013年5月10日,阿里巴巴集团董事局主席马云在淘宝十周年晚会上,将卸任阿里集团CEO的职位,并在晚会上做卸任前的演讲,马云说,大家还没搞清PC时代的时候,移动互联网来了,还没搞清移动互联网的时候,大数据时代来了。
早在1980年,托夫勒在《第三次浪潮》中就提到过大数据。他说:“如果说IBM的主机拉开了信息化革命的大幕,那么大数据则是第三次浪潮的华彩乐章”。最早提出“大数据时代到来”的,是全球顶级管理咨询公司麦肯锡。麦肯锡宣称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”而真正把大数据推向公众视野的是牛津大学教授维克托,他潜心研究大数据10年,成为最早洞见大数据时代发展趋势的科学家之一,他的《大数据时代》专著是国际大数据研究先河之作。维克托思维的深邃之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,取而代之的是关注相关关系,只要知道“是什么”,而不需要知道“为什么”。这是对千百年来人类思维惯例的颠覆。
1.2大数据到底有多大
大数据到底有多大?互联网上一天产生的信息量有多少?据统计,每天有2 940亿封电子邮件发出,如果这些是纸质信件,在美国需要花2年时间来处理;每天有200万篇博客文章在网上发布,这些文章相当于美国《时代》杂志刊发770年的总量;每天有2.5亿张照片上传至社交网站Facebook,如果把它们都打印出来,摞在一起能有80个埃菲尔铁塔那么高;每天有86.4万h的视频被上传至视频网站YouTube,这相当于不间断播放视频98年。累积起来,互联网一天之内产生的信息总量,可以装满1.68亿张DVD光盘。 全球数据总量每18个月翻一番。据麦肯锡调查报告,美国15个主要行业中每家公司过去一年所产生的数据量,就超过了同期美国国会图书馆所存储的数据量。自从人类发明印刷术以来,以往一千多年来所有印刷材料相当于200 PB(1 PB=1 015 B),而2011年全球数据量就达到了1.8 ZB (1 ZB=1 021 B)。据IDC发布的2012年数字宇宙研究报告中预测,到2020年数字宇宙的规模为35 ZB。
1.3“大数据战略”——未来的新石油
从海量数据中“提纯”出有用的信息,这对网络架构和数据处理能力而言也是巨大的挑战。在经历了几年的批判、质疑、讨论、炒作之后,大数据终于迎来了属于它的时代。2010年7月,联合国发布了《大数据促发展:挑战与机遇》白皮书,指出大数据对于全世界是一个历史性的机遇。2012年3月22日,奥巴马政府宣布投资2亿美元拉动大数据相关产业发展,将“大数据战略”上升为国家战略。奥巴马政府甚至将大数据定义为“未来的新石油”。
1.4大数据的特点及所需的处理技术
大数据的特点是具有“4V”,或者说有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。如网络日志、视频、图片、地理位置信息等等。第三,价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。1 s定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。所以业界将其归纳为4个“V”--Volume(大量),Variety(多样),Value(价值),Velocity(高速)。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构。它的特色在于对海量数据的挖掘,但它必须依托云计算的分布式处理、分布式数据库、云存储或虚拟化技术。在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》一书中是这样描写的:大数据是指不用随机分析法(抽样调查)这样的捷径,而是采用所有数据的方法。
由于大数据的“4V”特点,普通的数据处理技术已无法满足,因此大数据处理需要新的数据库技术。EMC数据计算事业部大中国区总经理刘伟光指出“新型数据库应该具备如下特点:首先,应该采用支持大规模并行处理的分布式架构;其次,应该使用基于符合工业标准的开放硬件和系统平台,保证成本可控;第三,随着开源技术不断成熟,创新速度快,新型数据库平台应该易于与新的开源技术进行融合;第四,新的数据库平台应该可以实现与Hadoop(分布式处理的开源的软件框架)平台的无缝集成,实现跨结构化、半结构化、非结构化海量数据的混合分析能力。”大数据环境下,必须能对数据进行快速的捕获、管理、存储和分析。目前,大数据解决方案主要有Hadoop和NoSQL(Not Only SQL分布式数据管理系统)。
1.5大数据的价值
大数据时代已经来临,它将在众多领域掀起变革的巨浪。但我们要冷静的看到,大数据的核心在于为客户挖掘数据中蕴藏的价值,而不是软硬件的堆砌。大数据到底能给企业带来什么价值?本质上说,大数据本身没有太多价值,基于大数据的处理和分析才能为企业带来巨大的利益。大数据里面包含企业运营的各种信息,如果能对它们及时进行充分的整理和分析,可以迅速有效地帮助企业业务决策,响应客户需求,提升竞争力。因此,针对不同领域的大数据应用模式、商业模式研究将是大数据产业健康发展的关键。那么,铁路客站商业的大数据信息又能带来怎么样的机遇与挑战?
2.1客站商业大数据采集方式
客站商业大数据的研究与应用,首先要考虑的是数据采集的渠道与方式,这就需要依托手机APP来完成。通过手机移动客户端,采集旅客的去向、消费习惯和偏好等信息,经分析、处理、整合后,适当调整客站餐饮、食品、百货、服务业态比例,使商铺资源得到合理配比。利用O2O移动消费数据采集为旅客推广他们感兴趣的信息,并通过LBS技术的定位功能为旅客提供客站路线图、客站周边服务等内容,在服务旅客、方便旅客的同时,也为客站商铺带来了更多的商机。
所以,客站大数据的采集与先进的技术手段密不可分。传统商业运营模式的数据可通过POS机采集后经ERP系统整理分析后得出,此部分数据仅为线下已消费数据,并不能全面反映旅客真实全面的消费意向及需求,尤其是随着智能手机的普及和移动商务的兴起,线下消费模式不再是旅客消费的全部,O2O(online to offline)的模式已被越来越多的人群所接受。所谓O2O是指把线上的消费者带到线下去,即在线支付购买线下的产品和服务,且到线下实体店去享受服务。O2O和B2C(Business to Customer)相比,将“线上”“线下”的竞争关系转化为互助关系,是真正促进传统企业互联网化的有效途径。将务实的体验与服务融入电子商务中,这样既满足了消费者便捷、实惠的体验需求,又为商家增加了销量、提高了效益。尤其是随着近几年高铁新线新站开发接近尾声,客站商业营业面积增长基本已接近饱和,如要打破实体营业面积不再增加的瓶颈,势必要将O2O的移动商务模式引入客站商业中。
此外,除了传统的线下消费模式和新兴的线上消费线下体验外,客户关注与搜索的内容也是我们必须要掌握的重要数据信息,这部分数据将有利于我们把握潜在的消费客户群体,改进我们现有的商业布局,并将是我们引入新品牌和新业态的重要依据。例如我们可以大胆设想,在客站引入小型影院,尝试播放时间不长、热门的微电影,或是尝试引入棋牌室、桌游店、儿童游乐园等受大众欢迎的娱乐场所。总而言之,旅客所关注的地方就是商机所在,我们要改变旅客在铁路客站被动消费的习惯,逐步引导旅客养成主动消费、积极消费的良好势头,才能使客站高铁商业长期、健康、稳步地发展。
2.2客站商业大数据的分析与应用
完成了客站商业大数据的采集后,就需从大数据中挖掘出有意义的新的关联模式和趋势,以便提高管理者决策准确度。通过大数据分析,商家可通过O2O模式下的精准营销,向移动用户推送准确适用关联信息,提高客户粘性。顾客方面则可获取更全面、更实用的客站商家信息,并通过手机APP客站导航功能,找到准确的商铺行进路线,使一些偏远的商铺减少因旅客无法准确定位而造成的客源流失。
我们还能通过对客站商业大数据挖掘,发掘出更多决策依据。例如通过对客站租售比(固定租金/销售收入)的分析我们可以得出,商铺商家的经营压力和盈利空间,以此来提高或减免租金;通过对每年的当月客流与营业额的分析我们可以得出,每年的4月、5月(清明、五一小长假)和7月、8月(暑运)将迎来客流消费高峰,届时集团公司可提前做好应对准备,避免货源短缺情况发生;而每年春节期间,客流量虽高,但客流人均消费比例较低,可适当增加中低档消费产品,重点做好物业维保工作。通过客站人均消费(销售额/客流量)情况比较我们得出,合肥南站和宁波站两个大站客单价水平较低,虹桥站旅客消费水平最高,其中:宁波站全年平均客单价仅6.8元,合肥南站全年平均客单价7.18元,虹桥站全年平均客单价14.59元,通过数据挖掘我们可以分析出,宁波、合肥南两站的客流平均消费水平较低,不适宜引入高端商业品牌入驻,而虹桥站拥有巨大的客流且旅客具有较高的消费水平,可适当考虑引入部分高端品牌以满足旅客的购物需求。
除此之外,大数据挖掘还需建立相应客户档案,这有助于我们发掘重点目标客户。通过推广手机APP和办理客站会员卡(局管客站内可享9.8折优惠)等手段,记录的每个目标客户的消费信息,从中找出10%的VIP客户,并根据消费情况对VIP客户进行评级,VIP客户分级享受重点旅客待遇。例如:VIP1客户可通过VIP通道进站,VIP2客户在享有VIP1客户的权利外,进站还后可免费领取一瓶矿泉水和一份点心,VIP3客户在享用VIP1、VIP2的权利外,还享有行李免费交由服务人员搬运到站台的权利,以此类推,VIP等级越高的客户能享受的特殊待遇也越多,VIP客户等级评定的主要依据是目标客户在客站内最近一年内的累计消费额,VIP等级越高,站内消费时折扣就越多,享受的VIP服务项目就越多。这有利于刺激高端客户进行消费,提高高端客户的粘性,也缩小了客站商业营销范围,避免了对无效客户进行营销造成的资源浪费,降低了客站商业营销成本。
以上是客站大数据最浅显地采集与应用方式,随着客站商业软、硬件配套设施的增强与客站商业营销手段的多样化发展,大数据的信息量将越来越丰富,可挖掘出更多有价值的信息,使企业对未来趋势分析及领导作出决策提供更为详尽依据。
党的十八届五中全会明确提出,实施“互联网+”行动计划,发展分享经济,实施国家大数据战略,国务院随即发布《促进大数据发展行动纲要》,将大数据发展确立为国家战略。而就本企业层面来说,新上铁集团公司作为一个以客站商业为主营业务的公司,已在2013年提前将目光锁定在了客站商业大数据相关领域,组织专业人员成立了客站ERP数据分析部门并在2014年成立了电子商务O2O研究推进小组,相信在不久的将来,我们能通过商业大数据分析斩获更多有价值的信息,商业客站大数据还将拥有更远大的发展前景。
[1]维克托·迈尔-舍恩伯格,肯尼思·库克耶.《大数据时代》[M].浙江人民出版社.2012年12月,30-32.
责任编辑:万宝安
来稿日期:2016-05-13