陈娥祥
(福州工商学院,福建 福州 350715)
随着大数据时代的到来,海量数据高效分析成为了重点与难点。而大数据技术在数据分析中的应用是时代发展的必然趋势,大数据技术借助计算机计算功能,对大量数据信息进行分析、计算、总结[1],在整个过程中突出了大数据技术全面性、系统化、范围广、数据多等特点,揭示信息间有着密切的联系,因而研究价值较高。大数据分析能够帮助各行各业预测数据,了解市场动态变化。目前市场体系日益完善,对于大数据技术的数据分析工作提出了更高要求,也使得大数据技术在市场数据整合方面的优势更加突出。另外,大数据技术的运行方式、价值体现较为特殊,大数据可供政策相关部门作为宏观调控的重要参考依据。政府部门借助大数据技术能够对当前社会发展、市场、行业问题、矛盾进行分析,收集、整理、归纳群众意见,进而改进策略,制定具有较强操作性的发展策略。
电子商务是企业和利益相关方借助网络平台完成交易活动的形式,主要以网络平台作为交易的渠道,买方、卖方不需要面谈交流便能够将整个交易过程完成。此方式操作简单,而且效率高。节约买方、卖方时间,无须投入太多精力便能够达成双方意愿,而且信息传递速度快,管理方便快捷。此经营模式打破了时间、空间的局限性,为企业发展带来了较大的机遇,加快了我国经济全球化发展的步伐[2]。借助电子商务经营模式,企业在资金、技术手段、人力成本方面都能得到有效改善,因而可大幅度提高企业的市场竞争力。
此次研究的数据来源于京东平台贵州茶叶销售价格、品种、销量、店铺名称等相关数据。数据获取具体流程如下:利用Python爬虫第三方库selenium自动获取数据,采用的是webdriver工具,抓取数据时使用的是element_by_xpath或者css_selector,处理过程划分为了六步:一是创建.py文件,并且将其导入至第三方库selenium、pandas、time、csv、requests、json、lxml、urllib中;二是获取URL,///;三是设置代码自动点击登录按钮,采用扫码登录的方法,在程序处于5 s休眠状态下进行扫码;四是登录以后通过完成内容搜索操作;五是构建空白词典,其中包含留言时间、内容、标题;六是抓取数据,点击F12以后便会进入到开发者选项中,通过所需的数据源,设置代码时将滚动条移至最后,以便于能够将全部数据获取。此次研究在京东平台一共获取到了5 800条贵州茶叶销售的相关数据,下一步操作前要预处理获取到的数据,其中涉及残缺值、相似值处理等,将数据处理好后以表格的形式保存至csv文件中。
茶叶品种相关数据的分析中使用的是“Wordcloud词云”计算方法,筛选处理目前消费者比较喜欢的贵州茶叶品种。“Wordcloud词云”计算方法主要针对网络文本中出现的关键词的频率,进而构建了“关键词云层”或者“关键词渲染”,将大量文本信息过滤,浏览者在较短时间内便可以便捷地获取数据分析结果,大幅节约信息成本。此次采用词云图的形式呈现贵州茶叶产品名称,给消费者呈现出强烈的视觉冲击,结合获取到的文本特殊性对新停用词表进行设置,筛选以及剔除影响研究结果的文本影响因子,比如“口粮茶”“官方”“京东”等文本影响因子,在将文本处理好以后,借助jieba分词第三方库处理分词,进而构成可视化的图谱。如图1所示。
图1 贵州茶叶品种词云图
在“Wordcloud词云图”中云雾嫩芽、贵州绿茶、明前春茶、都匀毛尖等在京东平台中都是比较受消费者青睐的贵州茶叶品种。结合词云图可了解到贵州绿茶要比红茶更受欢迎,而且很多消费者选择的都是明前新茶。以下是关于贵州茶叶价格数据的分析,具体见图2所示。
图2 贵州茶叶价格区间图
从图2可以看出,0~100元茶叶占比达到了48%,将近占据了一半市场份额;100~200元占比28%;200~500元以上的高端茶叶占比较小,仅为24%,说明高端市场有待进一步开发,发展空间较大。尤其是最近几年,我国经济稳定增长,人民群众消费水平进一步提升,对于茶叶的需求、要求也在不断提升,低端市场向高端转变是发展趋势,以低端茶叶吸引消费者,将目标客户中的回头客以及潜在客户转变为高端客户是贵州茶叶生产企业需要关注的重点,通过大数据技术分析便能够直观地呈现贵州茶叶销售情况,可帮助茶业企业精准调整营销策略。
大数据时代数据发挥的作用以及价值是不容忽视的。对现有的数据进行分析,能够准确预测未来的发展趋势,捕捉到隐藏在数据背后的重要信息[3]。很多贵州茶叶企业与时俱进,在很多电子商务平台都投入了自己的茶叶产品,所以这也在很大程度上积累了很多消费者的消费数据,可通过运用大数据技术分析消费数据,将不同需求、类型的消费者分组,进而实施个性化营销。通过客户分类,茶叶企业可为不同消费者提供有针对性的、差异化服务,及时发现市场变化、消费者消费行为的改变,进而做出相应调整。茶叶企业还可借助大数据后台内容,整理及分析消费者行为,结合消费者消费时间、时长、购买频率等全面了解客户需求,在消费者购买产品以后,定期回访,调查消费者满意度,通过问卷形式收集需求。将消费者在线反馈相关数据与企业客户管理数据库对接,通过整理分析,为准确做出决策提供数据依据。对消费者反馈数据进行分析能够增强其黏性,提高满意度,进而将其转变为忠诚客户,形成持续消费行为,从而促进企业经济效益进一步提升。
虽然当前电子商务企业能够利用大数据技术对海量的数据进行分析,但是由于正处于数据分析摸索阶段,对于大数据技术的重要功能以及价值的发挥还未实现深入挖掘[4]。在互联网高速发展的当今社会,人们的消费理念发生了变化,电子商务平台成为他们购物的主要渠道,必然会产生大量的数据,而电子商务企业在运用大数据技术时未能对这些数据进行有效的归纳与整理,使其优势难以更好地发挥,反而使得消费信息、数据混乱无章,很难根据实际需求将这些数据充分利用。
为了能够促进电子商务企业更好地发展,基于客户需求,将服务质量大幅度提升,就应该对收集整理的消费者信息、喜好等数据进行分析,确保对消费者实际需求有更好的了解及掌握,进而为其提供有针对性的、个性化的服务。但是网络环境是虚拟且复杂的,电子商务企业在借助大数据技术对数据进行分析时,必然会涉及企业数据,而有些隐秘数据信息对于企业而言是非常重要的。在数据分析过程中,如果企业未将安全防护措施做到位,会导致数据安全隐患风险的发生,数据信息安全性难以得到保障,极易被非法分子窃取。当出现此情况以后,电子商务企业会面临着经营风险、生存危机、经济损失。
大数据技术在电子商务数据分析中的优势是有目共睹的,要想做到灵活运用,电子商务企业应该强化数据化意识,站在决策以及管理运行层面构建大数据平台[5]。同时还应该将大数据技术置于发展战略层面,意识到其重要价值,强化内部数据整合能力,深层次挖掘数据信息,根据目前企业发展需求,结合市场发展趋势,在运营管理中高效落实大数据技术的运用。电子商务企业可借助大数据构建相应系统,并以此为媒介,使整个电子商务行业互融互通,数据信息有效共享,促进高质量数据深度整合。在对这些数据进行分析的过程中,要快速提取关键且真实的消费者信息,使电子商务企业在运行中能够结合收集的信息快速做出经营决策,及时调整发展战略。
电子商务企业可通过构建安全防护屏障的形式,全面保障大数据、企业内部数据信息的安全性。为达到更好的效果,电子商务企业要构建相应的安全数据网,特别是一些重要机密性文件数据要采用加密形式,全方位把控数据安全,大幅度提高安全防护水平。电子商务各企业间要形成良好的沟通氛围,在强化互动的同时,共同深层次研究以及探索大数据技术相关知识,相互促进、互相借鉴、共同提升,确保大数据技术优势能够充分发挥。电子商务企业也可以信息技术为基础,构建预警及监督系统,实时监控消费者信息,结合数据网动态变化,对数据信息安全重要影响因素进行分析。如果发现数据网出现异常,预警系统会自动提示,发出报警信号,开启安全防护系统,将非法侵入者拦截,提高数据信息安全性。
大数据时代最为典型的特点便是采用大数据技术对电子商务信息的快速收集、整理、处理,这也在很大程度上为市场精准化营销奠定了良好的基础,确保消费者能够享受到多元化服务[6]。采用大数据技术可对消费者消费心理、行为等数据进行获取,进而使电子商务企业能够准确捕捉到其中有价值的数据信息。在分析过程中要分类管理消费者,推进精准化营销,确保产品推出的针对性更强,使电子商务企业经营水准、经济效益大幅度提升。
将大数据技术应用于电子商务数据分析中,不仅为行业发展提供了强有力的支持,而且推进了企业数字化发展,使企业能紧跟时代步伐,动态了解市场变化和消费者消费倾向,以此为依据及时调整经营模式。电子商务的发展对于企业而言是非常好的机遇,但是往往机遇与挑战是共存的,这就需要通过电子商务平台经营的各个主体紧紧抓住这个机遇,充分利用大数据技术优势,实现数据分析精准化、高效化。■