乔富强 天津中德应用技术大学
数据挖掘在育婴市场中的应用分析
乔富强 天津中德应用技术大学
随着市场经济的不断深入,育婴市场在我国各个城市中所占的比例越来越高,同时还面临着潜在的网络商店的威胁,我国企业的竞争越来越激烈,使得我国企业间的利润空间不断下降。为了提高市场竞争力,让企业获得更好的发展前景,就需要对育婴市场的运营各个环节做优化处理。本文将探讨数据挖掘在育婴市场中的应用分析。
数据挖掘 育婴市场 数据预测
当前育婴市场的运营模式主要还是从采购到运输、管理、营销和服务等进行运转的。而在这运转过程中就会产生大量的各类数据,对这些数据的分析和利用,将会是企业最大的宝贵财富。数据库系统能快速的实现对数据的录入、查询和统计等功能,但是要对这些数据不能实现关联,根本就不能通过现有的数据预测企业未来的发展方向。因此就需要对数据里的关联规则算法做分析研究,以构建起关联规则算法模型,可以说有了数据挖掘技术,就可以从大量数据中提取出潜在的、有价值的知识,实现数据应用于育婴市场。
数据挖掘又叫做数据库中的知识发现,是与计算机相关的学科,包括人工智能、决策数算法、机器学习、数据库知识、神经计算与统计分析等各类学科领域和方法的相互交叉学科。其定义就是指从海量数据里发现数据之间的联系和规则,获取事先并不知道,潜在的知识,从而提取有用的信息,其目的就是为数据库理解和应用提供自动化、智能化的手段。关联规则挖掘是数据挖掘过程中所能挖掘的一类重要的模式或知识,也是数据挖掘研究的一个重要分支。可以用来寻求事物之间在特定环境条件下存在的某种积极和消极的相关性联系。也就是说首先要找到所有支持度大于最小支持度的频繁项集,也就是频集。其次是使用第一步找到的频集产生期望的规则。如在药店购买了外套的,75%的人还买内衣,这样的关联规则很有价值,育婴市场管理人员可以根据这些规则更好地进行规划,把外套和内衣这样的商品摆放在一起,就能够提高销售量。
关联规则挖掘算法有很多类型,包括层次算法、搜索算法、抽样算法和数据集划算法等。这些算法存在两个问题就是减小了IO操作以及降低需要计算支持率项目集数量,对于数据挖掘的效率影响十分大。Apriori算法作为一种关联规则经典算法,是一种基于两阶段频集思想的算法,假设某一项不是频度集,它的所有超集就不会是频度集。反之就是任一频度集的所有子集一定都是频度集。该算法主要是先找出全部支持度都超过了最小支持度的项集,然后把这些项集成为频集,最后再从频集中去找出期望的规则。
算法流程:
在零售业合理的商品布局是提高商品销售的一种手段,合理的布局可以刺激顾客的购买冲动,还可以节约顾客的购物时间,这对提高育婴店的服务水平与利润都有积极的促进效果。通过数据挖掘能够分析出以往顾客购买行为,包括购买数据、选择路线、购买喜好、购买习惯、畅销商品的类别、生产企业等数据,通过对顾客购买模式和趋势的研究,可以改进服务质量,建立起最佳的货架布局,从而提高货品销量比率,减少商业成本。下面是对某育婴店的顾客购买商品的事务数据库中的数据分析。数据挖掘过程如下:
首先计算出表中每类商品的关联规则支持度,根据定义得出:
其次根据设定的最小支持度阀值,将大于或等于最小支持度阀值的商品挑选出来,设最小支持度阀值为0.3,可挑选出商品外套、内衣、鞋子与奶粉。
为了直观明了,把其余的数据采取X=>Y的信任度表示,
再次依据设置的最小信任度阀值,设最小信任度阀值为0.6,得到下面规则:
最后,依据上面分析得到的规则,可以得到在育婴店的消费者的购买习惯与喜好,私人老板就可以采取这样的措施,一是调整货架,将商品外套、鞋子放在一起,便于消费者选购,甚至可考虑将商品外套、鞋子和奶粉;二是在厂库储存进货方面可以将关联商品统购统存;三是商品的促销广告可以进行相关联印发,可以增加商品的支持度与信任度;四是在网上进行商品销售时把关联商品放在同一页面或增加关联商品间的链接。在采取以上措施后,育婴店可以扩大销售额,提高了服务水平,顾客可以扩大交叉购买,提高其消费。
[1]一种基于组合方式改进的频繁项集挖掘算法[J].计算机系统应用,2010,19(68-71
[2]基于数据挖掘的商业银行客户关系管理研究[D].牛胜利.财政部财政科学研究所2013
[3]大数据下第三方物流企业客户关系管理研究[D].尤翠翠.沈阳工业大学2015
[4]数据挖掘在高职院校就业信息管理中的应用研究[D].黄荣喜.广西大学2015
[5]基于数据挖掘的高校图书馆差异化阅读推广系统开发[D].胡杰.湖南大学2015