电子商务中的数据挖掘技术研究

2014-04-29 04:31冷旭峰
中国电子商情 2014年7期
关键词:神经元网络决策树数据挖掘

冷旭峰

引言:在电子商务中对数据挖掘技术进行应用,能够有效地组织利用丰富的数据源信息,挖掘出对电子商务有重要价值的信息。本文对电子商务中的数据挖掘技术进行了详细的研究,分析了电子商务中对数据挖掘技术的应用,然后从数据信息与挖掘任务两个角度指出了数据挖掘技术的适用场合。

当前,数据库技术和网络技术的发展日趋成熟,世界上传统商务也正在经历一次重大的改革,电子商务成为发展重点。电子商务的一个重要应用技术就是数据挖掘技术,并且数据挖掘技术可以给正确的商业决定提供可靠的保证和强有力的支持,因此,数据挖掘技术被认为是电子商务中必不可少的工具。

一、数据挖掘技术的概念和应用

数据挖掘就是对数据仓库中存储的大量数据进行挖掘,来找出有意义的新的关联趋势和关联模式的过程。从商业的角度看,数据挖掘技术是一个对商业信息进行处理的新技术,具有能够分析、转换、抽取和其他模型化处理商业数据库中大量业务数据,从中提取出能够辅助商业决定的关键性数据的特点。

因为数据挖掘可以给电子商务带来显著的经济效益,所以其在电子商务中也有越来越广泛的应用。

数据挖掘应用于零售业,能够帮助商家识别顾客的购买行为,发现顾客的购买趋势和模式,从而可以帮助商家有针对性的提高服务质量,获得更好的顾客满意度与顾客保持力,提高货物的销量,设计出更好的货物分销与运输方法,降低商业成本。

数据挖掘应用于金融领域,能够帮助管理者分析客户的信用情况与偿还能力,并对其进行分类和评级,从而降低放贷的错误率,提升资金的使用效率。通过数据挖掘,还可以找到在偿还中有决定作用的主导因素,制定相应的金融策略,还能够发现洗黑钱和其它金融犯罪活动。

二、如何选择正确的数据挖掘技术

数据库方法、神经网络方法、机器学习方法和统计方法都是数据挖掘所使用的技术。本文将从可获得的数据与数据挖掘任务两个方面来说明如何选择正确的数据挖掘技术。

2.1 可获得的数据

数据挖掘可获得的数据信息主要是内容、记录和字段类型之间的关系,并且对数据挖掘技术的选择有影响的数据性质有以下几个:

第一,数值字段:聚集检测和MBR使用距离函数对数值字段进行处理;神经元网络把所有的输入转化到0-1之间;决策树使用splitter数值对数值字段进行处理;关联分析需要把数值变量区间转化为种类变量区间,但是区间的选择十分困难。

第二,种类字段:决策树、连接分析、关联分析都很适用于种类字段。

第三,多个非独立的目标字段:神经元网络可以很好地应用于存在多个依赖变量的情况。

第四,自由文本数据:采用MBR技术是最佳选择。

第五,具有时间顺序的数据:关联规则、神经元网络对有时间顺序的数据有比较好的处理能力。时间顺序也可以用决策树处理,但是需要准备较多的数据。

第六,每条记录都有大量独立的字段:关联规则挖掘、MBR技术、神经元网络都会受到记录中字段多的影响。但是决策树就会受到程度较小的影响。

第七,变长的记录:只有连接分析和关联规则能够对变长的记录进行处理,而如果使用其它技术,就需要对数据进行预处理:把一条记录拆分为几条记录,每个都含有记录号;能够生成一些统计字段。

2.2 数据挖掘任务

从数据中发现模式是数据挖掘的任务。在对某种数据挖掘技术进行选择之前,第一,要把需要解决的商业问题转化成正确的数据挖掘任务;第二,依照数据挖掘的任务来决定使用几种或者是哪一种数据挖掘技术。以下将以聚集和概念描述为例,对挖掘任务需要使用哪些挖掘技术进行分析。

(1)聚集。聚集就是把整个数据库分为不同的群组。其目的是使同一个群之间的数据尽量相似,而不同的群之间要有很明显的差别。协助市场分析人员在客户基本信息库中找出不同的客户群,并用购买模式对不同客户群的特征进行刻画是电子商务中对聚集的典型应用。另外,聚类分析也能作为分类、特征等其他算法的预处理步骤,这些算法可以再在生成的簇上进行处理。聚集与分类不同的是,在开始之前一般不知道该把数据分成几组和怎样分,所以要有一个对业务特别熟悉的人在聚集之后对这样分群的意义进行解释。一般情况下,需要经过几次反复的增加或删除变量才能得到理想的结果。

(2)概念描述。描述式数据挖掘的最基本形式就是概念描述。概念描述以简洁汇总的形式对给定的任务的相关数据集进行描述,提供数据的一般特征。一般,通过数据库来查询收集用户指定类的数据。有两种概念特征化的一般方法:面向属性归纳的方法和基于数据立方体OLAP的方法,这两种方法都是基于维或属性的概念化方法。一般使用面向数据库的方法实行概念描述挖掘,并且还能够采用机器学习方法中的基于范例学习的技术来进行。

三、小结

选择能够解决电子商务中一些问题的数据挖掘技术的时候,需要根据具体问题的特点来选择合适的技术方法,在选择了符合数据模型的算法之后,就要确定正确的模型与参数。并且要想很好的发挥数据挖掘能够帮助企业在激烈的竞争中做出正确决定的作用,就必须选对合适的数据挖掘工具。

参考文献

[1]胡永祥.电子商务系统中的数据挖掘技术研究[J].电子世界,2013,(24):25-25.

[2]徐羡文,郑厦君.数据挖掘技术在电子商务推荐中的应用[J].电脑知识与技术,2011,07(27):65-66.

[3]杨波.浅谈数据挖掘技术应用[J].电脑知识与技术,2010,06(24):82-83.

(作者单位:江西经济管理干部学院)

猜你喜欢
神经元网络决策树数据挖掘
探讨人工智能与数据挖掘发展趋势
ML神经元网络自适应同步的抗扰特性研究
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
基于并行计算的大数据挖掘在电网中的应用
基于改进PID神经元网络的多变量系统控制算法
基于决策树的出租车乘客出行目的识别
模块神经元网络中耦合时滞诱导的簇同步转迁*
一种基于Hadoop的大数据挖掘云服务及应用
基于肺癌CT的决策树模型在肺癌诊断中的应用