叶敏
【摘要】本文通过从数据挖掘技术的研究历程开始,介绍了几种常用的数据挖掘的技术,以及数据挖掘的过程;重点说明了数据挖掘技术在物流企业决策系统、仓储管理以及电子商务中的应用,同时指出数据挖掘技术存在的问题。
【关键词】数据挖掘技术 物流企业
一、数据挖掘技术研究现状
(一)数据挖掘的定义
数据挖掘(Data Mining)是从海量的噪声数据中识别提取具有应用价值的数据的过程。这里的数据源必须是真实的、大量的、含噪声的。
(二)国外研究现状
世界上对数据挖掘的正式研究开始于1989年8月举行的第一届KDD国际学术会议,数据库中的知识的发现(Konwledge Dis-covery in Database)在这次会议中第一次被提出。研究重点逐渐从发现方法转向系统应用,并且注重多种策略和技术的集成和多种学科的相互渗透。国外在应用方面发明了多款用于数据挖据的软件,如spss model等,并开发了hadoop和spark等支持数据挖掘的框架,使得数据挖掘技术的发展空间更为宽广。
(三)国内研究现状
国内对数据挖掘的研究相对国外较晚,1993年国家自然科学基金首次支持中科院合肥分校对该领域的研究项目,目前进行的大多数研究是由政府资助进行,如863计划、“九五”计划等。
在数据挖掘软件平台上,MSMiner平台是由中科院计算技术研究所智能信息处理实验室开发的。
二、数据挖掘常用的技术
(一)人工神经网络
人工神经网络从信息处理方面对人脑神经元网络进行抽象简单的模型,它为解决大复杂度问题提供了一种相对来说比较有效的简单方法。神经网络可以很容易的解决具有上百个参数的问题。
(二)决策树
决策树是一种树形结构,每个节点表示一个属性的测试值,每个分支代表一个测试输出,每个叶节点代表一种类别。
(三)数据挖掘过程
数据挖掘的过程一般由三个主要的阶段组成:数据准备、数据采集、结果表达和解释。①数据准备。数据准备对数据挖掘的成功应用至关重要,如果没有对数据进行预处理,那么可能会得到一些没有意义甚至是错误的结论.数据准备大致分为3步:数据集成,数据选择,数据转化。②数据采集。作为数据挖掘技术的核心,数据采集主要由以下几部分构成:确定数据挖掘的类型,确定要实现的目标和任务的类型情况;选择对应的技术来挖掘数据,根据挖掘任务来选择适合的挖掘数据技术;选择相应的算法:根据选定的技术选择一种具体的算法;挖掘数据信息:用选定的算法组合在模式空间中进行反复迭代的搜索,从数据中找出有价值的数据信息。③结果表达与解释。通过对数据挖掘发现的结果来解释,过滤掉一些无用的数据,给用户呈现出具有实际意义有用的信息。
三、数据挖掘技术在物流企业中的应用
(一)数据挖掘技术在物流决策系统中的应用
物流决策系统是一种结合了数据挖掘技术和人工智能技术的物流决策系统,通过人工智能对原料采購、加工生产、分销配送到商品销售的各个环节的数据进行收集,并通过使用数据挖掘等技术进行分析和处理,来确定制定的决策策略。从物流决策系统来看主要有以下几个方面情况:
(1)人机界面:人机界面主要是通过与公司业务营销部门的沟通,以此获取产品的主生产计划和相关的采购要求,通过采购入员反馈的采购完成数据输入和输出采购订单。
(2)联机分析:根据采购入员反馈的完成情况,结合局部的知识库和数据仓库,为各种物流选出适合的采购材料供货商。
(3)推理机:推理机是一个数据挖掘智能决策系统的核心,它是根据用户对采购的具体要求,并且结合了局部数锯仓库中数据和知识库中的知识,以此为决策者提供有价值的信息,并且对包含的所有用户进行预测分析。
(二)数据挖掘技术在仓储管理中的具体应用
(1)仓库选址问题。仓库的选址问题就是求解配送成本、固定成本和变动处理成本之和的最小化问题。可以通过用数据挖掘技术中的分类树的方法来解决这个问题。通过这个分类树的方法,不仅确定了每年每个仓库的配送量,同时确定了仓库的位置,使得企业使用合适的库存量,并且减少库存资金。
(2)合理安排货品的储存位置。对于货物的存放,我们怎么合理安排货品的存储,减少货物的存储成本,哪些货物放在一起可以提高拣选的效率,我们可以通过使用数据挖掘的光联模式来分析这些问题。
(三)数据挖掘技术在电子商务领域中的应用
电子商务在营运过程中积累的巨大的数据量,这些数据中有挖掘的价值需求,并且随着电子商务的迅猛发展,数据的安全性和保密性要求也越来越高,这也对数据挖掘技术提出了更高的要求。
(四)数据挖掘技术在零售业中应用
在零售业中,数据挖掘技术可以根据销售,顾客、产品、时间和地区进行多维度分析,基于有效数据挖掘的数据仓库的设计和构造进行分析,数据挖掘技术可以分析促销活动的有效性可以顾客忠诚度,以及对产品推销和产品的交叉推动的关联性进行分析,对各类关联度高的产品进行重新下布局,从而提高顾客购买力。
四、数据挖掘技术存在的问题
(一)数据模型的可靠性
数据模型包括物理模型、逻辑数据模型等。目前的很多数据挖掘模型都不是很成熟,都有各自的优缺点。数据的可靠性很关键,因为不同的数据模型使用不同的方法,可能产生不同的结果。
(二)数据趋势的预测
如何在数据挖掘过程中发现规律信息,做出合理的趋势预测,这是数据挖掘难点。电子商务大量的数据信息,表现了电子商务一定的趋势情况,这些数据的趋势预测十分重要,特别是对于客户信息和产品信息,有效的预测分析可以帮助企业有效决策,可以获得更大的利润。
(三)数据挖掘结果的不确定性
数据挖掘结果具有不确定性的特点,因为数据挖掘的目的不同,最终的结果也会出现各种情况,对此我们需要与数据挖掘的目标相结合,来做出理性的判断,使得企业做出正确的决策选择,进而达到提高企业经济效益,获得更多利润的目的。
五、结论与展望
数据挖掘技术在物流企业决策系统、仓储管理以及电子商务中的成功应用的同时,也存在一些问题。随着数据挖掘技术的不断进步,这些问题也会逐渐迎刃而解。