陈晓杰 许振华 张娅锋
[摘要]介绍数据挖掘的概念、体系、过程和技术方法,分析基于数据挖掘的烟草物流综合管理系统的体系架构,指出应用数据挖掘技术的烟草物流综合管理系统的优势。
[关键词]数据挖掘 数据仓库 烟草物流
中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2009)0110098-02
一、引言
现代物流是极具潜力的新兴产业,作为继物质资源、人力资源之后的“第三利润源”而被高度重视。中国烟草行业的销售配送网络经过多年的发展已经具有现代物流的基本特征,包括卷烟运输、卷烟存储、卷烟分拣(加工)和卷烟配送等环节。由于现在卷烟物流配送实施地区统一配送,客户基数非常大,因此导致每个物流环节都产生大量的数据。另外现代物流信息技术的使用也使得数据库的规模不断扩大,产生了巨大的数据流,使企业很难对这些数据进行准确、高效的收集和及时处理,因此也很难帮助决策者做出快速、准确的决策,难以实现对卷烟物流过程的全程监控,降低整个卷烟物流的成本。数据挖掘技术正可以解决这些问题,能够帮助企业在物流信息管理中,及时、准确的收集和分析客户、市场及整个企业内部的各种信息,对客户的行为及市场趋势进行有效的分析,了解不同客户的需求,从而可以为客户提供针对性的服务,大大提高客户对企业和产品的满意度。
二、数据挖掘技术
数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database,KDD)是指从大量的、有噪声的、模糊的、随机的数据中,获取有效的、新颖的、潜在有用的、最终可理解的模式。数据挖掘是一门交叉学科,涉及到数据库技术、人工智能技术、数理统计、可视化技术、信息提取、空间数据提取和并行计算等方面,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。数据挖掘系统一般由数据库、数据仓库或其他信息库,数据库服务器,知识库,数据挖掘引擎,模式评估模块和图形用户界面组成。数据模式可以从不同类型的数据库挖掘,如关系数据库,数据仓库,面向对象的数据库,也可以从其他类型的信息存储中提取,包括空间的、时间相关的、文本的、多媒体的和遗产数据库,以及万维网等。数据挖掘过程一般由三个步骤组成,即数据准备、数据挖掘、结果的解释和评价。在数据挖掘的处理过程中,数据挖掘方法是最为关键的,目前数据挖掘的方法主要有以下几类:关联规则方法、分类和聚类方法、数据统计方法、机器学习方法、多层次数据汇总归纳、神经网络方法、决策树方法和序列模式分析方法。
三、数据挖掘在烟草物流综合管理系统中的应用
烟草卷烟物流经过几年的发展,逐步建立了半自动卷烟分拣系统、自动卷烟分拣系统、数字仓储系统和配送车辆GIS系统等物流相关的信息系统。这些信息系统通过应用网络技术、EDI、人工智能、条形码、无线pos、电子标签,RFID等各种先进技术,将物流作业信息化,物流信息处理电子化和计算机化,极大的提高了工作效率,但是由此也产生了大量的信息,难以及时准确的处理,给领导决策带来了困难。在这个背景下,物流综合管理系统的开发迫在眉睫。物流综合管理系统是架构在分拣系统、仓储系统、车辆监控系统之上的物流决策系统,是一种结合了数据挖掘技术和人工智能的新型经营决策系统。它通过数据收集、智能筛选对卷烟采购、卷烟存储、卷烟分拣、卷烟配送、日常管理和绩效考核的各个环节的大量信息进行采集,并利用数据仓库和数据挖掘技术对其进行分析处理,以此确定相应的卷烟物流管理决策。物流综合管理系统的开发和应用,实现了商业企业卷烟商流、物流各个环节的无缝衔接,满足了卷烟物流配送中心精细化管理的要求。通过调度管理、仓储管理、分拣管理、送货管理,实现配送中心各作业活动的前后衔接、左右贯通;通过现场管理、安全管理、设备管理对配送中心的作业细节进行细致管理;通过成本核算,对配送中心的费用进行计算,并生成各项费用指标,实现物流成本监控与分析;通过绩效考核模块,对配送中心进行多级考核;通过监控预警模块,以文字、表格、图形等多种形式展现作业数据、管理数据,实现全面的管理监控与管理优化分析,为配送中心的高效、服务、低成本运作提供管理决策工具。
(一)卷烟物流管理信息系统数据仓库的建立
数据仓库的建立是数据挖掘的基础。数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理决策制定。烟草物流分拣、仓储、配送等各个作业系统作为数据仓库的原始数据源,为数据仓库提供订单、配货单、客户信息、结算信息、仓储信息、分拣信息等大量数据资料和报表。另外,日常管理的台账、应急预案等信息也通过相应的数据接口导入到数据仓库中。数据仓库通过ETL过程(抽取、转换和加载)处理这些原始数据,并且根据烟草物流的特点和公司领导决策的要求,按照工作流的方式组织、存储和管理这些数据。物流综合管理系统的领导决策、成本核算、绩效考核、报表查询和作业管理等子模块通过数据仓库接口,对数据仓库中的数据进行联机分析和数据挖掘,从而取得用户需要的数据模式,并以合适方式展现给用户。
(二)应用数据挖掘的烟草物流综合管理系统的体系架构
根据烟草物流综合管理系统项目建设目标和主要需求的分析,基于数据挖掘的烟草物流综合管理系统的总体框架可分为基础网络层、核心数据层、应用支撑层、应用服务层以及表现层五个层次,同时还综合考虑到物流综合管理系统的标准体系建设和信息安全体系建设,系统体系架构如图1所示:
1.网络基础层:基础网络层包括物流综合管理系统所涉及的计算机设备、操作系统、数据库系统、应用服务器、通讯系统等,操作系统选择安全、稳定,支持多用户并发请求的系统,并同时考虑到与数据库服务和应用服务系统软件选型的兼容性问题;数据库系统满足安全、稳定、大容量、面向事务等关系型数据库基本功能。
2.核心数据层:核心数据层是物流综合管理系统的数据信息中心,即数据仓库,包含物流综合管理系统及其他相关应用的所有数据。从数据的种类看,有结构化和非结构化两类数据,从物流管理系统的应用来区分,包括基础信息库、业务信息库及物流信息库。除了物流管理系统自行管理的数据之外,很多业务数据和物流信息,来自于其他信息系统如:业务,分拣、仓储、营销、呼叫中心等各类系统。因此,建立数据仓库,对原始数据进行转换、处理、加载,形成统一的接口和交换模式,就成了这些数据顺利应用的前提。
3.应用支撑层:应用支撑层通过选择合适的数据挖掘技术和方法向物流应用服务层提供所需的各种服务,如数据交换服务的统一接口、和统一交换等;同时用户权限和日志管理服务也归入这个层次。服务支撑层的目标是为应用服务建立一个支撑环境:一方面可以为应用系统的开发提供帮助,另一方面,通过一致的应用支撑层的建设,可以为建成系统的统一性、一致性提供保证。应用支撑层的实现内容:应用支撑层需要实现的功能包括数据挖掘、数据访问、消息服务、事务处理、日志处理等。
4.应用服务层:以浏览器/服务器(B/S)模式部属了物流应用服务,并通过IE浏览器提供表现层访问。应用服务包括物流调度管理系统、物流作业管理系统(一号工程、仓储、分拣、送货)、物流管理系统(日常管理、安全管理、费用管理、绩效管理)、分析决策系统(各类预案管理、监控预警、分析决策)等。
5.表现层:该层次提供系统使用人员访问应用服务的接入方式。实现界面显示逻辑和集成,比如信息在不同终端浏览器等设备上展现。
(三)应用数据挖掘的烟草物流综合管理系统的优势
与传统的烟草物流信息管理系统相比,应用数据挖掘技术的烟草物流综合管理系统有以下优势。
1.传统的烟草物流信息系统通常就是将涉及到的卷烟物流环节划分成各个功能模块,模块间信息相对独立,信息交互能力差,存在大量的信息孤岛,无法为用户领导决策提供帮助。应用数据挖掘的烟草物流综合管理系统,通过采用数据仓库和数据挖掘技术来抽取、处理、挖掘整个烟草物流环节的信息,统一组织管理数据,并且将业务部门、物流部门以及上游供应商(烟厂)等信息综合在一起,实现了整个烟草供应链信息的高度共享和快速反应。
2.传统的烟草物流信息系统考虑到系统的运行效率,对于历史数据一般不会保存太久,通常的做法是将历史数据另库存放,如果要查询历史信息,需要选择历史数据库才能查询,作同比和环比分析时非常麻烦。而应用数据挖掘的烟草物流综合管理系统由于使用了数据仓库,因此具有长时间的历史数据存储。这为数据的趋势分析,同比分析以及模型预测提供了基础,也为决策者决策提供了长期的数据支持。
3.应用数据挖掘的烟草物流综合管理系统由于对原始数据都进行了统一的处理加工,因此具有非常强的可扩展性。如果物流综合管理系统有新的需求需要用到其他系统的数据,那么只要根据统一的接口规则,将数据导入到数据仓库中进行处理、加工,然后通过事先定义好的挖掘方法就可以根据用户的需求展现给用户。
四、结束语
基于数据挖掘的烟草物流综合管理系统是一个综合性的现代物流管理系统,系统既解决了物流动态管理问题,又解决了各个子系统的数据对接问题,使数据资源得到有效利用,更解决了行业内物流成本统计中,因费用界限、口径不清造成统计可比性较差的问题,同时也为领导决策和预算管理奠定了基础。
参考文献:
[1]JIAWEI HAN,MICHELINE KAMBER著、范明、孟小峰等译,《数据挖掘:概念与技术(原书第2版)》,机械工业出版社,2007.2-1版次.
[2]李其芳,《数据挖掘技术在物流信息系统中的应用》,载《商品储运与养护》,2006.第01期,第17-19页.
[3]毕方明、张永平,《数据挖掘技术研究》,载《计算机工程与设计》,2004.第12期,第25卷,第2242-2244页.
[4]吴慧香,《数据挖掘在物流企业信息系统中的应用》,载《科技信息(学术版)》,2007.第29期,第324页.
[5]别文群、钟其,《基于数据挖掘的物流信息系统的分析和设计》,载《物流技术》,2005.第6期,第83-84页.
[6]李宗璞,《数据挖掘技术在物流系统中的应用》,载《商场现代化》,2006.第05期,134-135页.
[7]刘晓华,《数据挖掘在商业中的应用》,载《商场现代化》,2006.第34期,第74-75页.
作者简介:
陈晓杰,浙江省烟草公司台州市公司信息中心。