浅议数据挖掘在军队房地产租赁管理中的应用

2012-01-28 08:46文/赵
中国储运 2012年12期
关键词:数据仓库数据挖掘军队

文/赵 虎

军队房地产租赁作为部队后勤管理中涉及钱物等部队资产的重要管理工作,历来受各级部门重视。随着军队信息化建设的不断推进,后勤管理工作中各项信息管理系统陆续投入使用,极大地提高了后勤管理的效率。与此同时,信息化管理所产生的数据量也与日俱增,巨大的数据量迫切地需要一种强大且通用的工具来处理它,以此来发现人工难以发现的问题。在这种情况下,将时下普遍应用的数据挖掘技术应用于军队房地产管理成为了一种可能。

一、军队房地产租赁管理概述

1.什么是军队房地产租赁

随着我军军事变革的不断深入,军队信息化程度的不断提高,军队在经历了几次大裁军之后,原有的营区房产、地产就出现了很多空闲,各部队在保证军事需求的前提下,把暂时空余的房地产依法对外租赁,不仅有效地保护和储备了重要资源,发挥了资源效益,减轻了国家负担,而且丰富了当地市场,具有一举多得的好处。

2.军队房地产租赁研究现状

目前国内外、军内外对于房地产管理研究成果较多,主要集中在针对地方的房地产开发公司、针对市场的研究以及客户关系管理(CRM)方面,由于利益的驱动,这些方面的研究比较热门,成果较多,数据挖掘的应用非常广泛。但是,专门针对房地产租赁的研究较少,相应的,专门针对军队房地产这个特殊资源的研究也就更少。

部队目前在房地产租赁领域所作的工作主要有以下几方面:一是进行法律法规、体制机制的研究,使租赁管理工作走上正规化、规范化的道路。二是积极开展管理信息系统、数据库、数据仓库的建设,不断提高租赁管理工作信息化水平,但部队在此方面的研究成果较少,而军外对于房地产开发、租赁等已有诸多成熟的管理信息系统案例。三是积极开展房地产租赁项目的清查工作,积累最新的一手数据,为政策的制定、新项目的实施提供数据支持。但目前这方面的工作只停留在数据搜集层面,少有对数据分析处理的研究。

3.为什么将数据挖掘技术引入军队房地产租赁

利用信息管理系统平台来管理军队房地产租赁,最核心的目标是提高管理的效率和准确性,而达到这个目标的途径必须由信息系统对大量数据进行分析处理。针对文本、多媒体数据、空间数据等多种类型数据的分析处理有很多种方法,包括知识发现(KDD)、统计分析、机器学习、联机分析处理(OLAP)。知识发现主要流行于人工智能和机器学习界;统计分析和机器学习都偏重于模式发现和预测,统计分析往往注重理论的完善,而不注重实际的效用,机器学习往往不把海量的数据作为研究对象;OLAP是数据库分析处理的一种早期应用,它不能发现新的知识,它只是验证用户提出的假设。数据挖掘是一门覆盖很广的综合学科,它吸纳了以上几个学科的技术,借助于计算机强大的计算能力来处理海量的数据,能使用户获得令人意想不到的洞察力。

二、数据挖掘概述

1.什么是数据挖掘

数据挖掘比较公认的定义是由W.J.Frawley、G.Piatetsky-Shapiro等人提出的:数据挖掘就是从大型数据库的数据中提取人们感兴趣的知识的过程,这些知识是隐含的、事先未知的、但潜在有用的信息,提取的知识可以表示为概念、规则、规律、模式等形式[1]。

这种定义把数据挖掘的对象定义为数掘库。而更广义的说法是:数据挖掘意味着在已知的数据集中发现各种模型、概要和导出值的过程。从数据挖掘的定义中可以看出:

(1) 数据的来源:数据挖掘的数据来源于大型的数据库、数据仓库等各种已存在的数据,之所以要对其进行挖掘是因为原来的数据是粗糙的、未经加工的、不能满足应用需求的,而数据挖掘就是将“无效的垃圾数据”变为“有效知识”的过程。

(2) 强调发现:数据挖掘有很多方法技术,但数据挖掘绝不仅仅是死板地去套用各种方法技术,需要人来与计算机进行交互,辨别挖掘过程、挖掘结果的正确、有效性。

(3) 强调过程:根据经验,很少有数据挖掘项目能够一次成功,它是一个不断反复、迭代的过程。一次不仅不能得到有价值的知识(很多情况下还会产生很多不合逻辑的垃圾信息),而且还因为从不同的视角与分析数据可能会得到不同的、令人意外的结果。

2.数据挖掘能干什么

数据挖掘是目前计算机行业中发展最快的领域之一,它是一门交叉性学科,它涵盖了统计分析、机器学习、偏差检测、模式识别、数据库、人工智能、专家系统、数据可视化等多个学科的相关技术。数据挖掘的主要任务是针对大型的数据库、数据仓库中不同类型的(结构化、半结构化、异构数据)、低质量的数据,通过人与计算机的不断交互合作分析,从中获取有价值的知识,并将获取的知识应用到信息管理、查询优化、决策支持等工作中。数据挖掘是面向应用的,不同的数据挖掘技术可以解决不同的问题,具体的操作方法也因不同的应用而不尽相同。目前,数据挖掘已经在商业、金融、生物、医疗等多方面取得了良好的应用效果。

3.如何进行数据挖掘

数据挖掘可以由3个主要阶段组成:数据准备、模式发现(狭义的“数据挖掘”)、结果解释。数据准备阶段是为数据挖掘提供合适的数据,可分为数据集成、数据筛选和预处理三部分。在军队房地产租赁数据挖掘中,数据准备是把房地产租赁信息管理系统所产生的大量数据以统一规范的形式集中存储在新创建的数据仓库当中;模式发现阶段是在已经准备好的数据仓库中,提取内在的规律;结果解释是根据已经细化的具体目标,结合行业实际,对挖掘数据仓库所获得的模式进行评估和说明。需要说明的一点是,数据挖掘并不是一个一蹴而就的工程,有时候可能需要多次的调整挖掘模型、算法、参数,经过多次重复挖掘过程最终才有可能得到有用的结果。

三、数据挖掘在军队房地产租赁管理中的应用

1.需求分析

通过对军队房地产租赁管理工作流程、现状等相关行业知识的研究及与管理人员进行交流,我认为对军队房地产租赁数据进行挖掘的重点主要在以下几方面:

(1)军队房地产租赁现状与发展趋势预测 利用统计分析、聚类分析等技术可以对现有租赁项目的地区(战区)分布特征、类别信息等进行挖掘,并将结果通过可视化展示以方便决策者从总体上把握军队房地产租赁现状。

(2)房地产租赁意向的决策 利用关联规则分析方法可以分析区域经济的发展状况、受租方的社会属性、租赁用途等与房地产租赁的成交率、价格、使用年限等因素之间的潜在关系。

(3)承租方及受租方信息分析 通过对承租方及受租方的相关信息进行关联规则分析发现双方在租赁项目中的行为模式、特性(例如受租方的可靠性、租赁回报率等与租赁项目的其他属性之间的潜在联系)等信息。

(4)违规、异常租赁项目的检测 结合行业相关的背景知识以及偏差、异常检测方法,分析数据集中的异常数据(并非随机偏差,而是体制不同造成的异常)进行分析,预测出某些违法、违规的,具有潜在的不良倾向的租赁项目。

2.实施步骤

(1)明确目标 找出关键的业务问题将其映射成可视化数据挖掘能够研究的问题定义和目标。

(2)数据准备 通过对数据进行ECTL等操作处理,提高其质量,确保数据挖掘的精确性、有效性。

(3)建立模型 经过反复的考察,选择适合解决当前问题的模型。并选择一定的训练集来测试挖掘模型直至最终建立。

(4)输出结果的评价和解释 模型建立好之后,先在小范围内应用,取得测试数据,综合考虑准确度和成本两方面因素,觉得满意后再推广。

(5)实施 模型在建立并经验证之后,将其应用到不同的数据集上。最终得到有价值的信息,达到辅助决策的目标。

3.需要注意的问题

数据挖掘是一项系统工程,尤其是遇到大型数据库时,需要多方面力量的参与,因此在实施挖掘时必须在充分调研,大量搜集资料,搞清楚军队房地产租赁管理的工作流程、管理方法经验、现实存在的不足等问题的基础上采用局部实验的办法进行,在明确数据挖掘目标及相应的方法的前提下抽取适量的数据集进行实验性分析处理,以证明数据挖掘技术在军队房地产租赁管理中应用的有效性。

[1]石付威.数据挖掘在教务系统中的研究与实现.同济大学硕士学位论文,20091001.

猜你喜欢
数据仓库数据挖掘军队
探讨人工智能与数据挖掘发展趋势
基于数据仓库的数据倾斜解决方案研究
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于数据仓库的住房城乡建设信息系统整合研究
军队组织形态解读
软件工程领域中的异常数据挖掘算法
探析电力系统调度中数据仓库技术的应用
数据复用在存储数据仓库中的运用
高级数据挖掘与应用国际学术会议
旧军队的改造和国民革命军的建立