韩翟
摘要:铁路运输一项非常复杂的工程,这其中存在着战略、管理和生产3个层次全系列的决策活动。建立良好的铁路运输决策支持系统的关键就是要做好数据的共享、整理和输出工作,使得能够获取的海量数据能够成为铁路运输决策的基础和依据。传统的信息管理系统经过发展衍生出了决策支持系统,目前铁路决策支持系统架构中对于信息进行整理储存的的数据仓库技术以及在此基础上对数据进行分析预测的数据挖掘技尤为关键。本文对这两种技术在铁路运输决策支持系统里的应用进行了梳理,以期提高铁路运输的经济效益和社会效益。
关键词:铁路运输;决策支持系统;数据仓库;数据挖掘
中图分类号:U292.12;TP3111
文献识别码:A
文章编号:1001-828x(2016)036-000354-01
20世纪90年代起,铁路运输管理信息系统(TMIS)的发展开始走向正轨,如今在铁路运输三个层次的许多方面都可以看到铁路运输管理信息系统的应用。在票务工作、铁路运输生产管理、铁路运输计划规划、车辆管理、货运信息整理等各个方面,铁路信息管理系统都有所应用。但由于各类系统是各自独立的,形成了一个个数据孤岛,使得数据共享成为一个问题,这也对运输的决策活动造成障碍。因此建立良好的铁路运输决策支持系统的关键就是要做好数据的共享、整理和输出工作,使得能够获取的海量数据能够成为铁路运输决策的基础和依据。
一、铁路运输决策支持系统架构
决策支持系统(Decision Support systems,简称Dss)是20世纪70年代,在传统的管理信息系统(Management Information Systems,简称MIsl的基础上形成和发展起来的。目前铁路决策支持系统架构中对于信息进行整理储存的的数据仓库技术以及在此基础上对数据进行分析预测的数据挖掘技尤为关键。
铁路运输决策支持系统的功能包括数据的管理和存储、信息查询和输出、运输绩效分析、市场需求分析和预测、违规行为判断和客户关系管理等。具体系统架构分为数据源、数据存储与管理、OLAP服务和前端工具与应用四部分。其中数据源主要由三大部分的信息组成:第一部分是经济指标、货票信息、车号识别信息、货运营销系统信息;第二部门是调度系统、货车追踪系统、集装箱系统的系统信息;第三部分为十八点统计、精密统计的统计信息。数据存储与管理主要指的就是数据仓库,数据源产出的信信息通过摘取、整理、加载、刷新等储存在数据仓库内,并根据维度对数据进行划分形成数据集市。而OLAP服务则是在数据仓库的基础上对数据进行挖掘和分析。数据仓库的数据直接大批量输出或者通过数据集市的方式输出,在OLAP服务环节利用数据挖掘和知识发掘工具进行汇总和聚集机制。从铁路运输决策支持系统的建构分析中可知,数据仓库技术和数据挖掘技术是铁路运输决策支持系统的关键部门,对于大量数据的储存和分析处理都集中在这两个环节。
二、数据仓库技术
数据仓库技术是大量数据储存和分析处理的基础,其结构包括元数据和数据集市。元数据由铁路应用系统中的货运信息、车辆信息、货票信息等组成,经过抽取和处理之后存储于数据缓冲库,并通过加载传送到铁路全局数据仓库,最后分解传送至数据集市。数据集市根据主题会还原成铁路应用系统所对应的三大维度,包括货运信息、经济指标和市场信息。经过分解的数据会各自匹配到多维数据库中,并最终输出信息进行分析应用。
存储于数据仓库中的数据的特点可以概括为“四性”:
1.规模性。数据仓库的数据来自于经济指标、货票信息、车号识别信息、货运营销系统信息、调度系统、货车追踪系统、集装箱系统、十八点统计和精密统计的各类信息。因此数据仓库的数据量庞大,具有可观的规模。
2.历史性。数据在数据仓库中的储存时间很长,可以长达数年。这些数据会记录时间标记,可以满足横向、纵向信息比较。并且通过对历史数据的整理,可以进行预测等的功能的实现。
3.集成性。从各个铁路应用系统来的数据进入数据仓库后都会被統一处理,储存在数据缓存库,并统一加载和分解。
4.只读性。数据仓库是一个信息源,它只是为在其上开发的DSS或EES等提供信息服务。因此它应是只读数据库,一般不能轻易改动,只能定期刷新。
三、数据挖掘技术
数据仓库将大量历史数据集中处理,而数据挖掘技术则是将数据仓库的作用发挥出来的一项重要技术。数据挖掘是一种可以从如数据仓库中提取隐藏的预测性信息的新技术,相对于数据仓库其最大的特点是展望性和预测性。作为一种数据分析的工具,数据挖掘可以在大量数据中发现数据之间潜在的关系模式,找出不被重视的信息,即可以充分利用好大量数据,并以此为基础,找出尽可能多的数据关系,以此为铁路决策提供依据。
大数据时代为我们提供了大量数据作为依据,因此要想在利用好这些数据,数据挖掘技术至关重要。数据挖掘可以对已知数据进行分析,对已有关系进行探索和发现,这样的结果更具有实践意义和现实性。并且利用数据挖掘技术,可以让数据本身说话,寻求出更多的可能性,建立新的业务模型,帮助决策者调整市场策略,作出正确的决策。
四、结语
铁路运输决策支持系统是服务于决策过程,而其中实现科学化和智能化的关键是数据仓库和数据挖掘技术。数据仓库是基础,通过整理、分类、储存数据解决了各系统之间信息孤岛的问题;而数据挖掘则是在数据仓库的基础上更好地利用好数据,最终实现决策的最优化。