李丽芬
摘 要
随着轨道交通的迅速发展,南京地铁网络化的运营,客流信息的日益增长,对票务系统的数据统计的信息化,自动化、智能化以及全面化的要求越来越迫切。为了提高南京地铁运营的管理水平和智能化程度,在大力建设智慧城市环境的影响下,城市轨道交通也开始将数据挖掘技术引入到我们的AFC系统中,大大提高我们运营管理人员的工作效率全面实现高效的信息化管理,为轨道交通带来巨大的信息价值和社会经济效益,为城市未来的轨道交通发展规划建设和运营提供有利的指导。
【关键词】AFC系统 数据挖掘技术 数据统计
1 背景概述
随着轨道交通的迅速发展,南京地铁网络化的运营,客流信息的日益增长,对票务系统的数据统计的信息化,自动化、智能化以及全面化的要求越来越迫切。由于建设时间的不同,南京地铁自动售检票系统各条线路数据处理的能力,数据统计的信息化程度以及统计的方式都存在着差异化,所以对南京地铁AFC系统的整个线网的运行情况只能做到基础的统计和分析,难以达到对细节的监视,无法对线网的运行状态进行实时评估和分析,不能满足南京地铁网络化运营和提高AFC系统服务的质量。因此,结合目前南京地铁网络化运营的需求和特点利用数据挖掘技术和数据处理技术,深度挖掘南京地铁自动售检票系统数据中的潜在有用的信息,将成为我们南京地铁未来发展和研究方向。它可以大大提高我们运营管理人员的工作效率全面实现高效的信息化管理,能够使我们全面细致的监控到我们AFC系统的运行状态,实现智能化和自动化的辅助决策,为运营企业带来巨大的信息价值和社会经济效益,为城市未来的轨道交通发展规划建设和运营提供有利的指导。
2 数据挖掘技术
2.1 数据挖掘的概念
数据挖掘其实就是一种深层次数据分析,就是从大量的、不完整的、模糊的,随机的实际应用数据中,提取隐含在其中的,人们事先不知道的,但是又是潜在有用的信息和知识的过程。
2.2 数据挖掘方法
数据挖掘又称数据库中的知识发现,是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等,它们分别从不同的角度对数据进行挖掘。
3 数据挖掘技术在AFC系统中的应用
南京地铁AFC系统的数据主要包括交易数据、审计数据,事情数据等。这些数据涉及到公司的运营经营情况,是公司运营管理的重要基础,公司需要从这些数据中获取信息来满足运营收益、客流、票卡信息和维修等管理的要求。根据数据挖掘技术的知识类型和任务目标,将数据挖掘技术应用于AFC系统,主要可以实现数据统计和信息预测分析,其主要过程是从以下几个方面进行:
3.1 数据信息调研
3.1.1 资料收集
收集源系统源、系统需求文档、操作手册、表结构说明书、代码值、样本数据和建库脚本。
3.1.2 系统与表级调研
(1)了解系统架构、功能、业务以及各个业务功能之前的的关系。
(2)了解系统的表结构,以及表与表之间的主键关系。
3.1.3 字段级调研
(1)了解源系统的字段业务含义。
(2)对系统主要字段进行研究初步帅选出有用字段。
3.1.4 样本数据分析与ER图复原
(1)通过分析样本数据验证前期调研的结果、分析表间关系。
(2)数据质量的一般性检查。
(3)确定代码表取值范围。
3.1.5 信息调研报告编写
(1)根据调研结果及入仓策略帅选入仓范围。
(2)基于信息调研结果编写信息调研报告。
3.1.6 信息调研报告评审
(1)分析系统确认信息调研报告,主要确认入仓范围。
(2)评审信息调研报告。
3.2 数据模型的建立
数据模型概念设计包括五个步骤,各主题迭代进行,并不断优化形成最终的概念模型设计与概念模式设计说明书。
3.2.1 主实体数据准入
确定源系统数据入个主题主实体原则、范围。
3.2.2 实体分类
(1)确定个主题主实体的分类标注。
(2)根据分类标准建立主实体的数据分类。
(3)分类要求:分类标准明确统一,分类全面,扩展性强,便于理解。
3.2.3 ID生成规则
(1)制定各类编号的生成规则。
(2)要求:无业务含义,根据源系统的字段生成,预留足够程度便于扩展。
3.2.4 数据整合
(1)对分布在各源系统的主数据的归并。
(2)建立分布在各源系统的业务数据间的关系。
3.2.5 历史数据
确定各主题需保存历史的信息,便于追踪其历史变化的痕迹。
3.3 数据统计
3.3.1 收益数据统计
收益信息的统计是对运营收入信息的统计,主要包括车站级各类设备售卖情况的统计、中央级各类设备的交易数据和审核数据的统计。
3.3.2 客流信息统计
(1)客流统计量通常有进站客流、出站客流、换乘客流统通过对闸机交易数据进行统计分析,反应各个车站交通客流的特征,帮助客运组织优化、票务组织优化、实现行车组织优化、设备布局优化等从而科学的指导公司运营组织方案。
(2)特殊节假日客流分析,通过对特殊节假日客流的分析来实施公司的运输组织方案。
3.3.3 数据完整性统计
为了确保AFC系统数据的完整性主要从交易文件的连续性、交易流水号的连续性和设备数据文件上传时间的延续性等几个方面进行统计分析。
3.3.4 数据异常信息的统计
(1)统计交易文件中线路、车站、交易类型、票种、交易时间等的合法性。
(2)统计异常交易文件,如MAC、TAC错误的文件。
(3)统计设备审计文件AR值的累计情况,是否有跳变、重置、清零的情况。
(4)统计审计文件AR值的合法性,是否有负数、较大数值。
(5)统计UD与AR的差异情况,对每笔差异能自动分析其原因。
(6)统计SC、LC、ACC按设备、票种、交易类型统计的交易总笔数及总金额,对笔差异自动分析其原因。
3.3.5 票卡信息的统计
票卡信息的统计包括票卡的流动、使用情况、库存分类、库存调拨等情况,反映了各级管理中心库存状态的变化和各个车站对票卡的需求,是票务管理实施的基础。
4 结束语
为了进一步提高南京地铁运营的管理水平和智能化程度,我们把数据挖掘技术引入到我们的票务管理系统中,本文主要从整体上阐述了引入数据挖掘技术的背景、数据挖掘技术的概念、数据挖掘的方法以及数据数据挖掘技术在我们AFC系统的具体实际应用,使的我们南京地铁运营管理更加信息化,自动化和智能化。
电子技术与软件工程2016年18期