文/李荣送,广东省高速公路有限公司深汕西分公司
随着经济的不断发展,高速公路已慢慢成为我国重要的交通纽带,在一定程度上提高了经济的发展。从目前来看,我国的高速通车总路程已突破12万km,因此在进行管理和掌控时在一定程度上增加了难度系数。随着我国高速公路的慢慢延伸,高速公路收费系统慢慢走向现代化,使得高速公路的收费成果得到一定程度的提升。使得各系统发生了一些数据上的改变。在对高速公路交通安全应急以及出现服务和市场监督方面实行着重点建设时,就要对高速公路中的数据进行仔细探讨,以此提升高速公路的运营成果以及管理水平。
大数据简单来说是一种想象,并不是一种技术,大数据中的大是指数据体量大,同时是说数据类别大[1]。由于数据来源于许多不同的数据源,目前数据种类的不断增加,使之表现出众多不一样的格式,目前所拥有的数据种类一方面包括结构化数据,另一方面还包括了半结构化数据和非结构化数据。其中结构化信息一直占据着非常主要的领导地位。
高速公路大数据主要有以下几个特点:⑴规模大。当车辆通常收费站时,监控系统都会进行拍照,图片将会占据一定的空间在加上各种应用系统等数据,使得数据规模增大[2]。⑵数据变化多样化。由于高速公路数据品种多样化,有来自应用系统发生的结构化数据以及收费出入口拍摄的一些数据,还有各种服务数目以及地质灾害等数据。⑶数据价值密度较低。虽然数据较多,但有用的数据信息却相当少。在进行监控时会发生很大的数据信息,但能用的信息数据却比较少,因此不同的数据实行检测可以看出路网的不同情况。⑷高速性。当收费站发生数据变化时要快速使之到达结算中心。当在道路中间发生紧急事件时,系统要能准确取得信息并能进行一定的分析。
目前,大数据时代的来临,数据分析中的使用在高速公路数据分析中拥有一定的地位,比如,在进行运营管理和联网收费以及识别偷逃通行费用等方面,都可以通过数据分析获得[3]。通过对收费数据进行分析,对于那些常常计重逃避交费以及持有绿色收费卡违规的现象发生进行了较大力度的检查,并通过对车牌进行抓拍以及对出入口车牌的不一样和超时间以及进行替换卡等问题进行处理。当然也可进行分析四周人口情况以及产业结构和每年经过的车流多少,以此预测流量和大致的收入分析。
我国高速公路的不断发展,联网收费系统拥有较大的收费数据量,使得数据挖掘这一项新的技术能在一定程度上从许多的历史和在线数据中探测中隐藏的联系和发展方向。
目前进行数据挖掘技术最为突出的单位就是与交通行业较为紧密的高校和研究所,然而目前的研究成果主要倾向对整个框架和一些整体的方法进行设计。没有研究人员和单位能有效运用交通行业的特点,对收费书籍中的主题实现更加深入的探讨研究,于此同时将其隐藏在高速公路收费数据中对其有利的数据挖掘出来[4]。总之,高速公路系统虽然在进行改善,并进行积累众多的信息数据,但是有关资源运用的能力还是要进行不断的提升。
高速公路通行费的收费情况进行预测是高速公路在进行路网建设中不可分割的一部分,同时对项目进行实地研究以及国家的交通运输等方面都具有非常重要的作用。目前,我国计算机技术得到质的飞跃,同时添加了众多的方法和相应的软件进行一些交通规划,其中应用比较广泛的有遗传算法以及数据挖掘等相关的技术。
由于我国在进行建设高速公路时,相对来说比较晚,同时在发展方面速度较慢,根据我国相关的预测法规,提出了两种预测方案,一种是较为常见的类比法和平均增长率以及指数曲线等预测模型方法。另一种方案时包括一元回归曲线以及多元回归曲线和趋势曲线法等各种预测法。
目前我国高速公路事业得到质的飞跃,同时使得高速公路的收费问题出现了众多的问题,其中值得注意的是进行计量收费后,司机逃费的方法源源不断,使得通行费用有流失的问题存在[4]。在进行全新的收费环境下,对其进行一定的预测未来收费金钱的趋势,能在一定程度上帮助管理人员更加有效的对高速公路的车流量和收费情况进行分析探讨。
在进行回归分析方案预测中又可以称之为因素分析法,它主要的运行原理是寻找出一个变量和一些当做是变化因素的变量之间的数量关系,简单来说就是建立相关的模型。同时通常一些方法对以后的一些时间的外在变量给出一些数值并将其引入到模型中,计算出变量的未来数值,即我们通常所说的预测值。
通过对大数据分析在高速公路收费管理中的应用进行分析可得,根据车辆流的不确定和高度非线性,可以导致单纯的预测方案,随机性干扰较大,不能进行很好的预测效果,本文通过分析并进行了有效的预测,降低了随机干扰带来的误差,并对以后的收费金额实行了一些准确的预测,旨为高速公路管理提高一些数据支持。怎样正确的选择模型,并解决一些不定时的干扰,可以使得预测更加的准确,值得研究人员进行深入研究。