基于收费数据的高速公路行程时间可靠性估计模型

2016-02-14 01:27张腾月翁小雄
关键词:收费站正态分布货车

张腾月,翁小雄

(华南理工大学土木与交通学院,广东广州510640)

基于收费数据的高速公路行程时间可靠性估计模型

张腾月,翁小雄

(华南理工大学土木与交通学院,广东广州510640)

高速公路收费数据易于获取,且蕴含多种交通信息。本文利用收费数据分析高速公路客货车行程时间分布,提出客货车行程时间分布的差异,分别构建客货车行程时间可靠性估计模型,并对模型进行试验分析。利用MATLAB对直接求取的客货车行程时间和模型求取的客货车行程时间进行正态分布和对数正态分布曲线拟合,结果表明:客货车的行程时间分布均符合正态分布;利用本文模型求取的行程时间分布比直接使用出入口收费站时间差求取的行程时间分布具有更小的SSE和RMSE以及更大的R-square。最后,对客货车行程时间的可靠性区间,即置信区间进行比较,结果表明:在同一置信水平下,利用本文模型求解的行程时间具有更小的行程时间区间分布,即更好的稳定性。

高速公路收费数据;行程时间;可靠性估计;正态分布;对数正态分布

0 引言

交通拥挤不仅会对经济产生负面影响,同时也会带来生活质量下降、资源浪费、环境污染等各种问题。随着我国经济突飞猛进的发展,全国车辆保有量也呈现持续上升的趋势,但由于我国高速公路时空分布的差异性,高速公路常发性拥挤问题日益突出,因此需要对高速公路行程时间分布特征进行研究,以便为道路决策者和使用者提供可靠的行程时间,合理控制出行,以减少交通拥挤或事故的发生。

目前,国内外学者对高速公路行程时间的研究主要是利用GPS数据[1]、铺设线圈检测器数据[2]等设施。然而,新增检测设施成本高、维护不便且维修不及时容易引起信息缺失。高速公路行程时间的研究需要持续性完整的数据作为支撑,而我国高速公路采用封闭式收费,可以在不新增检测设施建设投入的情况下,实现对高速公路行程时间的准确估算,恰恰满足这一要求,所以利用高速公路收费数据对高速公路行程时间进行估计既可行又有现实意义。

国内外学者在行程时间的分布上也做了相关研究。Arezoumandi[3]通过分别分析伽马分布、最大极值分布、Log-logistic概率分布、对数正态分布及威布尔分布与一天行程时间数据的拟合程度,得到了可变限速情形下行程时间的分布服从对数正态分布。朱彦等[4]使用浮动车数据计算出城市快速路各路段在不同时段的行程时间,再采用统计分析方法得出目标路段在相同时段下行程时间的分布规律,并对相同时段不同路段、相同路段不同时段的行程时间分布测度进行对比分析。王翔等[5]提出收费数据补全算法,解决了当收费站间缺少收费数据而无法获取行程时间的问题。

上述方法在研究高速公路行程时间的时候,按照车型来研究或者不分车型来研究,未考虑客货类型的差异性。因此,本文以高速公路收费数据为依托,利用SPSS统计分析软件对高速公路客货车行程时间的时空分布规律进行研究,提出客货车行程时间分布的时空差异性,以高速公路MTC和ETC数据进行融合[6],构建客货车不同的行程时间估计模型。最后,利用MATLAB对客货车行程时间进行正态分布和对数正态分布的分布拟合[7],并比较其置信区间。

1 收费数据处理

我国高速公路采用封闭式收费方式,在高速公路出入口均设置收费站。早期按照车型和行驶里程收费,但随着新形势的变化,国家对现行多年的收费政策做了重大改革和调整,改为按照计质量收费的方式进行,即“标准车型、标准装载、标准收费;标准车型、超额装载、超额收费”的原则实施,更加充分地体现了通行费收取的公平性、合理性和科学性。收费数据结构如表1所示,在出入口客货标识中,0表示启用计质量收费前未加区分的车辆,1表示客车,2表示货车。

表1 收费数据结构

海量的数据蕴含丰富的信息,但由于采集设备不稳定、数据传输的不可靠、数据存储不合理等因素导致数据质量亦不容乐观。同时,研究内容的不同也会引起数据使用者所需数据结构的不一致。因此,在分析数据前对数据进行按需抽取、过滤筛选、数据修复等操作就显得尤为重要。收费数据预处理流程图如图1所示。

图1 收费数据预处理流程图Fig.1 The preprocessing flow chart of toll data

2 客货车行程时间分布

本文对广州某高速公路路段2015年12月15日客货车行程时间分布进行分析,采用四分位法进行数据预处理,5 185条收费数据中有271条数据不满足要求,剩余4 914条数据。其中上下四分位点的差值B=M0.75-M0.25=134,数据筛选区间A=[M0.25-1.5B,M0.75+1.5B]=[58,594],客货车筛选前后行程时间分布图如图2和图3所示,可以看出客货车行程时间存在时空差异性。

图2 客货车行程时间分布图Fig.2 Travel time distribution for passenger car and freight car

图3 四分位法处理后的客货车行程时间分布图Fig.3 Travel time distribution for passenger car and freight car processed by quartiles

对站间距离3.9 km的某两个站间数据进行四分位法筛选后的客货车行程时间分布图如图3所示。从图3中可以看出:

(ⅰ)在空间分布上,客车的行程时间普遍低于货车的行程时间,具体来看00:00:00—06:00:00,客车的行程时间区间为2.5~4 min,货车的行程时间区间为4~5.5 min;06:00:00—15:00:00,客车的行程时间区间为3.5~5.5 min,货车的行程时间区间为4~7 min;15:00:00—19:00:00,客车的行程时间区间为5.5~7.5 min,货车的行程时间区间为7~9.5 min;19:00:00—23:59:59,客车的行程时间区间为3~5 min,货车的行程时间区间为4~7 min。

(ⅱ)在时间分布上,00:00:00—06:00:00,货车的流量较大,因为货车通常夜间行车;07:30:00—10:00:00,客货车的行程时间均呈上升趋势,早高峰出现在09:00:00—10:30:00;13:00:00—15:00:00客货车的行程时间持续呈现上升的趋势,在15:00:00—19:00:00行程时间趋于稳定,迎来了晚高峰,在这段时间内,客车流量明显多于货车流量;19:00:00—23:59:59客货车的流量较晚高峰明显下降。

3 客货车行程时间模型的构建

3.1 客货车行程时间的求取

在求取两收费站间行程时间的过程中,会出现在统计周期内没有车辆经过导致行程时间无法求取或车辆偏少[8]导致行程时间随机性较大的情况,这些因素都会成为行程时间分布求取的障碍。鉴于此,本文提出进行上下游递推求取和直接按照所求收费站间经过车辆求取并举,并在同一统计周期内利用四分位法对行程时间进行筛选,对满足条件的行程时间进行平均的方法对两收费站间的行程时间进行推导。

驶入和驶离高速公路收费站匝道的行程时间不同,故两收费站间的行程时间可表述为驶入匝道的行程时间、主线行程时间、驶离匝道的行程时间3个部分组成,即:

对上游而言,推导公式如下:

假设在第k个统计周期中,收费站上游满足条件的收费站有m个,则:

(1)

同理,对下游而言,假设在第k个统计周期中,收费站下游满足条件的收费站有n个,则:

(2)

则广义上,两收费站间行程时间可以表示为:

3.2 客货行程时间的差异

驶入收费站时,由于车辆在驶入匝道时有起步加速阶段和匀速阶段,但起步加速阶段时间ta很短,此处忽略不计,将车辆近似看做匀速运动,车速以该收费站限制标牌所示速度Vin(i)计,Lin(i)为收费站i的匝道长度,t表示客货车类型,其中t=p代表客车,t=c代表货车,即:

驶离收费站时,行程时间主要包括车辆正常行驶时间和人工收费(MTC)排队时间,由于ETC车道往往通行时间较少,客车的排队延误时间由MTC与ETC车道车辆的行程时间差弥补,而货车只有MTC数据,则:

其中在第k个周期内,客车的TMTC(r,i)和TETC(r,i)应符合:tk≤TMTC(r,i)≤tk+1且tk≤TETC(r,i)≤tk+1;且在不同的统计周期内,求取|TMTC-TETC|的分布以确定其上下阈值[9],对满足条件的数据进行MTC和ETC数据融合,对不满足条件的利用阈值进行修复即可。

4 实例分析

以2015年12月15日广州某高速公路连续9个收费站的收费数据为依据,分别利用直接计算两收费站时间差和利用本文第3节中提到的模型计算相同2个收费站的行程时间,以统计周期15 min求取客货车行程时间分布,比较分布拟合的优劣以及行程时间置信区间的大小。

利用SPSS直接求取的客车行程时间分布图和利用模型求取的客车行程时间分布图,如图4和图5所示。

利用MATLAB对直接求取的行程时间和利用模型求取行程时间进行分布拟合,拟合结果比较如表2所示。从表2中可以看出:

①对客车的行程时间进行分布拟合时,正态分布的拟合[10]具有更小的SSE和RMSE(即误差更小),以及更大的R-square[11](即正态分布拟合的相似度更高);

②在利用真实收费数据确定了客车行程时间分布的前提下,对模型求取的方法和直接求取的方法进行对比,结果表明:模型求取的结果比直接求取具有更小的SSE、RMSE和更大的R-square,即模型求取的结果拟合度更高。

对客车行程时间的置信区间进行求取并比较,如表3所示。从置信区间可以看出:模型求取的区间长

图4 直接求取的客车行程时间Fig.4 Travel time for passenger car calculated directly

图5 模型求取的客车行程时间Fig.5 Travel time for passenger car calculated by model

拟合方法SSE直接求取模型求取RMSE直接求取模型求取R⁃square直接求取模型求取正态分布194.594.53.6013.240.5150.9006对数正态分布19698.873.6143.3140.51150.896

表3 客车置信区间表

度为165.12,直接求取的区间长度为178.68。模型求取相对于直接求取的置信区间更小,即模型求取的客车行程时间分布更稳定。

正态分布的置信区间:

p=[μ-x1-α/2σ,μ+x1-α/2σ]。

查标准正态分布表可知:置信水平为95%,分位数x1-α/2为1.96。

利用SPSS直接求取的货车行程时间分布图和利用模型求取的客车行程时间分布图如图6和图7所示。

利用MATLAB对直接求取的货车行程时间和利用模型求取货车行程时间进行分布拟合,拟合结果比较如表4所示。从表4中可以看出:

①对货车的行程时间进行分布拟合时,正态分布的拟合具有更小的SSE和RMSE(即误差更小),以及更大的R-square(即正态分布拟合的相似度更高);

②对货车直接求取法进行对数正态分布拟合时,出现R-square为负的情况,说明直接求取的货车行程时间不适合使用对数正态分布拟合。

③在利用真实收费数据确定了货车行程时间分布的前提下,对模型求取的方法和直接求取的方法进行对比,结果表明:模型求取的结果比直接求取具有更小的SSE、RMSE和更大的R-square,即模型求取的结果拟合度更高。

对货车行程时间的置信区间进行求取并比较,如表5所示,模型求取的区间长度为234.92,直接求取的区间长度为290.58。模型求取相对于直接求取的置信区间更小,即模型求取的货车行程时间分布的置信区间更稳定。

图6 直接求取的货车行程时间Fig.6 Travel time for freight car calculated directly

图7 模型求取的客车行程时间Fig.7 Travel time for freight car calculated by model

拟合方法SSE直接求取模型求取RMSE直接求取模型求取R⁃square直接求取模型求取正态分布175.7094.824.4193.2460.55840.8470对数正态分布659.50102.108.5613.368-0.65720.8352

表5 货车置信区间表

5 结论

本文依托高速公路收费数据,分析客货行程时间的时空差异性,分别构建了基于收费数据的高速公路客货行程时间估计模型。本文第3节模型的提出主要针对在实际道路条件限制下无法通过实验直接求取路段行程时间的情况,对路段行程时间的估计。在本文第4节中,分别将客货车直接求取的行程时间分布和模型求取的行程时间分布进行分布拟合并比较其概率性分布区间。结果表明:利用真实车辆收费数据对客货车行程时间分布进行拟合,在确定为正态分布的前提下,对客车的行程时间进行分布拟合时,利用本文模型求取正态分布拟合的优越性R-square为0.900 6;对货车的行程时间进行分布拟合时,利用本文模型求取正态分布也有较好的拟合效果,R-square为0.847 0。正态分布下的本文模型求取的客车置信区间长度为165.12; 货车置信区间长度为234.92。从数据中可以看出正态分布下本文模型求取的客车行程时间分布相比货车的行程时间分布具有更好的拟合效果以及更好的稳定性。造成这种现象的原因可能是由于货车数据过少,701条货车收费数据经过四分位法筛选后的一天数据仅有675条,而客车筛选后的数据有4 234条。后续工作进一步将车型考虑在内,研究不同车型行程时间分布的相似性和差异性,为行程时间分布的研究提供数据支撑。

[1] 常安德. 基于GPS浮动车的路段行程时间采集方法研究[D].长春:吉林大学,2009.

[2] 刘克. 高速公路的路段行程时间估计与预测方法研究[D].北京:北京交通大学,2013.

[3] AREZOUMANDI M. Estimation of travel time reliability for freeways using mean and standard deviation of travel time[J]. Journal of Transportation Systems Engineering and Information Technology, 2011, 11 (6):74-84. DOI:10.16097/j.cnki.1009-6744.2011.06.024.

[4] 朱彦,曹彦荣,杜道生.城市快速路行程时间的统计分析与预测[J].交通运输工程与信息学报,2009,7(1):93-97,103.

[5] 王翔,陈小鸿,杨祥妹. 基于K最近邻算法的高速公路短时行程时间预测[J]. 中国公路学报,2015,28(1):102-111.

[6] 赵建东,王浩,刘文辉. 高速公路旅行时间的自适应插值卡尔曼滤波预测[J]. 华南理工大学学报(自然科学版),2014,42(2):109-115.

[7] 杨晓光,张汝华,储浩,等. 基于高速公路收费系统的交通信息采集与处理基本问题研究[J]. 系统工程,2004,22(11):4-11.

[8] 杨庆芳,马明辉,梁士栋,等. 基于收费数据的高速公路交通状态判别方法[J]. 华南理工大学学报(自然科学版),2014,42(12):51-57,76.

[9] 赵建东,王浩,刘文辉,等. 基于收费数据的高速公路站间旅行时间预测[J]. 同济大学学报(自然科学版),2013,41(12):1849-1854. DOI:10.3969/j.issn.0253-374x.2013.12.014.

[10] 胡尚瑜,丁九成,李秋胜. 基于Bootstrap方法的近地风剖面参数分析[J]. 广西大学学报(自然科学版),2015,40(4):856-861. DOI:10.13624/j.cnki.issn.1001-7445.2015.0856.

[11] 李长城,文涛,刘小明,等. 基于高速公路收费数据的行程时间可靠性模型研究[J]. 公路交通科技,2014,31(12):110-115. DOI:10.3969/j.issn.1002-0268.2014.12.018.

(责任编辑 黄 勇)

Reliability Estimation Model of Freeway Travel Time Based on Toll Data

ZHANG Tengyue,WENG Xiaoxiong

(School of Civil Engineering and Transportation, South China University of Technology,Guangzhou Guangdong 510640, China)

Mass freeway toll data contain various traffic information and are readily available. This paper analyzes the difference of travel time distributions of freeway passenger car and freight car and constructs different reliability estimation models for them. Then the paper fit above data with normal and lognormal distributions using MATLAB. The result shows that it’s acceptable to analyze the distributional characteristics of travel time for passenger car and freight car with normal distribution. The SSE, RMSE, and R-square of travel time distribution are better by model method than those by direct method. Finally, the reliability interval of both types of cars are compared and the result shows that it is more stable with model method under the same probability.

freeway toll data; travel time; reliability estimation; normal distribution; lognormal distribution

10.16088/j.issn.1001-6600.2016.04.011

2016-04-21

国家自然科学基金资助项目(51308227);广东省交通运输厅科技项目(科技-2015-02-076)

翁小雄(1958—),女,浙江杭州人,华南理工大学教授,博导。E-mail: ctxxweng@qq.com

U491

A

1001-6600(2016)04-0070-08

猜你喜欢
收费站正态分布货车
江苏20个高速收费站实施“准自由流”改造
浙江首个“云收费站”投用
关于n维正态分布线性函数服从正态分布的证明*
偏对称正态分布的若干性质
基于Spark的高速收费站大数据系统的设计与实现
智能OBU在货车ETC上的应用
一种收费站排队模型的模拟实现
货车也便捷之ETC新时代!——看高速公路货车ETC如何实现
推货车里的爱
正态分布及其应用