用BP-PLS方法评价城市路侧带行人服务水平

2014-03-01 02:53嘉,邓
关键词:因变量服务水平行人

李 嘉,邓 敏

(1.西安市政设计研究院,陕西 西安 710068;2.合川区市政设施管理处,重庆 401520)

当下,世界各国的城市交通领域均在提倡节能减排、绿色出行,而步行又是其主要的形式,因此步行交通系统的服务水平高低在一定程度上决定了城市的发展。路侧带作为城市居民步行主要的交通设施,其服务质量的好坏直接影响着城市步行交通系统的服务水平,该服务质量通常用行人服务水平(Pedestrian Level of Service,PLOS)进行评价。国外对PLOS做了很多研究,具有代表性的有通过行人通行能力对路侧带PLOS进行评价[1],通过研究环境因素对路侧带行人服务水平的影响,提出定性和定量指标进行评价[2],及通过对步行舒适度和安全感的定性、定量分析对PLOS进行评价[3]。国内对PLOS的研究较少,一些学者以行人密度、速度与流量为主要指标,提出了划分等级标准的评价方法。这些方法大多采用多元线性模型计算PLOS评分进行评价,而各评测变量相互间多为非线性关系,多元线性模型无法准确处理其间的关系,且传统评分不能全面体现使用者的满意程度,使评价精度降低。笔者引入满意度评测中使用很多的结构方程模型(Structural Equation Model,SEM)[4]建立评测体系,用以反映路侧带行人服务水平,并用BP神经网络偏最小二乘法(Back Propagation Neural Networks-Partial Least Squares,BP-PLS)[5]对PLOS进行评分计算,从而提高评测的精度。

1 研究对象

根据CJJ 37—2012《城市道路工程设计规范》的定义,城市道路车行道两侧的人行道、绿化带以及公用设施带等功能带统称为路侧带。笔者研究对象即为城市道路普通路段路侧带的行人服务水平。

2 行人满意度评测体系

评测行人满意度所采用的结构方程模型是一种建立、估计和检验因果关系的模型,是由外部观测样本和内部结构模型组成,可同时考虑并处理多个因变量。模型中自变量(感知质量)既包含可观测的显在变量,也可能包含无法直接观测的潜在变量。因变量包括满意度和忠诚度两个方面,Anderson模型和Kano模型分别反映了满意度和忠诚度、满意度与感知质量的非线性关系,如图1。

图1 Anderson模型及Kano模型Fig.1 Anderson model and Kano model

根据结构方程模型的组成,设外部观测样本包括p个自变量(评价指标)(x1,x2,…,xp)和q个因变量(评价结论)(y1,y2…,yq);内部结构模型与之对应的包括m个潜在自变量(α1,α2,…,αm)和1个潜在因变量β。对应模型结构如图2。

图2 行人满意度评测体系Fig.2 Evaluation system for pedestrian satisfaction

由于结构方程模型在建模时对模型中各变量之间的关系均采用线性假设,而满意度评价中各变量之间通常为非线性关系(图1),因此线性拟合会造成评估精度的降低。笔者用BP神经网络偏最小二乘法(BP-PLS)对各变量之间的关系进行非线性拟合,可以解决线性模型难以合并交互作用,不能处理定性数据和数据缺失的问题。

3 BP-PLS建模

3.1 建模思想

BP网络是一种多层前馈型神经网络,它主要被应用于函数逼近、时间序列预测及模式识别。BP网络算法首先是选取一组随机数作为网络的初始权值,再任意试取网络的隐含层节点数和层数。若初始权值和隐含层节点数取值不当,将会导致网络陷入局部极小,使网络训练速度减缓。偏最小二乘法是一种新型的多元统计数据分析方法,是S.Wold,等[6]在1983年首次提出的。它将多元线性回归分析、典型相关分析和主成分分析结合起来,能够处理多个因变量对多个自变量的建模问题,能够克服变量多重相关性在系统建模中的不良作用。

笔者利用BP网络算法能较好地拟合非线性数据的特性,通过偏最小二乘法确定BP网络的初始权值、隐含层数以及隐含层节点数,从而构建一个基于非线性迭代偏最小二乘的BP网络模型。该模型的优势在于能有效地确定网络的初始权值、隐含层数及隐含层节点数,降低迭代次数,避免局部极小,使网络计算精度最优化。

3.2 偏最小二乘(PLS)原理与方法

PLS方法主要基于主成分回归思想,首先寻求原始自变量x=(x1,x2,…,xp)的线性函数,分析它们与因变量y=(y1,y2…,yq)之间的相关性,选择既便于计算,又与因变量相关性强的线性函数x,最后将新得到的自变量与因变量进行回归。由于它只偏爱与因变量有关的变量,所以未考虑全部的x1,x2,…,xp线性函数[7]。

PLS回归是在x与y中分别提取成分t1和u1(其中t1是x1,…,xp的线形组合,u1是y1,…,yq的线形组合)。此时的t1与u1间具有相关程度最大、携带各自数据中变异信息程度最多等特点。

第1遍提取成分t1和u1后,回归算法分别进行x对t1及y对u1的回归运算。若回归结果满足预先设定的精度要求,则停止运算;若不能满足要求,算法,则用x被t1解释后的残余信息,和y被t1解释后的残余信息进行第2遍成分提取。通过若干次循环,算法将自动比对,判断回归结果是否满足预先设定的精度要求。

PLS模型由求外部关系和内部关系组成,x与y的外部关系有:

(1)

(2)

式中:T,U分别为x和y的主成分向量;P,Q分别为x和y的荷载矩阵;E,F分别为残差矩阵。

x与y的内部关系针对每个成分有:

(3)

(4)

PLS模型回归具体步骤如下:

1)首先对数据进行标准化处理。x经处理后的矩阵记为E0=(e01,e02,…,e0p)n×p,y经处理后的矩阵记为F0=(f01,f02,…,f0q)n×q。

4)求得w1和c1后,可得到成分t1=E0w1和u1=F0c1,再分别求E0,F0对应t1,u1的3个回归方程:

E0=t1p1′ +E1

(5)

(6)

F0=t1r1′ +F1

(7)

5)用交叉有效性检验增加成分t是否能够显著改善边际贡献值:

(8)

6)提取主成分个数及x,y的荷载矩阵P,Q。

3.3 BP-PLS模型

1)将原始自变量和因变量分为学习样本和测试样本两部分。设原始自变量学习样本矩阵x=(x1,x2,…,xp)和原始因变量学习样本矩阵y=(y1,y2…,yq)分别为BP网络的输入矩阵和输出矩阵。

2)用MATLAB内置函数对原始数据矩阵进行预处理,按先前所提及的PLS模型回归方法逐步计算得到主成分个数、各主成分的系数回归矩阵b以及荷载矩阵。

3)用主成分数作为BP网络的隐含层节点数,用x,y的主成分荷载矩阵P,Q作为网络输入层和输出层的运行初始矩阵,用x,y作为神经网络的输入和输出矩阵[8]。

4)构建BP-PLS模型(图3),设定误差目标值,利用学习样本训练网络。

图3 BP-PLS三层前馈神经网络示意Fig.3 BP-PLS three-layer feed forward neural network

5)网络训练完成后,返回步骤1)~步骤3),求测试样本矩阵相应的主成分数及各矩阵。

6)将求得的测试样本各数据逐一对应输入训练后的网络,求得针对测试样本的预测值。

4 模型实例分析

为了验证BP-PLS模型在路侧带行人服务水平(PLOS)评价中的有效性,利用文献[9]的案例进行分析。案例中调查人员通过不同时段实景拍摄、问卷调查(受访者包括不同年龄阶段)和专家评测,对主城区内2条主干路10个路段街区的路侧带进行了行人服务水平的评价研究,得出反映行人满意度和行人忠诚度的评分。

笔者按照行人满意度评测体系,对案例中的各评价指标进行了归纳、分解,得到3个潜在自变量指标:行人安全感知、行人舒适感知与步行空间效用感知,分别对应10个显在自变量指标(x1,x2,…,x10),如表1;因变量指标则包括行人满意度得分和行人忠诚度得分(y1,y2)。因此,利用BP-PLS模型则有10个输入因子,2个输出因子。选取10组调查数据,其中8组作为神经网络学习数据,2组作为测试数据。

表1 行人服务水平评价指标

1)首先对学习数据进行预处理,利用MATLAB计算得到交叉有效性判别结果,见表2。

表2 交叉有效性判别

2)构建BP 三层前馈神经网络。根据第1)步求得的结果确定网络结构为10-2-2。输入层采用S型函数,输出层采用线性函数,x,y的主成分荷载矩阵P,Q分别为输入层和输出层的初始权值,用量化共轭梯度transcg()函数训练网络。

3)通过迭代计算49次,误差达到目标值要求。利用训练后的网络对测试数据进行预测。

4)分别用PLS方法、BP模型以及BP-PLS模型对两组测试数据分别进行预测,通过测定系数R2对预测精度进行检验,结果见表3。

表3 3种方法R2比较

注:表内数值为测定系数R2的值,R2越接近1,说明预测值越接近实际值。

从表3可以看出,3种方法拟合结果BP-PLS模型优于PLS方法与BP模型,说明BP-PLS模型有比较好的拟合、预测功能。

5 结 语

用BP-PLS对路侧带行人服务水平的进行评价。该方法将神经网络与偏最小二乘法结合起来,首先利用神经网络能够很好地解决变量间非线性关系的特点,弥补了结构方程模型的不足;其次,用PLS法提取原始样本的主成分权值作为BP网络的初始权值,提取主成分数作为BP网络隐含层的节点数,有效地提高了网络的收敛速度,降低了迭代次数,很好地描述了因变量与自变量之间的关系,更易于解释神经网络本身的含义。

从案例的预测结果可以看出,BP-PLS模型的预测精度最高,误差最小,对实测数据具有较高的拟合精度和很好的预测效果。因此,可以作为一种行人服务水平评价方法。

[1] Fruin J J.Pedestrian Planning and Design [R].New York:Metropolitan Association of Urban Designers and Environmental Planners,1971.

[2] Dixon L B.Bicycle and pedestrian level-of -service performance measures and standards for congestion management systems[J].Transportation Research Record: Journal of the Transportation Research Board, 1996, 1538: 1-9.

[3] Landis B W,Vattikuti V R,Ottenberg R M, et al.Modeling the roadside walking environment: pedestrian level of service [J]. Transportation Research Record:Journal of the Transportation Research Board, 2001, 1773(1): 82-88.

[4] Stuart K R,Meduiek M,Bockman J.Structural equation model of customer satisfaction for the New York City subway system [J].Transportation Research Record, 2000, 1735(1): 133-137.

[5] Holcomb T R,Morari M.PLS/ neural networks [J].Computers & Chemical Engineering, 1992, 16 (4): 393-411.

[6] Wold S,Martens H,Wold H.The Multivariate Calibration Problem in Chemistry Solved by the PLS Method [M].New York: Springer Berlin Heidelberg,1983.

[7] 王惠文.偏最小二乘回归方法及其应用[M].北京:国防工业出版社,1999.

Wang Huiwen.Partial Least-Squares Regression-Method and Applications[M].Beijing: National Defense Industry Press,1999.

[8] Qin S J,McAvoy T J.Nonlinear PLS modeling using neural network [J].Computers & Chemical Engineering, 1992,16(4): 379-391.

[9] Dowling R, Reinke D, Flannery A, et al.Multimodal Level of Service Analysis for Urban Streets [R].Washington D.C.:Transportation Research Board, 2008.

猜你喜欢
因变量服务水平行人
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
遂宁市:提升社保服务水平 夯实保障民生基础
聚焦内审转型升级 提升增值服务水平
毒舌出没,行人避让
加强图书馆管理 提高服务水平
适应性回归分析(Ⅳ)
——与非适应性回归分析的比较
路不为寻找者而设
提升粮食流通社会化服务水平的举措构思
偏最小二乘回归方法
我是行人