中小学校放学家长接送概率建模分析

2015-05-08 09:11史文君李文权童小龙
交通信息与安全 2015年2期
关键词:参数估计赋值概率

史文君 李文权 童小龙

(东南大学交通学院 南京210000)

0 引 言

近年来,随着城市机动化的不断发展以及人们生活水平的不断提高,越来越多的中小学生家长在考虑安全便捷等因素下,多选择接送子女上下学。

由于城市居民机动车保有量持续上升,接送子女上下学的交通方式中,私家车占有的比例也越来越高。随之而来的接送出行逐渐成为影响城市交通流高峰期道路交通拥堵的重要因素,由于中小学上下学与市民上下班在时间上存在很大一部分的重合,高峰时间接送出行和上下学出行产生的混合交通流进一步加重了道路交通的拥挤程度;另一方面,目前大多学校门前空间紧缺,在上下学高峰时间接送人员和车辆积聚在狭小的校门附近区域,进而造成校门口的拥堵,并且随着时间的推移其负面效应逐渐波及周边道路,造成学校区域范围内道路的瓶颈效应。因此,研究中小学生上下学伴随的接送出行特征,从出行特征的影响因素及其对道路交通的影响效果入手,可以做到对症下药,从源头上解决接送问题带来的负面效应。

就国内研究现状而言,韩娟等[1]利用分层抽样的OD调查数据分析了中小学生上下学的出行特性,对比分析了国内外各年龄段中小学生的上下学接送比例;何峻岭等[2]以武汉市为例,将调查对象中小学进行分类,分别抽样调查了重点小学、一般小学和中学3类学校的出行交通结构和出行时耗等特征;在理论方面的研究较为先进的付凌峰等[3],根据居民出行数据建立了上学接送行为的二项Logistic模型,但其考虑因素较少,在模型的完备性上还有所欠缺;国外S.MüLLER等[4]利用多元Logit方法对学生上下学交通方式的选择进行建模;M.Schlossberg等[5]研究了城市形式和距离因素对学生上下学出行方式选择行为的影响。总的来说,国内的研究侧重于基于调查的定性分析,通过现象和数据分析接送行为的影响和客观特征;而国外的研究则侧重于以接送行为作为主体进行建模分析,理论性更强但实用性和适用性不高。

在现状研究的基础上,笔者根据南京市某小学的接送出行调查数据,分析影响中小学校学生上下学接送行为的影响因素并建立接送概率的Logistic模型,分析模型变量的显著性和综合影响效果,最终结合实例分析模型适用性。

1 接送概率分析和调查

1.1 接送概率影响因素分析

中小学生上下学伴随而来的接送出行行为特性主要包括:家长接送可能性(接送概率)、家长接送采取的交通方式(即方式划分特性)、接送交通流的时间分布特性(包括接送交通流的到达时间和持续时间分布特性)这3个方面。

接送概率特性。指在特定学校、特定学生年龄等内外因素影响下,家长选择是否接送子女上下学的概率特征,该特性直接影响在相同控制条件下,到达学校的接送总人数,直接体现接送交通流的总量。家长是否接送特性受学生年龄、家与学校距离、学校上下学时间、家长职业、学生性别、家庭年收入等因素影响。除了这些直接影响因素之外,一些间接的影响因素也是导致接送行为差异的重要因素如:学校类型、城市类型、公共交通便捷程度等等。

1.2 影响因素调查

针对所需分析的影响因素和建模要求。本研究于2012年13月对南京市某实验小学开展了学校接送行为调查,该校学校的学生数为3 520人,针对各个年级进行分层抽样,调查的各项参数见表1。

表1 问卷发放和回收情况统计表Tab.1 Questionnaire distribution and recovery statistics

2 接送行为建模

为了进一步研究上文所述影响因素对接送行为的具体影响,笔者选取接送行为特性之一的接送概率特性进行建模分析,其他2个特性的建模方法与之类似。研究对象接送概率仅包括有和无2个属性,因此最适用描述该对象特征的付凌峰等[3]所提到研究中为二项Logistic模型,然而该模型仅考虑了变量为线性关系的情况,其模型的完备性还有所欠缺,笔者将在此基础上对该模型进行改进。

2.1 模型建立

分析对象为中小学生上下学的接送行为。接送行为为二分类变量,其属性有:接送和不接送2种。通过对比各种类型的回归模型的适用性和算法特征可知,建模对象变量不是数值而是反映接送行为的2个属性,因此采用二值Logistic模型进行行为建模并假设模型满足以下条件。

1)条件概率P(y=0|h)。其中:y=0为上下学家长不接送;h为影响接送行为的因素)的值连续,但它的变化范围仍在(0,1)。

2)考虑P(y=0|h)的严格单调增函数(连接函数),当P(y=0|h)的在(0,1)变化是,值在(-!,+!)变化。

模型定义变量接送问题为JS,则

二值的Logistic模型的一般形式为

f()x主要由以下3个部分组成。

1)独立变量的线性部分。x1类变量,主要用于解释单独作用于接送概率的影响因素,且该影响因素的作用可以直接用线性形式表示,即x1i。

2)独立变量的非线性部分。x2类变量,用于解释单独作用于接送概率的影响因素,但是需要通过增加变量的幂次方将模型中的变量改为非线性形式来解决,这类在模型中一般表示xw2j。

3)多个变量的交互部分。x3类变量,表示接送概率模型中多个变量之间的相互影响,在接送概率模型中用∏dl=1x3kl为2个以上的变量的交互作用。

综合上述3种形式的变量,笔者所建立的接送行为的Logistic模型如下。

模型解释。x1类型的变量有a个(a≥0);x2类型的变量有b个(b≥0),且第j个x2类变量为,其中w为(-!,+!)范围内实数;x3类型变量有c个,第k个该类变量为x3kl,其中d为大于1的整数,表示第k个x3类型变量存在的交互变量的个数,l表示d个交互变量中的第l个。

模型中P(JS=0|x)(下文以p表示)表示在变量因素影响下家长不接送的概率;则家长接送概率Q(JS=0|x)=1-P(JS=0|x(下文以q表示),因此家长接送在上述3种类型因素影响下的概率为

2.2 解释变量分类分析

在建立Logistic模型时回归分析中解释变量主要包括2类:数值变量和属性变量。

1)数值变量。包括连续型取值的数值变量和离散型取值的数值变量。这种类型的变量本身的取值就为数值类型,无需进行二次的赋值;离散型变量根据需要可通过随机数法,将分段离散数据转化为连续数据。

2)属性变量。包括有序的分类变量和无序的分类变量2种。这种类型的变量的值为属性分类,建模时需要将取值转变为实数,通常采用的赋值方法有2种,即简单赋值法和哑变量法(dummy variable)。

具体变量分类取值方法见表2。

表2 解释变量分类取值方法Tab.2 Accessor methods of different variables

2.3 参数估计和模型检验

2.3.1 参数估计

由2.1可知,笔者建立的Logistic回归分析模型的解释变量类型共分为:x1,x2和x33类变量,而后2种变量可通过变量替换将其转化为线性变量,这样本文的Logistic回归模型就可以线性回归的形式进行参数估计。线性回归的参数估计方法一般有:最小二乘估计和极大似然估计等多种方法,各方法的原理和计算过程这里就不赘述。

参数估计的计算过程一般比较繁琐,可以借助SAS或者SPSS等软件辅助进行。

2.3.2 模型检验

Logistic回归模型常见的检验的方法包括:似然比检验(likelihood ratio test,LRT)、Wald检验(wald test,WT)和拉格朗日乘数检验(lagrange multiplier,LM,又称Score检验),基于极大似然法的大样本检验方法。

1)似然比检验。似然比LR统计量:

2)Wald检验。Wald统计量

判别规则同似然比检验。

3)Score检验。

其判别规则同似然比检验。

此外,哑变量的检验可以通过优势比OR来分析变量的每个属性对事件发生的影响能力大小,OR =。判别方法:OR=1,表示因素与事件发生无关;OR>1表示其取值越大,事件发生概率越大;OR<1表示其取值越大,事件发生概率越小。

3 实例分析

本次接送出行调查的对象小学为南京市江宁实验小学,本节将根据接送出行调查的调查数据结合上述模型建立对象学校的上下学家长的接送概率模型。

3.1 变量的选择和取值

由付凌峰[3]、Müller[4]以及 Goeverden等[9]研究成果可以得知,学生年龄、家长职业、小汽车拥有情况以及学校与家庭距离这4个因素对居民是否选择接送的行为具有显著的影响,因此笔者选取这4个因素作为模型的初定变量,具体取值情况见表3。

表3 模型变量对照表Tab.3 Model variables

3.2 模型建立和参数估计

3.2.1 模型建立

为了简化模型的计算过程,这里只考虑x1类变量,接送行为的概率模型形式如下

则接送概率

各变量含义见表2,借助SAS软件,进行参数估计和检验可得b0,b1,b2,b3,b4的值。

3.2.2 参数估计

考虑到家长职业变量为无序定性变量,其赋值方法会影响回归模型变量的显著性和参数估计。因此模型的参数估计将针对职业变量2种不同形式的赋值分别讨论。

1)简单赋值法。职业变量的属性为:离退休、工人、服务员、职员、个体劳动者、家务以及其他等7种。简单赋值法:对应7个职业属性分别赋值为1,2,3,4,5,6,7。其他变量的取值参见表2,根据上述变量分析和调查数据借助进行SAS计算,模型运行结果见表4。

表4 简单赋值法参数估计表Tab.4 Parameters estimation of simple assignment method

由表4可见,JOB变量和CAR变量的卡方检验结果(卡方统计量大于他们的概率均大于0.05)表明这2个变量对接送概率的影响并不显著,事实上并非所有职业对接送概率均不产生影响,这一结果明显与实际情况不符,这是由于简单的数字赋值方法为原本没有等级关系的因素变量人为定义等级,可以看出这种赋值与实际条件吻合度较低,因此该赋值方法不合理。

2)设哑变量。家长职业变量为多分类定性变量,其包含7个属性分别为:离退休、工人、服务员、职员、个体劳动者、家务以及其他。为了避免共线性为该属性设置6个哑变量:job1,job2,job3,job4,job5和job6(分别代表职业属性的前6种),其取值为

根据上述哑变量的设置,二项Logistic模型的形式可以表示为

借助SAS软件,对调查数据进行Logistic回归分析可以获取b0,b1,b2,b3,b4的值。这时接送概率。

通过上述哑变量的重新定义,运用SAS回归得出的结果见表5。

表5 设置哑变量的模型参数估计表Tab.5 Model parameters estimation in the case of setting dummy variables

通过上述参数结果可以看出,XDIS和JOB1变量能够通过卡方检验,且Pr>Chi-Square值小于0.005属于高度显著。由此可知,出行距离、学生年龄因素对学生上学上下学的家长接送行为具有显著影响;且出行距离的系数为负,表示出行距离越远,家长接送概率越高;年龄的系数为正,表示随着学生年龄的不断增大,接送概率越低;从XCAR变量的结果(Pr>Chi-Square 值为0.2031)可以看出,家庭是否拥有小汽车对接送概率的影响并不显著。

3.3 模型修正和检验

3.3.1 模型修正

由3.2节的变量影响显著性分析结果可知,是否拥有小汽车对家长的接送概率影响并不显著,因此笔者在进一步回归中决定剔除XCAR变量,最后得到的接送概率模型和家长接送概率受各种因素影响下的logistic概率方程分别见式(1)和式(2)。

3.3.2 显著性检验和优势分析

由于职业变量设置为6个哑变量,这里采用优势比OR值来分析各职业属性的显著性,对照2.3节中优势比的计算公式得职业变量各属性的优势比见表6。

表6 模型参数的优势比和标准估计对照表Tab.6 Odd ratios and standard estimation of model parameters

由表6可见,JOB1,JOB4以及JOB5的优势比均小于1,表示定义事件(不接送)的概率较低,即家长接送概率较高,暗示离退休、个体劳动者和公司职员相比于其他职业的接送概率较高,其中家庭有离退休老人的情况下,其接送概率为最高。

除了职业变量之外,距离和年龄均为连续性定量变量,这两者和接送概率的关系见图1。

图1 接送概率与距离和年龄关系的三维曲面图Fig.1 3Dsurface figure of the connection between pick-up propability and influential factors(distance and age)

图1 为三维曲面图。由图1可见,接送概率受距离和年龄关系显著影响。在同等水平的年龄变量下,接送概率随学生上的出行距离的增加而显著增加;同等水平的出行距离变量下,接送概率随学生年龄的增加而显著降低,且学校距离每增加1公里,家长不接送概率与接送概率比值的对数值降低0.024 1;学生年龄每增加1岁,家长不接送概率与接送概率比值的对数值增加1.125。

4 结束语

笔者在影响因素分析的基础上提出了接送概率二项Logistic模型,详细讨论了各类模型变量的分类取值方法,最后基于本文研究的理论建立了南京市江宁实验小学的接送logistic模型,模型反映接送概率不仅与接送距离以及学生年龄有着显著相关性,而且与家庭是否有离退休老人这一变量也密切相关。笔者的研究可进一步用于确定特定学校上下学的接送总人数,以此为指标为接送人员提供相应指标的等待空间,从而缓解上下学时间内学校周边的交通拥堵问题。另一方面,本研究所基于的数据仅为南京市的典型学校,数据量的不足可能会影响模型精度,且在建模过程中为了简化模型形式只考虑了x1;类变量;因此在进一步的研究中可以扩大抽样对象,研究不同城市的接送情况,并探讨影响因素作为变量的最合理设置形式,以此修正模型参数,从而提高模型的适用性。

[1] 韩 娟,程国柱,李洪强,等.小学生上下学出行特征分析与管理策略[J].城市交通,2011,9(2):74-79.HAN Juan,CHENG Guozhu,LI Hongqiang,et al.Characteristics and management strategies for commuting trips of primary school students[J].Urban Transport of China,2011,9(2):74-79.(in Chinese)

[2] 何峻岭,李建忠.武汉市中小学生上下学交通特征分析及改善建议[J].城市交通,2007,5(5):87-91.HE Junling,LI Jianzhong.Analysis and impro-vement suggestions on elementary and secondary school commuting traffic chamcteristics in Wuhan[J].Urban Transport of China,2007(5):87-91.(in Chinese)

[3] 付凌峰,吴子啸.基于居民出行数据的上学接送行为建模研究[J].交通标准化,2011,17:029.FU Lingfeng,WU Zixiao.Modeling research on school companion behavior by parents based on resident trip data[J].Transport Standardization,2011,17:029.(in Chinese)

[4] MüLLER S,TSCHARAKTSCHIEW S,HAASE K.Travel-to-school mode choice modelling and patterns of school choice in urban areas[J].Journal of Transport Geography,2008,16(5):342-357.

[5] SCHLOSSBERG M,GREENE J,PHILLIPS P P,et al.School trips:effects of urban form and distance on travel mode[J].Journal of the American Planning Association,2006,72(3):337-346.

[6] BEN-ELIA E,SHIFTAN Y.Which road do I take?A learning-based model of route-choice behavior with real-time information[J].Transportation Research Part A:Policy and Practice,2010,44(4):249-264.

[7] 郭耀武.城市中小学上下学时段交通拥堵的分析与对策:以江门市区为例[J].五邑大学学报:自然科学版,2011,25(1):74-78.GUO Yaowu.An analysis of and countermeasures for urban tramc jam at primary and secondary school students’arrival and departure times:A case study of Jiangmen city[J].Journal of Wuyi Unverslty:Science Edition,2011,25(1):74-78.(in Chinese)

[8] 蒋正容.杭州市幼儿接送行为及其空间需求调查研究[D].杭州:浙江大学,2006.JIANG Zhengrong.Kindergarden pick-up behavior and apace demand research in Hangzhou[D].Hangzhou:University of Zhejiang,2006.(in Chinese)

[9] GOEVERDEN C D V,BOER E D.School travel behaviour in the Netherlands and Flanders[J].Transport Policy,2013.26(0):73-84.

[10] McMILLAN T E.The relative influence of urban form on a child’s travel mode to school[J].Transportation Research Part A:Policy and Practice,2007,41(1):69-79.

[11] 刘爱玲,胡小琪,李艳平,等.我国中小学生上下学交通方式分析[J].中国健康教育,2009,25(1):8-10.LIU Ailing,HU Xiaoqi,LI Yanpin,et al.Modes of transportation to and from school in Chinese elementary and secondary students[J].Chinese Journal of Health Education,2009,25(1):8-10.(in Chinese)

[12] 刘 欣.中小学周边道路交通流特征分析与通行能力研究[D].哈尔滨:哈尔滨工业大学,2010.LIU Xin.Analysis on trffic flow characteristics and study on capacity of road near elementary and secondary school[D].Harbin:Harbin Institute of Technology,2010.(in Chinese)

[13] 叶茂盛.小学生放学后行动特征与城市空间场所的关联性研究[D].合肥:合肥工业大学,2013.YE Maosheng.The study on relationship between urban space and pupils’behavior characteristics after school[D].Hefei:Hefei University of Technology,2013.(in Chinese)

猜你喜欢
参数估计赋值概率
L-代数上的赋值
第6讲 “统计与概率”复习精讲
基于新型DFrFT的LFM信号参数估计算法
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
强赋值幺半群上的加权Mealy机与加权Moore机的关系*
Logistic回归模型的几乎无偏两参数估计
基于向前方程的平稳分布参数估计
利用赋值法解决抽象函数相关问题オ