史 荣,张 琦,唐 凯
(1.西安市城市规划设计研究院,陕西西安 710068;2.西安建筑科技大学土木工程学院,陕西西安 710055;3.西安建筑科技大学粉体工程研究所,陕西西安 710127)
城市老年人群就医出行方式研究
——以西安市为例
史 荣1,张 琦2,唐 凯3
(1.西安市城市规划设计研究院,陕西西安 710068;2.西安建筑科技大学土木工程学院,陕西西安 710055;3.西安建筑科技大学粉体工程研究所,陕西西安 710127)
运用主成份分析法首先确定与老年人群就医出行方式选择高度相关的影响因素,进而通过计算多值logistics回归模型参数得到各种交通方式的分担率,从而达到找出老年人就医出行主要交通方式的研究目的。基于对西安市的问卷调查数据,进一步实证了研究方法的有效性。
老年人群;就医出行方式;主成份分析;多值logistic回归分析
随着我国社会和经济的发展,居民的平均寿命稳步提高, 人口年龄结构已开始出现老龄化趋势。以西安市为例,截至2009年底,城市60岁以上老年人口数为125.68万人,占全市总人口的14.9%,正处于人口老龄化的加速发展期。因此,老年人逐步成为社会关注的焦点。由于生理结构的变化,老年人的出行需求特征发生显著变化,逐步由与谋生有关的出行转化为满足个人和家庭基本生活需要和精神、心理要求而采取的出行,这其中最突出的莫过于因体质下降而激增的就医出行需求[1-3]。因此,对老年人就医出行特征的研究是十分必要[4]。毛海虓,任福田[5]等定性地分析了老年人外出活动的空间地域分布和出行特征,归纳了老年人的出行要求。该文在此基础上引入非集计模型分析,运用定量的方法研究老年人的出行特征。陈团生等[6]根据北京市居民出行调查数据, 利用非集计理论和方法构建的老年人出行选择行为模型, 可从源头上分析影响老年人出行选择行为的个人、家庭、社会及经济背景等因素, 并对老年人出行选择行为进行预测,该文在此基础上着重针对老年人的就医出行特征及其影响因素进行研究。
1.1 主成份分析法
主成份分析法是考察多个变量间相关性的一种多元统计法。它是研究如何通过少数几个主变量来解释多个变量间的内部结构。通常数学上的处理是将原来的p个指标作线性组合,作为新的综合指标。假设有n个样本,测得p项指标(p<n),得到原始数据资料阵:X=(X1,X2,...,XP),协方差矩阵为∑,令协方差矩阵的特征根值为λ1≥λ2≥... λp,所以有Var(F1)≥Var(F2)≥...≥Var(Fp),向量l1l2...lp为相应的单位特征向量,则X的第i个主成份为:
实际问题中往往协方差阵∑未知,这时可以用其估计值S(样本协方差阵)来代替。同时由于指标的量纲不同,所以在计算前往往要消除量纲的影响,而将原始数据标准化,此时:
特征根λ是表示主成份影响力度的指标,代表引入该主成份后可以解释平均多少原始变量的信息。如果特征根小于1,说明该主成份的解释力度还不如直接引入一个原始变量的平均解释力度大。因此一般可用特征根大于1作为纳入标准。方差贡献率Zi的其计算公式为表明该主成份Zi的方差在全部方差中的比重。前k个主成份的累计贡献率定义为 表示前k个主成份累计提取了X1,X2...Xp多少的信息。一般来说,如果前k个主成份的贡献率达到85%,表明前k个主成份基本包含了全部测量指标所具有的信息。这样既减少了变量的个数又便于对实际问题进行研究。
1.2 多值logistic回归分析
logistic回归分析法是寻找自变量与因变量之间关系的一种方法。不是直接分析因变量与自变量的关系,而是分析因变量取某个值的概率与自变量的关系。
Logistic的概率函数定义为式(3),
在上式中只引入了一个自变量,为了取得一般化,对于多个自变量将多元线性组合a+ b1x1+b2x2+...+bkxk以∑bixi。表示,其中常数项a用b0表示,x0恒等于1。然后为了推导的进一步简明,再令z=∑bixi。于是logistic概率函数可以表示为:
如果将上式右侧一项的分子分母同乘一个exp(z),有:
式(5)中,p表示事件发生的概率;1-p表示时间不发生的概率;Ω=p/1-p 表示发生比。对于无序多值logistic回归分析,模型首先会定义因变量的某一水平为参照水平,其他水平均与其相比,建立水平数-1个广义logistic模型。以4水平为因变量为例,因变量水平为1、2、3、4,对p个自变量拟合3个广义logistic模型:
同时p1+p2+p3+p4=1,且可以看出y4成了参照水平。
对于logistic模型整体的检验和回归方程求解参数运用最大拟然估计法。对于回归系数bi的检验通常采用的方法是Wald卡方检验。与大多数统计检验一样,Wald检验值越大表明该自变量的作用越显著。同一行的sig值就是Wald检验的显著度。
1.3 老年人群就医出行方式选择的结合模型
1.3.1 主成分分析与多值logistic回归分析相结合的可行性
采用主成份分析是为了确认理论分析出来的自变量是否均有效。主成份分析法的核心思想是降维,即将原本较多的因素通过重新的线性组合用较少的因素来表达。本文借助调查的手段,得到理论自变量的数据,运用主成份分析法通过降维得到筛选后的主成份。运用主成份对理论自变量进行分析,找出真正有效的自变量。
采用列联分析是为了找出与因变量高度相关的自变量,为之后的多值logistic回归做铺垫。利用回归分析是为了找出因变量和自变量之间的相关关系,采用回归分析中的多值logistic回归是由于多值logistic回归是针对因变量类型为多分类的定类变量的数据,这与该文所研究问题中的因变量类型相吻合。
1.3.2 结合模型的工作流程
本文先采用主成份分析法对理论分析出的影响老年人就医交通方式选择的因素进行分析,找出有效的即确实对交通方式选择有影响的因素。再用列联分析法对上述有效的影响因素进行再次梳理,找出与因变量高度相关的自变量,为之后的多值logistic回归分析奠定基础。具体的流程见图1。
图1 两模型结合进行分析的工作流程图
2.1 数据收集
本次研究的数据收集以向老年人发放调查问卷的形式进行。在西安市的碑林区、莲湖区、新城区、雁塔区、灞桥区、未央区选取居住小区或者公共广场发放问卷200份,回收有效问卷186份,调查有效率为93%。问卷设计中对老年人就医出行方式选择有影响的因素(自变量)有7项,分别是年龄、学历(edu)、家庭人口数、月收入、年就医次数、路上花费时间、路上花费费用。
2.2 主成份分析法
2.2.1 变量处理
主成份分析法要求被分析的变量都为定距变量,然而本次问卷中的变量仍有部分定类变量,于是要把它们首先转换为定距变量。由于本次问卷中的定类变量大部分均是数值型的区间变量,则转换方法即将分类变量变为区间变量的中值型定距数值变量,见表1。
2.3.2 主成份分析
利用SPSS软件在7个自变量中提取了4个主成份来代表这7个自变量。第一主成份的特征根为1.92,它解释了总变异的27.44%;第二主成分的特征根为1.51,它解释了总变异的21.59%;第三个主成份的特征根为1.11,它解释了总变异的15.83%;第四主成份的特征根为1.01,它解释了总变异的14.41%。这四个主成份的特征根都大于1,累计贡献率在80%~85%之间,说明这四个主成份的解释力度都大于原始变量,见表2。
表1 变量的变换
表2 方差分解主成份提取表
第一主成份中,教育年限、月收入、家庭人口数占有较高荷载,说明第一主成份主要反映了被调查者的基本信息。第二主成份中,即在路上花费的时间与路上花费的费用占有较高的荷载,说明第二主成分主要反映了在就医路上的信息。第三、第四主成分中年龄、年就医次数占有较高的荷载,说明第三、四个主成份主要代表了这两个变量的信息,见表3。
综上所述,由于四个主成份的解释力度均大于原始变量而且四个主成份代表了所有的原始自变量,所以原来理论设置的自变量均有效。
表3 初始因子荷载矩阵
2.4 无序多值logistic回归分析
2.4.1 列联分析
该文利用列联分析中的卡方检验来确定自变量和因变量之间是否相关。卡方检验的零假设为:行列变量之间彼此独立,不存在显著的相关关系。在SPSS中进行检验将自动给出检验的相伴概率,如果相伴概率小于显著水平0.05,那么应该拒绝原假设,认为行列之间彼此相关。
以因变量transp(交通方式)和自变量road money(路上花费的费用)为例,进行列联分析最终的结果见表4。表4是卡方检验自变量和因变量相关性的结果。可以看出sig值小于0.05即推翻原假设得到因变量和自变量是相关的。
表4 相关性检验
以此类推,依次检验每个自变量和因变量之间的相关性,最终得到与因变量相关的自变量为年龄、年就医次数、路上花费费用、路上花费时间。
2.4.2 无序多值logistic回归分析
确定了与因变量高度相关的自变量之后,即可进行无序多值logistic回归分析。将相应的自变量和因变量添加入模型后,可得以某种方式作为参照条件下其它不同种类的出行方式因变量被选择的概率。限于篇幅,本文根据问卷调查的数据,仅给出以出租车作为参照时,步行、公交车、私家车的模型参数估计及检验结果如下:
则,各种交通方式的分担率为:
步行:e2.183/(e2.183+e2.783+e1.04+1)=30.73%
公交车:e2.783/(e2.183+e2.783+e1.04+1)=56.00%
私家车:e1.04/(e2.183+e2.783+e1.04+1)=9.80%
出租车:1/(e2.183+e2.783+e1.04+1)=3.46%
将所有数据代入模型得到每种交通方式的分担率的排序顺序依次为公交车、步行、私家车、出租车。说明公交车是老年人就医交通方式选择的首选工具。
相似地,将参照对象置换得到的结果仍是公交车的分担率最大,过程从略。
为更好服务城市老年人的就医出行,应首先明确此类出行所依赖的主要交通方式。因此,论文基于理论分析、自主调查及相关软件技术,对老年人的就医交通方式选择进行了建模分析。首先,采取主成份分析法对所有影响因素进行重新组合达到降维的目的,明确了真正有效的影响因素;其次,利用列联分析寻找到与出行方式高度相关的影响因素,并计算出高度相关的影响因素在logistics模型下的参数;最后,利用模型得到了各种交通方式的分担率,实现了探究老年人就医出行所选择交通方式的研究目的。
[1] 边扬,王炜,陆建,等. 城市出租车出行方式分担率预测方法研究[J]. 交通运输系统工程与信息,2006,6(2) : 95-100.
[2] 刘炳恩,隽志才,李艳玲, 等. 居民出行方式选择非集计模型的建立[J]. 公路交通科技,2008,5 (25) :116-120.
[3] 罗剑,王树盛,李旭宏, 等. 出行方式选择行为的个体时间感知差异性建模[J]. 公路交通科技,2007,24(2) : 114-117,129.
[4] 陆化普. 交通规划理论与方法 [M]. 北京: 清华大学出版社, 1998.
[5] 毛海虓,任福田,等.中国老年交通特征、问题与对策研究[J]. 重庆建筑大学学报,2005,27(3):30-33.
[6] 陈团生,岳芳,杨玲玲,等. 老年人出行选择行为影响因素研究[J]. 西南交通大学学报(社会科学版),2007,8(5):17-21.
U491.1+22
B
1009-7716(2015)09-0012-04
2015-04-07
陕西省教育厅专项科研计划项目(14JK1417);西安建筑科技大学青年科技基金项目(QN1307)。
史荣(1989-),女,陕西西安人,助理工程师,硕士,从事城市交通规划与管理研究。