传统调查与互联网结合的公交调查与分析方法
——以西安市为例

2023-12-12 10:35高雪松郭明鹏
黑龙江交通科技 2023年11期
关键词:西安市公共交通居民

张 朔,高雪松,郭明鹏

(济南市市政工程设计研究院(集团)有限责任公司,山东 济南 250000)

0 引 言

为深入贯彻落实《国务院关于城市优先发展公共交通的指导意见》(国发〔2012〕64号),进一步推动公共交通优先发展,充分发挥公共交通改善城市交通状况、提高城市竞争力、提升人民群众出行品质的作用,2012年10月西安市入选全国第一批“公交都市”示范创建城市,城市公共交通发展迎来新的历史机遇。为客观评估西安市城市公共交通出行分担率、公共交通平均拥挤度、公共出行满意度等公交都市考核指标,全面了解西安市城市居民的出行方式结构及公共交通出行占比,为西安市公共交通服务的提升、优化、改进提供基础依据及指导,西安市城市公交调查项目于2019年6月至11月开展了西安市居民出行调查、西安市公共交通出行满意度调查、西安市公共交通拥挤度调查等。

在公交调查方法的选取上,互联网调查相比于传统调查方法具有组织简单、省时省力、费用低等诸多优点,可以在短时间内获取到大量调查数据。与此同时,互联网调查也存在参与调查对象相对未知、调查质量较难控制等问题,如何发挥互联网调查的优势,更有效地收集到所需数据是本研究主要解决的问题。

1 调查准备工作

1.1 调查对象

根据交通运输部印发的《关于<公交都市考核评价指标体系>的说明》中要求,公共交通机动化出行分担率指标定义[1]为:统计期内,中心城区居民选择公共交通的出行量占机动化出行总量的比例。计算方法[1]为

式中:apm为公共交通机动化出行分担率,%;Tpt为公共交通出行量,人次/日;Tm为机动化出行总量,人次/日。

因此,本次居民出行调查主要针对西安市中心城区居民进行居民出行调查。

样本抽样率将根据城市规模和居民出行调查样本率标准进行确定。根据西安市统计局提供数据,2018年西安市中心城区人口488.75万人;根据国务院《关于调整城市规模划分标准的通知》(国发〔2014〕51号),以城区常住人口为统计口径,将城市划分为五类七档,西安属于I型大城市;根据《城市公共交通出行分担率调查和统计方法》(JT/T 1052—2016),本次公共交通调查属于小规模补充调查,抽样率为0.2%。综上,本次西安市居民出行调查的最低抽样人数9 775人。

1.2 调查方法

本次调查主要采取传统入户问卷调查和基于“问卷星”平台的网页端和手机端的问卷调查两种方式,对西安市中心城区居民出行开展调查工作。

线上居民出行调查,通过将传统问卷电子化方式,该种调查形式可以充分利用现有的通信技术手段,通过微信、公众号、朋友圈、二维码等方式推送,同时通过有奖填写的形式,提高问卷的转发率和回收率,也加强了市民在西安公交都市创建工作中的有效参与。

1.3 调查时间

传统入户问卷调查时间为2019年7月16日,居民回忆7月15日当日整天的每一次出行,并记录在调查表中。

基于网络和手机端平台的问卷调查时间为2019年7月16日至2019年7月23日,被调查人员填写7月15日当日整天的每一次出行。

1.4 调查地点

为了尽可能全面的了解西安市中心城区全体市民的出行特征,项目组通过Python技术爬取互联网地图中西安市住宅小区POI数据,对采集到的数据信息进行统计分析,依据住宅小区所在行政区、房价等属性信息,采用分层配比抽样的方法选取调查地点,使之尽可能覆盖西安市中心城区各行政区,分布相对分散,面向群体包含各类人群。

2 调查质量控制

为保证调查过程的真实有效,保证调查数据质量可靠,在整个调查过程及调查后数据统计过程中,采取了多种方式对调查质量进行控制。

2.1 传统入户问卷调查中的质量控制

(1)调查前开展调查培训工作

在传统入户问卷调查人员选择上,选择交通工程相关专业大中专院校学生,与此同时,对参与整个调查的访问督导、访问人员进行调查前培训、问卷内容培训及访问技巧培训,确保每个访问人员对公共交通调查意义、调查内容、问卷及访问过程做到熟知。

(2)调查过程中问卷解释

公共交通调查过程中,调查员负责向居民解释调查问卷中的内容,同时选派的调查负责人和专职督导负责解答调查员在访问过程中发现的任何关于问卷内容的问题。

(3)调查过程中问卷审核

由专职督导和流动督导人员在访问现场对抽样和访问工作进行指导、监督和抽查,对每一份完成问卷实行卷面审查,卷面要求不符合规定的及时返工;负责人将对问卷进行二审,确保问卷的有效性与完整性。

(4)问卷录入过程中差错复核

调查结束后,将调查问卷内容录入数据库,并通过逻辑差错辅助以电话访问的形式对问卷质量加以复核,删除逻辑错误出现率较高的问卷。

2.2 基于互联网问卷调查中的质量控制

为提高市民参与程度,保证问卷调查数量,在互联网调查过程中设立调查问卷回答奖励机制,对成功参与问卷调查的市民给予一定金额的红包奖励。与此同时,随着奖励的设置,问卷调查过程中出现了大量的“羊毛党”参与,这类人群以赢取红包奖励为目的,虚假填写问卷信息,影响了问卷质量,干扰了正常的问卷调查工作,为此,项目组通过设立3层问卷审核体系,确立互联网问卷审核规则,筛选出了有效问卷,保证了问卷结果质量。

(1)设立三层问卷审核体系

三层问卷审核体系分别包括:有效问卷、问题问卷、无效问卷。首先将默认收集到的问卷全部为有效问卷,其次针对有效问卷中的逻辑问题进行二次审核,将家庭住址范围、年龄与职业、出行目的与职业等逻辑规律不符的问卷标记为问题问卷或无效问卷,最后针对问题问卷进行二次重点人工审核。

(2)互联网问卷逻辑审核规则

①家庭住址复核。本次调查面向西安市常住居民,在网络问卷收集过程中,出现大量非西安市本地居民用户填写,在后期问卷筛选校核过程中,将家庭地址填写为陕西省外地址问卷标记为无效问卷,将家庭地址在除西安市域范围外的陕西省内其他区域的问卷标记为问题问卷,进行二次重点人工审核。同时重点审核过程中特别注意家庭地址为除西安市域外大西安范围(咸阳市大部分地区、西咸新区、渭南市、杨凌区等)问卷。

②年龄与职业复核。在本次调查问卷设计过程中,设置的职业分类包括:中小学生、大学生、公务员、事业单位、国企职员、民企职员、私营个体、自由职业、离退休人员、其他10类。将选择职业类型为中小学的问卷个体且年龄范围不在5~20岁的问卷标记为问题问卷,将选择职业类型为大学生的问卷个体且年龄范围不在16~30岁的问卷标记为问题问卷,将选择职业类型为离退休人员的问卷个体与年龄范围在45岁以上的问卷标记为问题问卷。

③家庭中交通工具拥有数量复核。在本次调查问卷设计过程中,设置“您家庭中交通工具拥有数量情况”一题,需要分别回答家庭中自行车、电动车、摩托车及小汽车拥有数量情况。在问卷审核过程中,将家庭中拥有交通工具总量大于6辆或交通工具总量大于家庭人口总数的问卷标记为问题问卷。

④职业与出行目的复核。在本次调查问卷设计过程中,设置出行目的包括:上班、上学、公务、生活购物、文娱体育、探亲访友、看病探病、回家、其他回程、其它10类。将职业类型选择为中小学生、大学生且出行目的为上班、公务的问卷标记为问题问卷;将职业类型选择为除中小学生、大学生以外的其他类型且出行目的为上学的问卷标记为问题问卷。

⑤用户填写IP复核。网络问卷填写过程中,自动统计了参与问卷个体的IP信息。对同一IP地址下所填写问卷的出行起终点进行分析比对,将同一IP地址下的不同问卷,且在其出行起点或出行终点中,并不存在同一地址的两份及以上问卷标记为问题问卷。

⑥敏感地址复核。在调查过程中,通过家庭地址、出行起点、出行终点中的地址信息及相应经纬度坐标的比对,出现了大量大概率的相同地址信息,主要包括:“陕西省西安市碑林区西安钟楼[108.947 02,34.259 432]”、“陕西省西安市未央区汉城街道西安北站[108.938 585,34.376 094]”、“陕西省西安市未央区张家堡街道西安市人民政府[108.939 621,34.343 147]”、“陕西省西安市新城区自强路街道西安站[108.961 676,34.277 622]”、“陕西省西安市临潼区秦陵街道秦始皇兵马俑博物馆[109.281 166,34.385 152]”等地址,此类地址的出现频率及次数远远超过一般居民出行中实际起终点中出现的概率。因此将包含以上地址信息的问卷,标记为问题问卷。

⑦将同时被标记两次及以上的问题问卷,标记为无效问卷。

3 调查数据处理及调查关键问题分析

本次调查数据全部采用基于网络的在线录入系统,为确保录入过程中信息的准确性,首先,将调查数据(个人特征、出行目的、出行方式等)进行统一编码;其次,将编码通过计算机或手机录入指定系统中;最终,将录入数据导出至数据库,对数据进行统计分析。

3.1 数据扩样方法研究

居民出行调查作为城市居民出行活动的全民调查活动,其调查样本应保证从各个信息维度充分反应居民的出行活动特征。居民出行调查过程中,由于调查方法等局限性,存在一定的缺陷,因而需要对调查样本进行扩样校核。扩样是根据调查样本的抽样率和全体统计数据直接计算确定扩样系数。[2]

以居民出行调查数据为基础,在家庭、个人以及出行三个层面,通过街道人口、家庭结构、小汽车拥有量数量、性别结构、就业上学人口比例、小汽车、出租车以及公交车出行总量与时间分布等一系列指标对居民出行数据进行约束调整与扩样校核。[3]整个扩样校核过程根据家庭、个人以及出行分为三个阶段。在家庭阶段以总家庭数、家庭平均人口数、6岁以下人口以及小汽车拥有量为控制目标;在个人阶段结合西安市第六次人口普查数据,以有车无车人口比例、性别比例、就业状态比例、年龄段占比为控制目标;在出行阶段以公交车的载客总量与分时段比例为控制指标。最后,完成扩样及修正后,计算分析西安市中心城区居民出行特征。

3.2 上下学调查补充研究

按照项目工作进度要求,本次交通调查时间选择为7月中旬,此时部分中小学已经放假,作为居民出行的重要组成部分,学生上下学出行及家长接送孩子的出行行为在这一时期将有所遗漏。因此,在传统调查内容的基础上,针对西安市中心城区就学、通勤时段突出的交通问题,通过对拥有适龄学生的调查家庭询问学生日常上下学、家长接送期间的一日出行情况,并补充进有效问卷。

4 主要调查结果

本次调查共收回问卷40 325份,其中有效问卷11 007份,包括传统入户问卷调查收回有效问卷1 170份,基于网页和手机端平台的问卷调查收回有效问卷9 837份,互联网收回问卷中有效问卷比例不足1/4。通过质量控制后,得到的有效问卷数量可满足本次最低抽样人数9 775人的要求。

对有效问卷开展数据分析工作,并获得本次调查的结果,主要包括:调查样本基本特征、居民出行总体特征、居民公共交通出行总体特征等。

4.1 调查样本基本特征

(1)家庭成员构成

此次调查中,抽查的样本中户主的占35.06%,非户主占67.94%。在调查的家庭中,户均人口为3.53人,家庭人数为3口人和4口人居多,占总样本量的60.16%,见图1。

图1 调查样本家庭人口数分布图

(2)调查人群年龄特征

此次调查中,调查样本的年龄分布主要集中在31~40岁,占调查样本总量的28.69%,是城市居民出行的主体;其次是26~30岁,占调查样本总量的22.18%;随着年龄递增,调查样本比例逐渐降低,见图2。

图2 不同年龄段调查样本分布图

4.2 居民交通出行总体特征

西安市中心城区居民日常交通出行方式中选择私家车出行占比15.37%,选择步行和自行车出行占比41.43%,公交(含轨道)出行的占比36.13%,不含步行的出行方式中公交(含轨道)出行占比49.71%,机动化的出行方式中公交(含轨道)出行占比61.69%,见表1。充分说明无论选择机动化与否,公交(含轨道)出行都承担了比较大的部分。

表1 中心城区居民全方式出行方式分担率 单位:%

西安市中心城区公共交通(含轨道)在全方式下出行分担率为36.13%,公共交通在机动化出行方式中的分担率为61.69%,公共交通在不含步行出行方式中的分担率为49.71%。公共交通出行和慢行出行(步行、自行车/电动自行车)是居民主要出行方式,占总出行77.56%。

4.3 居民公交出行总体特征

(1)出行目的

此次调查中,出行目的为上班的最多,占30.96%;回家的占25.95%;以文娱体育和生活购物为出行目的占16.66%,见表2。这说明城市公共交通主要承担了居民通勤出行的主要任务,同时也为居民休闲娱乐生活提供便利。

表2 中心城区居民出行目的构成 单位:%

(2)一次出行平均耗时

此次调查中,有44.16%的出行耗时量在30 min以内,有43.14%的出行耗时量在30~60 min,见图3。此外,出行耗时量在1 h以上的占12.70%。

图3 公共交通出行耗时量特征图

5 结 论

本次公共交通调查中采用传统入户调查与互联网调查相结合的联合调查方法,并采用小样本调查,较传统大规模调查节省工作量30%~40%;小样本调查中的互联网调查省却了当面问询、数据录入等环节,最终的数据审核工作70%的工作量通过计算机程序完成,剩余30%由人工复核完成,极大的节约了人工成本。同时,对于公共交通调查中利用互联网调查的调查方法和质量控制规则的研究可为后续同类型的调查工作提供参考。

对于互联网调查中质量控制规则,还存在值得深入研究的内容:如针对用户填写时耗的判断来识别问卷是否有效,如何规避单位或家庭中利用同一公共IP填写从而被判断为问题问卷的风险。同时,在后续研究中有必要将问卷控制规则和录入分析的过程借助计算机语言编写为模块化程序,从而进一步提升整体工作效率。

猜你喜欢
西安市公共交通居民
石器时代的居民
《城市公共交通》杂志社简介
亲子创意美工展
石器时代的居民
西安市第四医院
123的几种说法
基于计算实验的公共交通需求预测方法
基于CA-Markov模型的西安市热环境模拟研究
公共交通一卡通TSM平台研究
你睡得香吗?