段征宇 杨东援
摘要:大数据技术带来了科学研究范式和产业模式的革新。本文从大数据环境下,交通工程理论和技术的变革、交通数据分析和信息服务产业的发展出发,提出了交通数据分析师的培养需求,分析了与传统交通工程技术人才培养的关系。结合同济大学交通工程专业的课程和实践教学探索,讨论了交通工程专业数据分析人才的培养要素。
关键词:大数据;交通工程;交通数据分析;人才培养
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2015)29-0207-03
近年来,“大数据”(Big Data)成为了学术界、企业界和政府关注的热点。2007年,图灵奖获得者吉姆·格雷认为大数据技术的发展将引发科学研究方法的重大革新,提出了科学研究的“第四范式”(The Fourth Paradigm)的概念[1]。
企业界则将大数据看作与自然资源、人力资源一样重要的战略资源。OReilly公司断言“未来属于将数据转换成产品的公司和人们”[2]。麦肯锡在2011年5月发布的报告“大数据:下一个创新、竞争和生产力的前沿”中指出,大数据是继传统IT之后的下一个提高生产率的技术前沿,将成为未来提高竞争力、生产力、创新能力以及创造消费者盈余的关键因素[3]。
2012年3月,美国奥巴马政府宣布投资2亿美元启动“大数据研究和发展计划”,认为大数据是“未来的新石油”,将“大数据研究”上升为国家意志,这必将对未来的科技与经济发展带来深远影响[2]。
交通工程是形成与20世纪80年代的一门年轻的应用型学科,涉及工学、管理学、经济学、社会学等多个领域的交叉和融合,旨在培养从事交通规划、设计和管理等方面的人才。大数据技术的发展,为交通工程学科带来新的机遇,促进了交通数据分析和信息服务产业的发展,同时也对传统的交通工程人才培养提出了新的要求。
一、大数据技术对交通工程学科的影响
传统交通工程技术以抽样调查为基础,而大数据技术的发展,一方面,提供了更为完备的数据环境;另一方面,在实证、演绎和仿真模拟3种研究范式的基础上,出现了“数据密集型科学”的新研究范式,这将对传统交通工程的理论、技术体系产生重要影响。
在交通数据采集方面,感应线圈、浮动车等技术的广泛应用,使得城市交通系统状态信息的获取更为方便。而以手机信令、智能手机、车联网传感器、物联网传感器等为代表的新一代广域交通数据采集技术,具有实时性强、样本量大、覆盖范围广、采集成本低等优势,可以实现对个体活动的连续追踪。此外,论坛、微博等社交网络数据,包含活动位置信息、公众态度等信息,在交通政策分析等方面具有很强的应用潜力。数据获取能力的进步,使得对交通系统进行全面、连续地观测成为可能,也为交通技术分析提供了全新的数据环境。
在交通规划方面,传统的交通规划方法是建立在以“四阶段”方法为代表的交通模型体系之上。形成于20世纪60年代的“四阶段”方法以城市居民出行大调查为基础,通常5~10年进行一次,抽样率在2%~5%、甚至更低。因此,样本数据的代表性和时效性存在固有缺陷,影响了交通预测模型的精度。而大数据技术为交通规划技术的革新带来了新的机遇,手机等新的数据采集方法,可以获取大样本、甚至全样本的居民出行数据,有助于对城市交通需求的现状和发展趋势做出准确的判断。而通过对城市交通系统状态和居民出行行为的连续观测和分析,可以监测交通规划和建设方案的实施效果,从而将传统“开环”的交通规划技术流程,转变为以城市交通战略调控为核心的“闭环”反馈控制的新模式,通过对交通系统发展过程的调控,促进城市交通的可持续发展。
在交通管理方面,新的数据采集手段,使得全面、实时获取城市交通系统的运行状态成为可能,这为城市交通系统问题的诊断、区域协调控制策略的制定和实施提供了良好的条件。而车联网技术实现了车辆与车辆、车辆与道路基础设施之间的交互和协同,使道路的利用效率和安全性大幅提高。此外,采用大数据技术对出行者行为、交通需求结构进行分析,有助于制定有针对性的交通需求管理政策,通过交通方式结构的调整,促进道路交通资源的高效利用。社交网络数据的利用,有助于了解公众对交通政策、措施的态度和评价,减少交通政策和措施的不利影响。
二、交通数据分析和信息服务产业
交通大数据环境的形成和大数据技术的发展,促进了交通数据分析和信息服务产业的形成和发展。舍恩伯格认为,在大数据产业将形成大数据掌握公司、大数据技术公司和大数据思维公司3类企业。其中,大数据掌握公司是指拥有大量数据,但却不一定拥有提取数据价值技术的企业;大数据技术公司是指具备数据分析专业技能的企业,包括咨询公司、技术供应商等;大数据思维公司是指具有怎样挖掘数据的新价值的创新想法的企业。[6]
同样,在交通领域,也逐渐形成了数据采集、整合、分析、挖掘、展示和服务的交通大数据产业链。相应的企业或部门可以分为5类:交通数据采集公司、交通数据掌握公司、交通数据分析公司、交通数据思维公司和交通信息服务公司。
1.交通数据采集公司。在交通管理中,由于不少城市的感应线圈、微波雷达等自动采集设备还难以覆盖整个城市路网,因此,交通流量、延误、通行能力等调查需要采用人工方式;而交通规划的出行调查、公交OD调查等也主要采用人工调查方式。由于人工调查费时、费工,需要临时招募和培训调查人员,且数据质量难以保障。因此,逐渐形成了专业的数据采集公司,比如:北京晶众公司等,主要承接交通调查的外包业务,形成了专业的采集队伍和标准化的采集技术流程。
2.交通数据掌握公司。是指拥有大规模交通数据的企业或部门。以前国内城市的交通数据分散在市政、交警、交通、规划等多个职能部门,为了减少重复建设、充分利用数据资源,各大城市都逐步建立了交通信息中心,对各部门的交通数据进行汇聚和整合,并推进了交通数据采集、传输、存储的标准化。比如:北京交通信息中心、上海交通信息中心等。公交公司、地铁公司、出租车公司等也掌握了各自领域的交通数据,可喜的是,这些数据都逐渐接入城市交通信息中心。另外,随着交通数据采集技术的发展,手机信令、智能手机、社交网络等也成为交通信息的重要来源,移动通讯企业、互联网公司等也成为交通数据的掌握者。
3.交通数据分析公司。是指从事交通数据加工、分析和系统开发的咨询公司或IT企业,比如:上海美惠公司、上海电器科学研究所等。这类企业根据交通规划、管理和服务的需要,将原始交通数据加工成交通状态信息、交通出行信息、交通决策信息等。比如:将出租车GPS位置数据加工为道路交通状况信息,反映路网的拥堵状况,为交通管理和公众出行提供参考。
4.交通数据思维公司。是指具有创新想法的公司,将交通数据应用到新的领域,包括咨询公司、高校等,这些创新想法通过专利、论文、咨询方案等形式体现。比如,同济大学先后参与了深圳城市交通仿真系统、杭州市智能交通信息平台的设计和建设,促进了城市交通管理和规划技术水平的提升。
5.交通信息服务公司。是指为公众或企业等最终用户,提供交通信息服务的企业或部门。比如:城市交通信息中心通过交通广播、可变情报板、Web网站等,向公众发布道路交通状况、停车位等信息;Google、百度等企业通过Web、手机地图服务等,向公众发布道路交通状况、公交线路、出行路径诱导等信息。
随着交通大数据产业的发展,有的企业不断向产业链的上游或下游延伸,同时具备上述5类企业的2个或多个特点。
三、大数据环境下的交通工程专业人才需求
大数据产业的发展带来了新的人才需求。舍恩伯格认为,大数据技术催生了一种新的职业“数据科学家”,是统计学家、软件程序员、图形设计师和作家的结合体[6]。麦肯锡在2011年发布的研究报告中预测,到2018年,在美国,懂得如何分析大数据并从中做出有效决策的管理者及分析师的人才缺口将达到150万[7]。在中国,大数据技术已被应用于电信、金融、零售、制造等行业,企业对数据分析人才的需求也日益增长。为此,IBM提出了“IBM U—100”合作计划,将与中国100所高校合作,通过捐赠软件、合作开设课程等方式,培养大数据分析人才[8]。
传统的交通工程专业主要培养交通规划师、交通设计师和交通模型师3类技术人才。其中,交通规划师主要配合城市规划师进行交通专项规划,负责交通设施体系规划、交通近期建设规划和交通运输发展政策规划等工作;交通设计师主要从事道路空间设计、交通组织和控制方案设计,公交系统和慢行交通系统设计等工作;交通模型师则为交通规划和管理工作提供定量分析工具,以抽样调查数据为基础,构建城市交通仿真模型,对规划、管理方案和政策进行测试和评估。
随着交通数据分析和信息服务产业的发展,交通大数据分析人才的需求也越来越大。因此,培养交通数据分析师将成为交通工程专业的新任务。
交通数据分析师主要负责交通数据的采集、整理、分析和展示,根据数据提炼的事实和关联关系,对交通系统现状和发展趋势进行研判,支持交通规划和管理决策过程。
交通模型师与交通数据分析师都从事支持决策过程的定量分析工作,但在内容上具有较大差异。交通模型是采用定期抽样调查数据,通过交通网络均衡理论和微观交通流理论构建的仿真模型,以先验的因果关系为基础还原城市交通系统,模型的精度受到模型师的经验局限。而交通数据分析,则是从大规模的连续观测数据出发,以统计分析为基础,寻找客观事实、挖掘关联关系,有可能突破经验的局限,发现新问题和新规律。
四、交通数据分析师的培养
交通数据分析师是一种复合型人才,需要具备交通工程专业理论、统计分析、计算机编程、可视化表达等多方面的知识和技能。交通数据分析师不仅要精通数据分析,还要对交通业务具有较深的理解,通过数据还原交通系统、发现问题,辅助制定交通战略调控方案,促进交通系统的可持续发展。
根据交通数据分析师的培养需求和卓越工程师教育培养计划的要求,同济大学交通工程专业正在或准备从以下6个方面着手,构建全过程、递进式的实践教学体系,培养本科生的交通数据分析思维和能力。
1.课程教学。将原有的《交通调查与分析》和《交通统计分析》合并为一门课程《交通调查与统计分析》。原来的《交通调查与分析》主要讲授交通调查方法和数据的初步分析,调查方法也以人工调查为主,数据分析是根据调查数据分析交通现象和问题;《交通统计分析》重点讲授数据统计方法和统计分析软件,结合交通数据掌握统计分析方法的应用。新的《交通调查与统计分析》课程,将数据采集、处理和分析方法贯穿在一起,融入最新的采集方法和大数据分析技术。强调理论与实践相结合的教学模式,课程实验包括现场调查和上机实验2种方式;课程作业采用实测的感应线圈、GPS、公交IC卡、车牌照识别等数据,指导学生采用统计分析软件或编程完成作业。在考核方式上,课程实验与作业、期末考试分别占50%的权重,强调通过实践掌握数据分析技能。此外,将交通数据分析企业的专家或高级工程师引入课堂,讲授实际工程项目中的问题、方法与工具。
2.课程设计。增设《交通数据与统计分析》专业课程设计,以实际的交通规划和管理问题命题,提供大规模实测数据,培养学生分析问题、设计算法和大规模数据处理能力。数据范围为整个城市或某个区域,时长为1星期以上。比如,采用出租车GPS数据分析城市路网交通状态,要求学生独立完成地图匹配、车速计算、拥堵分析等建模、算法设计和数据分析等任务。
3.实验平台。依托交通仿真实验室,进行上机实验和课程设计;搭建了“海量数据存储与挖掘平台”,配有高性能刀片服务器和容量为40TB的磁盘阵列,满足大规模数据分析和处理的需求;与专业交通数据调查和分析公司合作,构建支持多门核心专业课程的数据采集与分析实验体系和平台;与上海、深圳等相关单位或企业合作,接入实测交通数据。
4.创新实践。通过“交通科技大赛”、“上海大学生创新训练计划”(SITP)等创新实践活动,鼓励学生参与到实际的交通大数据研究项目,以分组合作方式完成创新课题,并推荐优秀作品参加全国的比赛。创新实践通常持续半年到1年,既培养了学生的创新思维和解决问题的能力,又培养了团队合作精神。
5.专业实习。与交通数据产业的相关部门或企业合作建立实习基地,在大四上学期进行专业实习,参与企业的实际工程项目,在实践中锻炼分析城市交通问题的能力,学习企业的交通数据分析技术和流程,得到从事实际工作的基本训练。
6.毕业设计。结合交通大数据课题或实际交通问题进行命题,培养学生综合运用交通工程专业知识、数据分析技能,进行独立分析与解决实际交通问题的能力,为从事交通数据分析工作或研究提供基础。
五、结语
本文分析了大数据技术对交通工程学科理论和技术体系的影响、交通大数据分析和信息服务产业链的构成,提出了交通数据分析师的培养需求和职业定位,结合同济大学交通工程专业课程和实践教学的探索,讨论了交通数据分析人才的培养要素。研究成果对于交通工程专业的教学改革和人才培养具有参考价值。
参考文献:
[1]Tony Hey,Stewart Tansley,Kristin Tolle.The Fourth Paradigm-Data-Intensive Scientific Discovery [M].Washington:Microsoft Research Redmond,2009.10.
[2]李国杰.大数据研究的科学价值[J].中国计算机学会通讯,2012,8(9).
[3]Manyika J,Chui M,Brown B,et al.Big data:The next frontier for innovation,competition,and productivity[R].McKinsey Global Institute,2011.
[4]杨东援.面向特大城市未来发展的交通模型研究——数据密集型分析概念下的交通模型[J].城市交通,2013,10(6).
[5]杨东援.连续数据环境下的交通规划与管理[M].上海:同济大学出版社,2014.
[6][美]维克托·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代——生活、工作与思维的大变革[M].盛杨燕,周涛,译.浙江人民出版社,2013.
[7]2012年:BI人才需求增长强劲[EB/OL].[2012-02-07].
http://www.enet.com.cn/article/2012/0207/A20120207963920.shtml.
[8]IBM投入1亿美元支持国内大数据与分析人才培养[EB/OL].[2014-07-08].
http://www.ibm.com/news/cn/zh/2014/07/08/c962831l91226i08.html.
[9]吴娇蓉,辛飞飞.开放性实验和专业课程设计包延伸的交通工程专业综合毕业设计实施模式研究[J].教育教学论坛,2014,(43).
[10]杨超,叶霞飞,杜豫川.以基地建设为核心的创新及应用人才培养模式初探——以卓越工程师教育培养计划专业交通工程为例[J].教育教学论坛,2012,(30).