基于文献计量的国内交通大数据研究述评

2020-09-17 00:20王乐乐陈加洲高全义
福建质量管理 2020年17期
关键词:发文交通领域

王乐乐 陈加洲 高全义

(1.东北大学工商管理学院 辽宁 沈阳 110000;2.贵州大学 贵州 贵阳 550000;3.西安交通大学 陕西 西安 710000)

一、引言

“大数据”(Big Data)一词最早由美国社会思想家阿尔文·托夫勒(Alvin Toffler)于1980年在《第三次浪潮》一书中提出,并称颂它为“第三次浪潮的华彩乐章”[1]。2008年9月,《Nature》杂志推出“Big Data:Science in the Petabyte Era”封面专栏,大数据引起广泛关注。2011年5月,麦肯锡全球研究院(MGI)发布《大数据:创新、竞争和生产力的下一个新领域》全方面介绍和展望大数据后,大数据这一概念因互联网和信息行业的发展而快速传播,并引起广泛重视,2013年也因此被称为中国“大数据元年”[2]。2014年3月,“大数据”首次出现在《2014年国务院政府工作报告》中,并开始在交通、政务、零售以及公共治理等各个领域进行探索与落地实践,交通运输行业是产生大数据的天然场所[3]。2017年国务院发布的《“十三五”现代综合交通运输体系发展规划》明确提出推动大数据与交通运输行业深度融合,实现基础设施、载运工具与运营的数字化、智能化。目前我国交通运输系统已积累了大量数据集,大数据在交通领域的研究与应用为解决交通拥堵、事故频发等严重交通问题以及满足快速、便捷、舒适、安全、绿色的出行需求提供巨大助力[4],其发展必然性和所蕴藏的巨大价值已经得到业界的一致认可,越来越多的学者从不同方面、视角研究大数据在交通领域应用[5]。因此,如何正确评价大数据在交通领域的研究成果以及准确预测其未来发展方向成为一个重要而迫切的问题。鉴于此,本文基于Pajek、Vosviewer等软件,采用文献计量方法分析大数据在我国交通运输领域研究热点、热门领域以及未来发展态势,以期为今后交通大数据相关学术研究提供参考和引导。

二、数据来源及研究方法

(一)数据来源

本文以核心期刊、CSSCI、CSCD三大数据库中的文献为数据来源,采用高级检索方式,以“主题”为检索项,“交通”并含“大数据”为检索词,时间范围为2012年至2019年,这是因为经检索发现国内首次将大数据与交通行业联系在一起的文献是陈美于2012年12月在《图书与情报》发表的《大数据在公共交通中的应用》一文。数据具体采集时间为2019年11月20号,剔除书评、会议通知、征稿通知、消息、公示等非学术类文章,经初步整理、筛选后得到253条有效文献。

(二)研究方法

文献计量分析是通过对某一研究主题的发文数量、关键词、发文期刊、作者、机构、被引证文献等信息进行描述、评价,并总结其研究现状、热点、发展历程及未来发展态势的重要工具[6]。因此本文使用文献计量法对交通领域大数据相关文献数量、关键词、作者及研究机构并进行统计分析,以了解现阶段该领域的研究现状、特点及研究脉络。在此基础上,通过聚类分析和战略坐标分析探寻我国交通领域大数据研究的主要领域、热门领域以及未来发展态势[7]。

三、分析结果

(一)发文数量分析

文献数量是反映某一学科领域知识量的重要指标,同时文献发表年代可以直观反应该领域的发展规模、速度与趋势。因此本文对253篇文献进行数量统计(见图1),由图1可知交通领域大数据相关文献数量总体变化规律是先缓慢增长,后爆炸式增长,2012年仅发表1篇文献,2013年也仅发表2篇文献,而到2014年急剧增长到18篇文献,是前两年总发文量的6倍,随后更是迅速增长,2017年、2018年和2019年三年平均发文量高达56篇。同时,累计发文数量曲线表达式为,其R2=0.9989,表明我国交通领域大数据相关文献累计发文量呈多项式增长,同时结合我国交通强国战略,预测未来几年甚至十几年国内交通领域有关大数据研究的文献数量会继续保持较大的上升态势。

图1 发文数量

(二)关键词分析

1.关键词共现分析

本文绘制的交通领域大数据关键词知识图谱(见图2),阈值选择2,共出现93个关键词,连线数为244条,总计连线强度为372。其中节点代表关键词,节点越大代表关键词出现的频次越高,反之越低;节点间连线越粗代表关键词间的共现程度越强,反之越弱;不同颜色代表不同的聚类。图2中可以看出,以“大数据”为核心的“城市轨道交通”、“智能交通”、“交通大数据”、“智慧交通”“交通工程” 等是目前交通领域大数据研究的热点内容。

图2 关键词共现图谱

2.关键词演进分析

为清楚呈现国内交通领域大数据研究的整体脉络,本文绘制了基于时间轴的交通领域大数据研究趋势演进图谱(见图3),可以看出该领域研究热点总体上从宏观的围绕大数据的智能交通、公共交通研究逐步向交通工程、车联网、交通规划、交通数据挖掘、交通复杂网络、交通治理、Spark大数据技术平台与手机信令等细分领域研究拓展[9]。

图3 研究趋势演进图谱

3.关键词聚类分析

关键词共现分析以及演进分析能够直观呈现目前交通领域大数据研究热点内容以及脉络,然而由于大数据与各行业深度融合是目前各个领域的研究热点,尤其大数据在交通领域的相关研究与应用,造成该领域以大数据为核心的相关研究日益多元化、碎片化,研究的内容不仅繁多,而且比较分散,未形成系统、完整的研究框架。为此本文对统计的全部关键词进行聚类分析,并根据各聚类关键词的组成,总结出各聚类的名称与研究内容,以梳理交通领域大数据研究的整体框架,探究目前交通大数据相关研究的主要领域,使其相关研究更加体系化、系统化,突显交通大数据研究的热门领域,也为预测未来交通大数据研究热门领域奠定基础。首先本文采用UltraEdit对关键词去重,统一关键词名称,用Endnote软件将数据格式转换成RIS格式,然后通过Vosviewer软件对关键词进行聚类分析,阈值选择为2,最终生成5个聚类(见表1)。

由表1可知,5个聚类分别由不同的研究内容组成,代表5种不同研究领域,即目前交通领域大数据的相关研究主要集中在 “城市交通复杂网络”、“智能交通”、“基于云计算的城市轨道交通”、“大数据交通规划”以及“智慧交通工程”五个领域。

(三)研究机构分析

通过研究机构共现图谱(见图4),可以直接反映该领域的权威机构,有助于学者了解和把握该领域研究前沿及热点问题。共现图谱中节点代表研究机构,节点越大代表该机构发表论文数量越多,反之越少;节点间连线越粗代表机构间联系越强,反之越弱[10]。本图谱中节点数为240,连线为174,连线强度188,说明交通领域大数据研究的各个机构彼此间的合作不多,整体还是处于各自独立的状态。

同时为了更清楚地表现国内机构对交通领域大数据的研究情况,本文统计了发文量超过5篇的共13个机构。北京交通大学发表论文数量最多,为20篇,占整体发文量的7.905%;其次是武汉大学共发表论文12篇,占整体发文量的4.743%;清华大学和同济大学紧随其后,分别发表论文9篇、7篇,4家研究机构总体发文量占整体发文量的17.786%,是目前国内交通领域大数据研究的主要阵地。同时,中山大学与西南交通大学虽然仅发表5篇论文,但所发文章被引频次/每年却达到了惊人的84.5和45.75,对本领域相关研究具有重大、深远的影响。与其他机构相比,以上6家机构对大数据在交通领域的应用与研究取得较为丰富的成果,是该领域今后重点关注的机构。另外,发文量超过5篇的13个研究机构仅占整体机构的5.417%,而且其中几乎全部是国内重点高校,而实体交通企业仅一家,可见虽然交通领域大数据相关研究机构众多,但取得一定研究成果的机构却少之又少,而且各研究机构与实体交通企业缺乏合作,在理论落地应用与实践方面还存在很大的缺陷与不足。

图4 研究机构共现图谱

(四)研究作者分析

对某一领域高产作者进行统计有利于准确把握该领域研究热点和未来趋势。本文绘制的作者共现图谱(见图5)中,高频作者中出现了明显的网络特征,表明作者中初步形成了一些比较高产的研究团队。最为突出的有以下团队:①由陆化普、孙智源和屈闻聪构成的稳定三角合作团队;②由王少飞、杨知、李敏、刘良伟和谯志构成的网状合作结构;③由周涛、陈先龙、温慧敏、林涛、郭继孚组成的网状团队;④由段宗涛、康军、唐蕾、樊娜、李莹、刘研组成的网状团队;⑤由郭鹏、黄天印、顾伟华、赵时旻组形成的四人团队;⑥由张红、朱昶胜、曹杰和王晓明构成的稳定四人团队。此外,还有部分一对一合作团队表现也较为突出(如赵光辉和李玲玲,李欣和孟德友等)。

图5 作者共现图谱

其中王少飞和赵光辉两位发文最多(6篇),王少飞主要关注智慧高速、全息交通等[11-14],赵光辉主要关注基于大数据的交通市场监管以及大数据与交通行业的融合等方面[15-18]。依据普莱斯定律的计算方法,X=0.749,(Y代表单个作者最多发文数量),可确定核心作者群体[19]。根据各作者发表论文数量的统计结果,王少飞和赵光辉各发表6篇论文,是目前该领域发表论文最多的学者,故m=1.835,因此,发表2篇及以上论文的作者就是交通大数据领域的核心作者。通过数据统计与分析,该领域共有47位核心作者,共发表94篇学术论文,占整体的37.154%,远低于普莱斯定律50%的标准,由此可见目前交通领域大数据研究未形成稳定的核心作者群。同时陆化普虽发文量不是最多的(5篇),然所发文章被引频次/每年达到惊人的48.25[20,21],是所有作者中最高的,因此对本领域的影响也是不容忽视的,以上3位作者很可能成为本领域未来的领跑者。

(五)战略坐标分析

本文以各细分领域研究密度为横轴,研究向心度为纵轴,以全部细分领域向心度与密度平均值(0.477,2.885)为坐标原点,绘制交通大数据研究细分领域战略坐标图,探究目前交通大数据研究的热门领域以及未来热门领域,使5个细分研究领域分别落入不同的象限(见图6),图中每个散点代表一个细分研究领域。

图6 战略坐标图

从四个象限的分布情况看,领域4“大数据交通规划”位于第一象限,该象限为热门领域,其代表的研究内容具有高频次与高中心度特点,表明基于大数据的交通规划、调查是目前交通大数据研究的热门与重要领域,且与其他研究领域具有较高的关联度。领域2“智能交通”位于第二象限,该象限为高潜热门领域,其代表的研究内容具有低频次、高中心度特点,表明智能交通是未来研究的热门领域;领域1“城市交通复杂网络”位于第三象限,该象限为孤岛领域,代表的研究内容既不具备高频次,也不具有高中心度,表明该领域并不是交通大数据研究的核心内容,相关研究比较少并且未形成完整的研究体系。但应区别对待,该研究领域部分研究点可能处于交通大数据研究的边缘,如“节能减排”等,其他研究点如“轨迹大数据”、“复杂网络”“信息共享”等有可能发展为交通大数据的研究热点;领域5“智慧交通工程”位于第四象限,该象限为边缘领域,其代表的研究内容具有高频次、低中心度特点,说明该领域也是目前交通大数据研究的热门领域,但与其他研究领域的关联度不高;领域3“基于云计算的城市轨道交通”的密度和中心度接近原点,表明虽然该领域不是当前研究的核心内容,但相关理论、技术和框架正逐步走向成熟,具有较好的发展趋势,将会成为该领域未来研究的热门领域。

四、结论与展望

(一)结论

依目前的增长态势以及国家交通强国战略,预测在未来几年甚至十几年国内该领域相关研究的文献数量仍会呈现出强烈的上升趋势;从研究热点和热门领域来看,目前交通大数据领域研究热点主要集中在城市轨道交通、智能交通、交通工程、智慧交通、云计算、交通规划等方面;智能交通和基于云计算的城市轨道交通建设是该领域未来研究热门与核心领域。总体上来说,目前国内对交通大数据的研究还处在初步探索阶段,未形成核心研究群体,相关研究文献较少,其中高水平的研究文献更少,而且这些文献大多处于理论探索阶段,缺乏足够的实践支持。为此,未来对交通大数据的研究需立足理论实践,加强科研机构与实体交通企业的合作,不断加强理论落地、应用和实践。

(二)展望

本文也存在一定局限性。首先,未对交通领域大数据发文期刊分布情况进行统计,未来可对其进行深入统计、分析,有利于快速、准确查找对该领域有重要价值和影响的文献资料;其次,未对交通领域大数据发文地区分布情况进行统计分析,未来研究可以对发文地区分布进行分析,能够明确目前各地区对该领域研究内容及数量的差异,为促进各研究机构的跨地域合作、交流提供指引和方向;最后,本文仅对核心期刊、CSSCI、CSCD数据库中的文献做统计与分析,未来研究可以对国内全部中文数据库中该领域的文献进行统计与分析,进一步增强研究结论的说服力。

猜你喜欢
发文交通领域
繁忙的交通
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
2020 IT领域大事记
领域·对峙
小小交通劝导员
新常态下推动多层次多领域依法治理初探
肯定与质疑:“慕课”在基础教育领域的应用
阅读理解三则