任莎莎
(北京市电子科技情报研究所, 北京 100009)
汽车产业是我国国民经济的战略性支柱产业,并且我国汽车产业规模已排在世界首位。随着人工智能、物联网等新一代信息技术的发展,智能汽车已成为全球汽车产业转型升级的重要方向。2018年3月,国家发展改革委员会发布的《智能汽车创新发展战略》中提出:到2035年,我国将率先建成智能汽车强国。然而,智能汽车涉及汽车、通信、交通、人工智能、计算机、自动控制、信息技术等不同产业,产业链长,技术领域众多[1]。加之,智能汽车属于新兴领域,其发展是一个不断探索和循环渐进的过程[2]。基于此,本文以智能汽车为主题的文献进行深入分析,通过因子分析、聚类分析等统计学研究方法科学客观地反映现阶段智能汽车行业的研究热点,有助于为从事智能汽车研究的企事业单位明确后期研究方向和制定科研计划提供启示。
国家发展改革委员会发布的《智能汽车创新发展战略》(征求意见稿)中明确给出了智能网联汽车的定义,并指出智能汽车、智能网联汽车、自动驾驶汽车、无人驾驶汽车是同一个概念,是汽车在实现无人驾驶过程中不同阶段的称谓。智能网联汽车是通过搭载先进传感器、控制器、执行器等装置,运用信息通信、互联网、大数据、云计算、AI等新技术,具有部分或完全自动驾驶功能,由单纯交通运输工具逐步向智能移动空间转变的新一代汽车[3]。可见,智能网联汽车集中运用了汽车工程、人工智能、计算机、微电子、自动控制、通信与平台等技术[4],是一个集环境感知、规划决策、控制执行、信息交互等于一体的高新技术综合体。
美国汽车工程师协会将自动驾驶车辆进行了等级分类,共分为5级:L0为不具备自动化,也就是普通汽车;L1指特定功能实现自动化;L2是部分功能实现自动化;L3指有条件的自动驾驶;L4是高度自动驾驶;L5是完全自动驾驶。这也是业内公认的分类方法。目前,我国对智能网联汽车的研究可分为两大阵营,一是以传统汽车企业为主的ADAS(Advanced Driving Assistant System,高级驾驶辅助系统)稳步升级路径;二是以互联网科技企业为主的直接无人驾驶路线。目前国内车企均处在L2到L3级的弯道处,北汽、吉利预计2019年实现L2.5级自动驾驶。百度可谓互联网科技公司的佼佼者,其L4级阿波龙(小型巴士)已于2018年7月量产,在乘用车领域百度2019年1月实现了城市道路的自动驾驶。
然而,智能网联汽车的落地还面临很多的问题与挑战。来飞[5]等人总结出了17项智能汽车自动驾驶技术面临的挑战,包含法律责任界定、技术问题、用户安全隐私等。蒋树国[6]等结合我国智能网联汽车的进展情况,指出目前智能网联汽车面临的困难和挑战,如网络安全问题、技术标准不完善、传感器配置与成本之间的矛盾、保险制度不完善、基础设施薄弱等。
本文在研究过程中运用了因子分析、聚类分析等统计学研究方法,以及共词分析、知识图谱的可视化表现方法。
共词分析是文献情报学的常用方法,是利用文献集中词汇对或名词短语共同出现的情况,来确定该文献集所代表学科中各主题之间的关系[7]。共词分析法理论研究已比较完善,并且在很多研究领域都产生了显著的研究成果,已经成为一种重要的科技情报分析方法[8]。运用共词分析法可以判断出该主题领域的研究热点等。王米雪等[9]运用共词分析法分析了我国智慧教育领域的研究热点;张坤等[10]运用共词分析和社会网络法等分析了我国共享经济领域的五大研究热点;马费成等[11]运用共词分析、因子分析、系统聚类法探讨了国内数字信息资源的研究现状与热点;董伟[12]利用共词分析、因子分析等对国内数字图书馆领域近十年的研究热点进行探讨。可见,共词分析法与因子分析、聚类分析等统计学方法相结合可以更好的析出主题研究热点。
本研究以中国知网(CNKI)作为数据源,研究样本限定在SCI来源期刊、EI来源期刊、核心期刊、CSSCI、CSCD中的文献。由于智能汽车又被称为智能网联汽车、无人驾驶汽车、自动驾驶汽车等,因此本研究将智能汽车、智能网联汽车、自动驾驶汽车、无人驾驶汽车均作为检索关键词。另外,发表时间限定为2009-2018年,初步筛选出600余篇相关文献,人工剔除无人机、导弹、地铁、轨道交通、列车、农机、宣传稿类等与智能汽车不相关的文献,最终得到301篇有效文献。
本文采用SATI文献题录信息统计分析工具进行高频关键词的提取,运用SPSS进行高频关键词的因子分析和聚类分析。
采用SATI对筛选出的301篇论文进行字段提取,共获得关键词886个。由于获得的886个关键词中,存在同义词、近义词等现象,故将同义词与近义词进行合并,如:智能网联汽车、自动驾驶汽车、智能车与智能汽车合并为智能汽车,无人驾驶车辆、无人驾驶车与无人驾驶汽车合并为无人驾驶。而无人驾驶和智能汽车是两个不同概念,两者不可混为一谈。无人驾驶是汽车的智能网联化的最终状态,智能汽车是汽车实现无人驾驶的过度状态。最后用SATI文献题录信息统计分析工具提取出前100个高频词,并进行相应的频次统计。表1列出了词频大于4的关键词。
图1 解释总方差矩阵
表1 关键词词频统计表(频次大于4)
3.2.1 因子分析
因子分析的主要作用是在样本中指标较多时,通过因子分析可以找出少数几个主要指标来代表整个研究样本。由于词频在4以上的高频关键词数量较多,因此对智能汽车领域词频在4以上(含)的关键词(43个)进行因子分析(见图3)。从图3可以看出,前22个因子特征值较大,前22个因子的旋转平方和累计为68.359%,且特征值均大于1,因此选取前22个因子为主因子来描述整个样本。
3.2.2 聚类分析
传统分类法是专家凭其经验和专业知识进行的分类,存在很大程度的主观性和随意性。而聚类分析法,可有效解决科学研究中多因素、多指标的分类问题[13]。
SPSS作为高频词相异矩阵的分析工具,采用系统聚类法对图2中得出的前22个高频关键词进行聚类,得到较为合适的7个类团(见图5)。
图2 聚类分析图
综合考虑关键词涉及具体的文献内容,综合关键词信息给每一个类团提取出一个名称,具体分类结果见表2。
表2 共词聚类结果
综合因子分析、聚类分析以及共词知识图谱的分析结果,可以发现智能汽车行业的研究热点。结合相关文献的具体内容,对以上主题词进行分析和阐述。
1)智能汽车关键技术。此类团主要包括路径跟踪、环境感知、电车难题、汽车工程、GPS等领域。智能汽车与普通汽车的不同在于:①可根据GPS定位系统及电子地图,判断出自身所处的位置;②各类传感器组成的智能汽车环境感知系统,可获得汽车周围环境信息;③根据环境感知系统探知的人、车、路、交通标志等环境信息,自动驾驶系统做出合理决策命令并促使汽车执行。从类团一的关键词可以看出,当前学者已经对定位系统、路径识别和环境感知系统研究力度较大,形成了一定了规模和研究结构。另外,电车难题是智能汽车的伦理困境,是智能汽车实现商业化过程中不可避免的一项难题。当无人驾驶汽车在面临不得不发生碰撞时,如何选择碰撞目标,即构成“电车难题”[14]。可见,我国学者已将电车难题作为了智能汽车的重点研究领域。
2)车联网与信息安全。此类团主要包括智能交通、车联网、信息安全。汽车要实现无人驾驶,仅从汽车智能网联化角度发展还是不够的,智能汽车必须走在智能的路上,才能实现真正的无人驾驶。这里就需要:①汽车实现车联网。汽车实现无人驾驶的路径可以分为汽车智能化和网联化,可见车联网是智能汽车实现无人驾驶的必要条件。②交通实现智能化。结合对应的文献,可以发现,与智能汽车相关的智能交通研究主要集中在车路协同(车与交通标志、交叉路口等)、多模式驾驶车辆(普通车辆与不同智能化程度的汽车)共存情况下的行驶安全等方面。多模式协同驾驶是智能汽车发展过程中必须经历的一个不可或缺的阶段[15]。另外,汽车实现联网后,车辆和个人的信息很有可能被恶意获取或遭到黑客攻击,由此带来的信息安全已成为学者们研究的重点领域。
3)汽车安全与责任。此类团主要包括人工智能、产品责任、自动驾驶、汽车安全、ADAS、法律责任、交通肇事。智能汽车是人工智能技术应用的重要领域。人工智能技术在汽车上的应用,促使自动驾驶系统逐渐代替驾驶员,从而汽车具备自动驾驶的功能。然而一旦自动驾驶的汽车出现交通事故时,交通事故责任者归属问题就非常值得探讨。由于自主系统的引入,自动驾驶领域的产品责任在缺陷和因果关系认定方面将面临特殊困难[16]。高级辅助驾驶系统(Advanced Driving Assistant System)简称ADAS。考虑汽车安全性和成本等因素,传统车企在实现智能汽车的研究路径上采用的是汽车逐步实现无人驾驶,这样就诞生了ADAS,随着ADAS功能的增加最终实现无人驾驶。因此,ADAS和ADAS功能可能产生的汽车安全问题也必将是智能汽车的研究热点。
4)交通工程。此类团主要包括交通工程、自适应巡航控制。目前,我国交通基础设施还不完善,交通标志种类众多、大小不一、存在着颜色差异[17]。这对智能汽车的上路形成较大阻碍。自适应巡航控制是ADAS功能的一种,也是目前比较热门的一个研究领域。
5)深度学习技术。此类团主要包括深度学习、卷积神经网络。卷积神经网络是深度学习的一种代表算法。深度学习技术在智能汽车的感知层、决策层与控制层具有广泛运用[18],深度学习技术将促进汽车自动驾驶技术快速发展。