孙 凯,白哲哲,韩志军
(中国电子科技集团公司第三十研究所,四川 成都 610041)
车联网即车辆物联网,是指利用新型信息技术,实现车与相关实体之间的连接,提升车辆运行的整体智能化水平。数字化、网联化、智能化是未来汽车电子发展的趋势,车联网、车辆电子信息系统、自动驾驶系统、车辆传感器系统、用户个人数据等不同层面都将面临各种各样的网络安全风险。中国信息通信研究院发布的《车联网网络安全白皮书(2020 年)》显示,2019 年,因为网络和数据安全问题导致的汽车安全事件占比高达57%[1]。为此,各国针对车联网和汽车电子系统信息安全纷纷制定了相关标准,学术界也针对车辆信息系统攻击和防御开展了前沿学术研究。
2020 年,我国工业和信息化部委托中国信通院等机构联合编制的《车联网网络安全白皮书(2020 年)》,分析了与车联网网络安全有关的标准制定、安全威胁、安全防护策略等,为车联网安全发展提供参考[1]。2022 年3 月,国家发布了《车联网网络安全和数据安全标准体系建设指南》,针对车联网亟需的终端与设施网络安全、通信安全、数据安全等方面的标准制定进行了规划,支撑车联网和智能网联汽车未来的产业化发展[2]。
在2021 年USENIX Security、NDSS、IEEE S&P、ACM CCS 等网络安全的顶级学术会议中,多篇论文对车联网或车辆信息系统的新型安全攻击进行了研究和试验测试,揭示了车联网系统中存在的不同于传统网络的新型网络攻击。
针对自动驾驶系统用来进行环境感知和同时定位与地图技术(Simultaneous Localization And Mapping,SLAM)的摄像头,利用传统摄像头采集数据+AI 自动图像数据分析与人工干预驾驶相结合的手段可以很好地避免针对摄像头及其后端物体识别AI 算法的伪造物体样本攻击。美国马里兰大学研究团队的Wang 等人[3]发现了一种被命名为ICSL(I-Can-See-the-Light)的新型攻击,针对传感器数据源,该攻击可以基于肉眼不可见的红外光,对特斯拉Model 3 的摄像头进行触发,让摄像头启动数据采集并误判物体。由于这种红外光对人眼是不可见的,这将对自动驾驶系统的图像识别分析构成严重安全威胁,对车辆周边环境和物体造成误判,导致引发严重事故。研究团队随后开发了相应的软件系统来防御该攻击。
对于配备了多个摄像头和LiDAR 雷达的自动驾驶系统,其是基于多个图像数据来源,基于多源数据融合(Multi-Source Fusion,MSF)感知技术进行环境感知的,对多个来源的数据进行相互印证、相互补充,基于多数传感器感知数据是准确的这一假设,融合分析后可以形成对路况和环境的准确感知。
加利福尼亚大学、密歇根大学、百度联合研究团队的Cao 等人[4]对于一种极端情况进行了设计验证:针对市面上主流MSF 算法和不同物体类别,在数据采集端,同时对车辆的所有摄像头和LiDAR 传感器进行并发攻击,90%的概率可以使其丧失对实验中使用的3D 打印物体的正确识别能力,从而引发严重撞击事故。团队研究后提出了相应的安全防御策略以避免该问题的发生。
纽约州立大学、乔治亚大学等联合团队的Zhu 等人[5]对基于深度神经网络识别技术的LiDAR 设备AI 模型对抗样本欺骗攻击进行了研究,对采集到的数据进行对抗样本欺骗攻击,破坏数据的分布特性使得模型误识别,达到攻击目的。通过分析对比基于激光的攻击和基于物体的攻击这两种攻击技术,该论文提出了一种新型的攻击手段:利用两个普通的商用小型无人机,控制其飞到正在行驶的车辆附近的指定位置,对负责位置和目标数据采集探测的自动驾驶系统的LiDAR系统进行雷达波反射干扰,致使其无法及时探测到前方车辆,导致撞车事故发生。
综上所述,目前国内外产业界和学术界都高度关注车联网安全。产业界主要立足于产业现状和近期发展,制定标准规范和法规,应用认证、加密、黑白名单等传统安全技术促进通信安全、终端安全、数据安全等安全防护措施的落地。学术界则主要对车辆数据采集感知和数据智能分析等方面面临的新型攻击前沿领域开展了大量研究,助力智能网联汽车产业化应用落地。
车联网数据安全需要从数据全生命周期进行体系性防护,对于数据安全和个人信息的保护,要遵循国家主要数据安全法规和汽车行业自身数据安全要求。
在数据感知采集中,智能网联汽车会通过车载的各类雷达、导航系统、测速仪、摄像头、声控、遥控等分类感知器持续采集车内外各种数据,包括车辆位置信息、速度信息、路况信息、周边环境、车辆运行数据、用户个人数据等各种信息,这些信息会在本地和云端进行存储处理,供车载和云端各类应用系统分析使用。由于采集手段各不同,数据类别差异大,安全和管理机制不健全,导致车载系统存在数据安全问题。
在数据传输中,车辆车载诊断系统接口、车内各类传感器可能会被攻击者进行通信信息篡改、窃听、中断、信号注入等,有可能造成无人驾驶或者自动巡航的汽车诱导偏航、急刹车等危险。智能网联汽车车内搭载大量基于蓝牙、Wi-Fi、卫星、移动通信网(2.5G/3G/4G 等)、V2X 等无线通信手段,易被攻击者通过身份假冒等方式进行监听和数据窃取等攻击;在通信过程中,无线通信未经加密很容易被攻击者窃取、窃听和篡改,造成信息泄露甚至被劫持操控,从而引发车辆被远程控制等危险。
在数据共享中,当车辆采集的各类数据跨不同网络或者系统的安全域之间进行信息汇聚和交换时,可能存在攻击者通过一个攻击点进入系统,从而对其他相连接的系统发起跳板攻击和横向移动攻击,对关键系统和信息造成安全威胁。
在数据存储和使用中,大量数据的汇聚和分析使用易受到数据治理不足、访问控制机制不完善、对敏感数据缺乏针对性保护等因素的影响,产生被攻击者非法访问、数据窃取、数据泄露、数据篡改等风险,造成敏感数据大量泄露和用户隐私泄露等严重问题。
综上所述,车联网数据攻击威胁模型如图1所示。
图1 车联网数据攻击威胁模型
车联网数据主要来源于车辆端侧的各类环境感知、导航定位、监控检测、人车交互、车车交互等传感器的采集和产生,并通过网络传送到云端进行汇聚和处理。这些数据从采集、传输、汇聚、共享交换、存储、计算使用等环节都存在不同的安全威胁。因此,针对车联网数据安全问题,一方面,需要采用传统数据安全手段,对数据传输、共享交换和分析使用等进行加密、认证、访问控制等严格的安全措施;另一方面,需要对数据智能分析使用的算法进行安全加固,谨防数据投毒攻击、对抗样本攻击等非常规攻击手段,以确保车联网中智能网联和无人驾驶系统的安全可控。
典型的车联网数据安全防护技术架构如图2所示。
图2 车联网数据安全防护技术架构
图2中,密码、认证、数据安全标签、信任服务等作为整个安全防护的基础,为各种安全服务的实现提供支撑,如加解密服务、认证服务、数据分级分类标签、信任度量等;数据脱敏、漏洞发现、数据访问行为追踪溯源、安全评估等安全治理能力,为数据全生命周期安全提供监管和防护;平台安全则通过全面的安全存储、协议加固、区块链数据确权、可信验证等技术,对数据平台和计算服务提供安全保护。
本文针对车联网数据安全问题,在车端和云端分别考虑,在上述技术架构下进行定制和剪裁,选取相应的技术路线。车联网数据安全将重点关注数据安全治理与监管、数据安全共享交换、数据隐私保护计算3 个方面。
在车联网环境下,车载端和云端的数据需要从全生命周期开展数据安全治理和监管。数据安全治理的基础是根据数据敏感程度的不同,对数据进行分级分类,将其划分为不同敏感等级,并采取不同的安全防护策略和手段,达到灵活高效的数据安全防护和隐私保护效果。数据安全治理与监管涉及数据全生命周期,需要对数据的权属、数据血缘关系、数据分级分类、数据脱敏、数据防泄漏、数据访问使用等进行全面的治理监管,对数据整个生命周期进行管控,及时发现数据流通过程中的安全问题,并及时响应。
数据安全治理是管理和技术双驱动的数据安全领域。在管理方面,需要遵循国家法律法规,制定完善的管理规定和标准规范,以支撑数据全生命周期各个环节的监管和运营;在技术方面,要积极突破相关关键技术难题,实现基于数据分级分类对不同敏感等级数据进行针对性的、适当的安全防护。核心技术包括:数据资产发现与可视化、数据分级分类、异常行为追踪溯源、数据流转管控、安全风险评估、数据安全态势监控等,实现对数据采集、数据传输、数据存储、数据共享、数据计算使用、数据销毁等各个环节的全程监管和控制。
车联网中,云端数据会进行互联网共享使用,面临较大安全威胁,尤其是特斯拉、滴滴等企业的数据。因此,数据的流通共享是数据安全领域的另一重大问题。数据流通包括数据出入境流通和数据流通交易两个方面。其中,特斯拉、滴滴等企业数据跨境流通需要遵循国家数据出境、入境法律法规,采取脱敏、审计、匿名化、假名化等适当数据安全保障措施,以保障数据传输过程中不被窃取和泄露;要实施数据本地化存储和分析,特别是跨国经营企业,在采集本国的数据时,只能在本国境内存储和分析使用;向海外提供业务服务的企业,可采取战略合作伙伴措施,只对外提供技术,数据和运营由当地所属国家的企业进行经营;在数据流通共享中,积极推动数字平台端到端加密普及化,实现数据安全有效保护。
在共享交换中,需要对数据内容、共享行为等做到可管可控、安全可信。主要利用密码加密、可信计算、身份认证、数据脱敏等技术,确保数据在共享交换过程中的安全。
车联网中存在大量涉及用户车辆的位置、运行轨迹、家庭住址、工作单位、个人信息、无线信号、周边环境信息等隐私数据,一旦遭到泄露,可能导致严重的后果,甚至威胁国家安全。车联网数据若想发挥价值,就要进行共享计算使用,使其支撑交通决策和智慧交通。在数据使用中,数据隐私保护计算成为当前数据安全的研究热点,通过隐私保护计算,数据可以在受保护、不泄露的情况下完成计算使用,达到保护隐私安全的要求。
当前数据隐私计算主要有3 条技术路径:
一是可信执行环境(Trusted Execution Enviroment,TEE),该技术基于密码技术构建可信根,保证在计算平台加载的代码和数据安全可信,目前Intel、ARM 等主流计算平台厂商都提出了自身的解决方案。
二是联邦学习(Federated Learning,FL),该技术采用了分布式机器学习架构,使得计算参与方共享计算模型而不是共享数据,从而保证数据不出本地完成联合计算。由于该计算模式能够做到数据不发生转移和对外交换,因此不会泄露数据隐私或影响数据使用。但该技术目前还存在适用范围受限、计算模型安全性等方面的问题需要突破。目前国内已有部分安全厂商提供了相应的安全产品和计算平台。
三是多方安全计算(Secure Multi-Party Computation,MPC),该技术起源于20 世纪80 年代姚期智院士提出的百万富翁问题,主要解决在互不信任的参与方之间联合计算一个函数的问题,能够使多个数据所有者在缺乏可信第三方,彼此不信任的情况下共同计算某个函数,得到各自该得到的输出结果。在计算过程中,各参与方除了自己的数据和自己应该得到的计算结果,不能获得任何额外的信息。目前国内已有厂商提供了相关产品解决方案。
上述3 条技术路径各有特点,需根据实际环境中的隐私保护场景和安全需求进行选用,其对比分析如表1 所示。
表1 隐私保护计算3 条技术路径对比分析
对于云端的车联网平台、网约车平台、车载应用系统来说,数据需要通过加密传输、数据脱敏、访问控制、去标识化等技术手段进行数据汇聚和使用过程中的隐私安全保护,避免用户参与交通过程中的敏感信息发生泄露。在车联网的边缘云中,出于保护数据隐私和安全的角度,可以采用联邦计算的技术架构,在原始数据不出本地的情况下,通过交换计算模型和参数完成分布式计算,达到保护各自数据隐私的效果。
在车端,主要针对本地各类传感器数据采集、存储、本地分析使用等开展防护,采用TEE本地计算平台可信保护、数据加密、访问控制、接入认证、智能算法模型可信保护等技术手段,抵御攻击者对数据的窃取、篡改、智能分析模型欺骗等攻击,防止隐私泄露,确保数据安全。
数据要素具有强烈的业务属性和行业属性。因此,无论是车联网数据安全的技术标准规范,还是具体的数据安全整体解决方案,都需要对行业特点进行针对性设计。目前,业内针对车联网数据安全的典型产品包括数据安全治理平台、数据脱敏系统、数据防泄漏系统、行为审计系统、隐私计算系统、数据安全网关等产品,并得到了落地应用。
本文对车联网数据安全场景下的云端服务平台数据保护、车端数据安全、数据安全治理、车联网跨境数据安全等典型数据安全场景,提出了安全防护技术架构和关键技术,在车端通过TEE 实现本地可信计算,在云端依托多方数据安全融合计算和联邦学习技术,实现数据隐私保护。通过该技术架构可以较好地解决车联网数据安全保护,为车联网数据保护提供支撑。