基于车联网大数据的纯电动汽车行程识别算法

2023-08-27 15:36卓丽张亮程登黎飞谢燕芳
汽车电器 2023年8期
关键词:车联网大数据汽车

卓丽 张亮 程登 黎飞 谢燕芳

【摘  要】当前,车联网大数据驱使着智能汽车的发展,基于车联网大数据分析用户驾驶行为已成为必然趋势,但直接分析底层数据是非常困难的,需结合用户驾驶过程来分析。基于此目的,本课题提出一种基于车联网大数据的纯电动汽车行程识别算法,来实现对整车数据的聚合。

【关键词】车联网;汽车;大数据;行程识别

中图分类号:U469.72    文献标志码:A    文章编号:1003-8639( 2023 )08-0005-03

Trip Recognition Algorithm of Pure Electric Vehicle Based on Big Data of Internet of Vehicles

ZHUO Li,ZHANG Liang,CHENG Deng,LI Fei,XIE Yan-fang

(SAIC GM Wuling Automobile Co.,Ltd.,Guangxi Laboratory of New Energy Automobile,

Guangxi Key Laboratory of Automobile Four New Features,Liuzhou 545007,China)

【Abstract】At present,the big data of the Internet of vehicles drives the development of intelligent vehicles. It has become an inevitable trend to analyze users' driving behavior based on the big data of the Internet of vehicles. However,it is very difficult to directly analyze the underlying data,which needs to be analyzed in combination with the user's driving process. For this purpose,this topic proposes a pure electric vehicle travel recognition algorithm based on the big data of the Internet of vehicles to realize the aggregation of vehicle data.

【Key words】vehicle networking;automobile;big data;travel identification

1  緒论

汽车行业已经从机械1.0时代和电子2.0时代,步入智能3.0时代,在未来智能车载系统及自动驾驶技术必将引发一场革命,以汽车制造技术为代表的工业技术和以互联网技术为代表的信息技术势必将紧密融合,从而推动汽车行业技术创新。当前,车联网大数据驱使着智能汽车的发展。所谓车联网,是以车内网、车际网和车载移动互联网为基础,按照约定的通信协议和数据交互标准,实现车与车、人、路、服务平台之间的网络连接。车辆的运行往往涉及多项开关量、传感器模拟量、CAN信号数据等,驾驶员在操作车辆运行过程中,产生的车辆数据不断回发到后台数据库,由云计算平台实现对数据的“过滤清洗”,数据分析平台对数据进行报表式处理,供管理人员查看。

2  研究背景及意义

2.1  研究背景

经过报表式处理的车辆数据,虽然记录了车辆在行驶过程中产生的数据,但是直接分析该数据是十分困难且效率低下的。以某热门纯电动汽车为例,每台车每天产生的数据可达十亿数量级,直接对底层数据分析用户特征值显然是不现实的。而在数据分析的角度,一个车辆行程表征一个用户特征,用户的驾驶线路、驾驶行为以及出行习惯等数据标签都是基于一个行程来计算的。在此背景下,本课题针对CAN信号数据,提出一种基于车联网大数据的纯电动汽车行程识别算法,以满足海量的数据分析需求。

2.2  研究意义

该算法主要解决以下几个技术问题。

1)精准判断行程过程:当车辆处于行驶状态时,通过车联网获取车辆状态数据,再通过编写一套完整的算法逻辑,精确地判断每一个行程过程,并将其记录。

2)提升数据分析效率:对每辆车上传的车联网数据,将其以单个行程为颗粒度聚合,即将每天1万多条的数据汇总成几条行程数据,通过分析用户的行程数据,即可快速提取用户特征值,极大地提升了数据分析效率。

3)为标签体系建设打下基础:判断出一个完整的行程后,在单次行程中通过算法设计、算法开发以及离线任务计算,可获得更多有价值的数据,例如行驶里程、时长、速度等,这些计算好的数据称之为标签。将各类标签进行整合加工,同时对标签属性加以定义,建立起标签之间的网络联系,从而搭建起一个完善、动态的标签体系。

3  算法设计

由上一章节,本课题的主要目标为:基于车联网大数据,通过算法设计来判断车辆的行驶过程,将CAN信号数据汇总成行程数据。

3.1  纯电动汽车整车上下电的流程

在上电流程中,首先是VCU被唤醒(钥匙唤醒、网络唤醒、或者充电cc信号硬线唤醒),启动后发送请求闭合HVIL回路使能线和必要的12V低压继电器的CAN报文,同时监控HVIL回路状态,然后DCU、DC/DC、BMS被唤醒(VCU发送的网络管理报文或者IG ON信号唤醒)并进行自检,监控HVIL回路状态,对于BMS还需计算绝缘阻值,确认绝缘是否正常,无故障后进入待机模式(standby状态)。随后VCU请求BMS闭合主继电器,BMS则先后闭合主负继电器和预充继电器,当检测到母线电压达到阈值后,判断预充电成功,然后闭合主正继电器,并断开预充继电器,则高压上电完成。

在正常下电流程中,当检测到钥匙信号、硬线信号关闭或网络唤醒信号停发,VCU立即请求DCU离开工作模式,并且功率器件迅速降低功率,随后VCU请求DC/DC离开工作模式,然后VCU在请求BMS断开高压继电器,BMS完成响应后,VCU断开HVIL回路和低压继电器,各节点进入下电休眠流程。

在车辆上下电的过程中,还可能包含着车辆行驶过程,即车辆上电后,有可能行驶一段时间后再下电,也有可能一直保持静止直至下电。基于整车上下电的原理,整个行程识别算法设计将车辆的单次行程过程划分为4个时间节点:车辆上电、车辆行驶开始、车辆行驶结束、车辆下电。

3.2  算法整体设计思路

按照数据上传的时间先后顺序,依次读取整车CAN信号数据。在遍历数据的过程中,首先判断数据是否满足车辆上电条件,当读取到数据满足车辆上电条件时,记录车辆上电时间,同时开始计算行程数据。在车辆上电时间之后,依次判断车辆行驶开始条件、车辆行驶结束条件、车辆下电条件,当判断到满足车辆下电的条件时,整个行程过程结束。以上4个节点的判断算法如下。

1)车辆上电判断:按照整车CAN信号数据上传的先后顺序,依次读取数据,当读取到某一条数据满足整车高压状态为“动力预备”且电池包主正继电器连接状态为“连接”时,判断此时车辆处于上电状态,首条满足上电状态条件的数据对应的数据采集时间定义为车辆上电时间。

如图1所示,车辆在11:07:53时首次满足整车高压状态=“动力预备”且电池包主正继电器连接状态=“连接”,则该车辆的上电时间为2022/5/9 11:07:53。

2)车辆行驶开始判断:车辆上电后,在判断到车辆上电后,持续判断至数据满足整车高压状态为“动力预备”且整车运行状态为“行驶”且整车车速>0时,车辆开始行驶,其对应的首条数据采集时间定义为车辆行驶开始时间。

如图2所示,车辆在53s时上电,但车速=0,即表示此时车辆属于静止状态;在55s时车速=0.28125km/h且整车运行模式=“行驶”,表示此时车辆处于行驶状态,则车辆行驶开始时间为2022/5/9 11:07:53。

3)車辆行驶结束判断:若车辆下电时间对应的整车车速≠0(此时可能是车辆上传数据丢失导致,也可能是因为数据采集频率导致),则车辆行驶结束时间=车辆下电时间。

如图3所示,车辆在17:44:19时的车速为0.484375km/h,表示在数据上传时车辆仍处于运行状态,但此时车辆已下电,所以车辆行驶结束时间应等于车辆下电时间。

若车辆下电时间对应的整车车速=0,则在车辆行驶开始时间至下电时间中寻找满足整车车速全部=0的最后一个片段,该片段的首条数据采集时间为车辆行驶结束时间。

如图4所示,车辆在11:09:39时下电,且下电时对应的车速为0,从下电时间往前判断,发现从11:09:19开始至下电时间,车速全为0(车辆一直处于静止状态),说明车辆在11:09:19时已行驶结束。

4)车辆下电判断:若前后2条数据时间间隔≤60s,则满足整车高压状态为“动力断开”且整车运行状态不为“行驶”持续时长>6s(防止数据出现跳变)的首条数据为下电时间。

如图5所示,车辆在11:09:39满足下电条件且一直持续至11:09:47(持续时间大于6s),则11:09:39为车辆下电时间。

若前后2条数据时间间隔>60s(数据存在丢失情况),则取数据丢失前的末条数据时间为下电时间。

如图6所示,车辆在17:44:31时仍处于上电状态,但由于数据丢失,下一条数据上传时间为19:28:03,此时车辆数据上传时间间隔大于1min,则认为在数据丢失前车辆已行驶结束,17:44:31为车辆下电时间。

本算法将车辆的单次行程过程细分为4个阶段:上电、行驶开始、行驶结束、下电,通过4个时间节点完整且精确地表达了一次行程过程。同时,基于车联网大数据,通过算法逻辑将几万条底层数据计算成几条行程数据,以行程为最小颗粒度来存储车辆数据,既节约了存储成本,又提高了数据查询效率。

图7为某台车5天的数据量,共计40500条,通过行程算法计算后,可将该4万多条的数据浓缩成22条行程数据存储,如表1所示。再基于每次行程中计算车辆的各种数据,可以一条数据来表征用户驾驶行为。

4  总结

本课题针对整车CAN信号数据,设计出一个基于车联网大数据的纯电动汽车行程识别算法,该算法可带来许多有益的效果。

1)精准识别用户的每一次行程,解决底层数据无法直接分析的难题。

2)通过算法将底层数据汇聚成行程数据,数据量可由原先的十亿数量级降低至百万数量级。以行程为单位存储车联网数据,极大地降低了存储成本,同时提升了数据查询和数据分析效率。

3)基于单次行程,可计算出各类数据标签,这些标签表征了用户的驾驶特征,通过建设标签体系,将尽可能多的标签数据通过各种各样的方式组合,可得到不同的用户画像,从而赋能业务实现用户精细化运营和精准营销。

参考文献:

[1] 蒲文杰,张戈,陈双双. 分析大数据在车联网中的应用[J]. 重型汽车,2021(6):37-38.

[2] 吴金. 车联网大数据处理系统的设计分析[J]. 电子技术,2020,49(7):178-179.

[3] 安婧. 大数据在车联网中的应用探究[J]. 计算机产品与流通,2018(4):252.

[4] 芮祥麟. 大数据在车联网中的应用[J]. 软件和信息服务,2015(3):61.

(编辑  杨  景)

作者简介

卓丽(1999—),女,助理工程师,主要从事车联网大数据应用相关工作。

猜你喜欢
车联网大数据汽车
汽车的“出卖”
整合广播资源,凝聚声音优势
汽车生产企业发展车联网的优势与劣势
基于大数据背景下的智慧城市建设研究
汽车们的喜怒哀乐
中国车联网产业链与商业模式研究
3D 打印汽车等
汽车就要飞起来了等5则