实际数据驱动的纯电动汽车途中充电潜在偏好行为分析

2022-02-22 06:53涂辉招

同济大学学报（自然科学版） 2022年1期

李浩，陈钰，俞璐，涂辉招

（1.同济大学道路与交通工程教育部重点实验室，上海 201804；2.上海市英特尔亚太研发有限公司，上海 200241；3.厦门市国土空间和交通研究中心，福建厦门 361000）

上海充换电设施公共数据采集与监测市级平台统计数据显示，截止2020年12月底，上海市新能源汽车已经超过42万辆，全市充换电设施共计376 908个，车桩比约1.1：1。然而，公共充电桩的使用率仅为1.95%。巨大的充电需求与较低的公共充电桩使用率共存，表明新能源汽车用户充电需求的时空分布不均衡，也在一定程度上反映了公共充电桩布局与用户充电需求不匹配。充电桩是充电行为的载体。对新能源汽车用户充电行为进行科学解析，是完善充电桩布局配置的基础。电动汽车用户群体存在个体偏好差异，呈现不同的充电行为特征。甄别充电用户群体，对不同群体用户途中充电行为进行解析，可以更真实地理解用户充电行为，为充电设施布局提供更科学的技术支撑。

根据充电位置的偏好，充电行为可以分为两类：固定充电行为和灵活充电行为［1-2］。灵活的充电行为是指发生于公共充电桩的途中充电行为，与公共充电桩的配置密切相关。分析途中充电行为的常用的方法是离散选择模型［3-7］。而针对电动汽车潜在类别用户充电行为的研究大多使用潜在类别Logit模型（latent class logit，LCL）。如Yu和Mackenzie［4］利用LCL模型发现某些类别的用户，在家中或一天的最后一次旅行之后更有可能进行充电。Wang等［8］则应用LCL模型识别服务敏感型和注重务实型两类用户。纯电动汽车（battery electric vehicle，BEV）由于电池容量的限制，续航里程仍小于燃油车［1］。电池在行驶途中动力耗尽的担忧通常被称为里程焦虑［9］，影响了BEV用户的充电选择。不同风险态度的用户群体呈现不同程度的里程焦虑。Pan等［10］基于160份中国EV用户问卷，利用LCL模型将EV用户人群分为风险规避型和风险追求型两类用户。但Pan等［10］使用的是用户陈述偏好数据。近年来，部分学者利用充电桩交易数据［11-13］甄别BEV用户充电行为的类型，但由于缺乏电池电量、行驶时间等BEV用户行为真实数据，因此无法全面了解BEV用户充电行为机理。

本文开展数据驱动下BEV途中充电潜在偏好行为分析。基于BEV实际运行数据，采用K-means聚类方法对充电用户进行聚类分析，对不同类别的BEV用户途中充电行为进行解析，揭示电动汽车用户途中充电行为特征，探究途中充电行为规律，为充电设施科学合理规划布局提供技术支撑。

1 分析模型

数据驱动下BEV途中充电潜在偏好行为分类分析模型主要包括三部分：数据预处理、途中充电行为识别和潜在偏好聚类分析。总体流程图如图1所示。

图1 数据驱动下BEV途中充电潜在偏好行为分类分析流程Fig.1 Data-driven classification process for BEV enroute charging behaviors considering latent preferences

1.1 数据预处理

受设备故障、信号干扰等因素影响，原始采集到的BEV数据存在错误的车辆状态、异常的累积行驶里程和SOC（电池电量）、超出边界的GPS（全球定位系统）坐标、重复记录等问题。首先开展数据清洗和筛选有效数据等数据预处理工作。数据清洗的工作主要包含数据去重和异常数据处理两方面的内容。异常数据包括SOC为负、速度为负、累积行驶里程变小、车辆运行状态错误等。异常数据处理主要根据字段间存在的逻辑约束，对相关字段进行分析，补全空值、零值、缺失值，修正错误的数值［14］。

1.2 途中充电行为识别

为研究BEV用户途中充电行为，需要对BEV用户的充电事件进行划分与识别，并根据充电位置对充电地点进行分类。

1.2.1事件识别与划分

出行识别是从时空信息提取出行信息的过程.基本思路是根据GPS轨迹中的停留和移动状态，将GPS轨迹分段，确定每一次出行的开始和结束时刻。国内外已有相对成熟的GPS出行识别研究，主要通过寻找符合车辆“停留”时特征的连续记录点判为“停留”状态。本文中BEV的电池电量状态变化为出行识别增加了新的维度，即充电状态。为保证数据的连续性和有效性，对数据集进行充电事件和出行事件的划分处理。事件的识别基于以下三个规则：

（1）识别修正停留段：识别车辆行驶里程长时间保持不变且车辆速度持续为0的事件段，更改为停留状态。长时间停留状态的阈值设10 min，即10 min以上为停留段，10 min以下可能为行驶过程中暂时停留，如拥堵或停车缴费等行为。

（2）识别修正充电段：以SOC开始上升时刻作为充电开始时刻，以SOC停止上升时刻作为充电结束时刻。若SOC达到100%，将SOC达到100%的时刻作为充电结束时刻，而非拔掉插头时刻。此外，识别长时间处于充电状态的数据段，对记录时间出现大幅跳跃的相邻数据进行分割。

（3）识别修正行程段：累积行驶里程发生变化且速度不为0的记录段为行程段。此外，识别长时间处于行驶状态的数据段，对记录时间出现大幅跳跃的相邻数据进行分割。

最后，将行程段与充电段按时间顺序整合，形成能够反映用户出行行为与充电行为关联的事件集。对间隔时间较短的同类事件段进行拼接处理，以获得更加接近实际的事件集合。事件集的字段包含：事件开始与结束的时间、SOC、位置等。事件间未被记录的时间段为停留段或数据缺失段。

完成事件集的创建后，依据以下条件判定事件的合理性及有效性：①充电段前后存在累积行驶里程变化；②充电段首尾有电池电量状态的上升；③充电时长或行驶时长短于10 h，大于2 min；④单个行程段距离不超过180 km。

1.2.2途中充电行为识别

根据电动汽车用户的充电位置对途中充电行为进行识别，若能判断充电位置是住址或工作地，则该充电行为是固定地点充电行为，否则为途中充电行为。

首先对BEV用户的家和工作地进行识别，删除节假日出行记录。Wu等［15］指出识别用户的工作地点需关注两个指标：长时间在非家地点的停留、到达这个非家地点的频率。假设用户在一天的最后一次行程结束至第二天的第一次行程开始处在相同位置，通过分析多日数据记录中白天与夜晚的长时间停留（超过2 h）的地点，统计提取家与工作地位置。由于住址或工作地周边存在多个充电桩停车位，经纬度略有差别，实际上应识别为同一位置，因此本文提出一个位置识别算法，提取家和工作地点。识别流程如图2所示。首先筛选出大于2 h的整合停留段，通过停留段的时间分布（白天或夜晚）确定是否为家或工作单位的候选点。其次，根据图2右侧的位置筛选算法，识别记录次数大于一半出行日（出行天数的记录数，用T表示）的位置，从而筛选出经常性、高频率、长时间的地点作为家（夜间时段）或工作地点（白天时段）。

研究前期针对25辆车的小样本数据，对筛选出的家和工作地进行了验证。通过对照地图，确认家和工作地位置的POI（住宅区、工作区）是否正确，不断调整图2参数使得筛选的位置与实际用地性质一致。然后，使用验证后的筛选方法对大样本数据进行处理。未对300辆BEV车辆的数据逐一验证，采用了随机抽样的方法进行部分验证以保证停留点识别结果的准确性。

图2 家和工作地位置识别流程Fig.2 Home and work location identification process

获取各BEV用户家和工作地位置后，对数据进行检验。若家和工作地的位置同时存在，认为该BEV用户为通勤用户；如果工作地位置不存在，或家和工作地位置距离过近，认为该BEV用户为非通勤用户；若住址位置不存在，则标记该BEV数据无效，作删除处理。通过剔除各BEV用户在家或工作地的充电事件，可得到所有用户非家和非工作地的充电事件，即完成了途中充电事件集的创建。

1.3 途中充电行为潜在偏好聚类分析

BEV用户在公共充电桩的途中充电行为具有时空不确定性，但BEV用户对充电的偏好可能具有一定的规律性或相似性。对BEV用户途中充电行为潜在偏好模式进行细分，可以获取BEV途中充电行为的异质性和规律性等特征。聚类分析可以在没有给定明确界限划分的情况下，根据数据相似程度对样本进行分组，有效实现对用户途中充电潜在偏好行为的划分。K-means聚类［16］是基于距离的无监督式非层次聚类算法，在大数据处理方面表现出比系统聚类更强的优势。本文从计算复杂性低、高维数据等方面考虑，选用K-means聚类方法，其原理是在最小化误差函数的基础上将数据划分为预定的K类别，采用距离作为相似性的评级指标，相似性度量主要依据欧氏距离。K-means聚类算法需要人为输入分类数目，一般应用“肘部法则”计算最佳分类数。肘部法则的计算原理是以成本函数最小化为目标.在选择类别数量上，肘部法则会把不同K值的成本函数值作图。随着值的增大，平均畸变程度会减小；每个类包含的样本数会减少，样本离其类质心会更近。但是，随着K值继续增大，平均畸变程度的改善效果会不断减低。K值增大过程中，畸变程度的改善效果下降幅度最大的位置对应的K值就是肘部，即最佳分类数。

2 实际运行数据分析与讨论

2.1 数据概况

BEV数据来自上海新能源汽车公共数据采集与监测研究中心（SHEVDC）［17］，包含2016.9～2017.9期间，300辆BEV一年的实际运行数据。安装在BEV汽车内的车载信息采集传输终端，通过GPRS无线传输技术，以一定的时间周期（通常30 s）定时向SHEVDC发送车辆充放电、移动、停止等状态的运行数据。数据字段主要包括：采集时间、GPS位置、方向、累计行驶里程、速度、SOC等。表1给出了BEV的原始数据（由于隐私，纬度信息未在表格中显示）。车辆当前状态字段一栏中，1表示移动；2表示充电；0表示停止。

表1 BEV原始数据Tab.1 Raw data of a particular BEV

2.2 途中充电行为特征分析

剔除样本BEV中7辆年总出行里程不足200 km，总充电次数不足5次的BEV，剩余293辆BEV中共提取36 932个有效充电事件，其中途中充电样本为3 508个。通勤（89名）与非通勤用户（204名）不同位置充电事件占比如图3所示。通勤用户94%的充电事件发生在固定充电地点，非通勤用户为87%。两类用户在家充电事件占所有充电记录分别为65%和87%，占比最大。通勤用户途中充电的占比仅6%，非通勤用户为13%，途中充电行为占较低，主要发挥应急补充或顺路充电（如购物等）的作用。

图3 通勤与非通勤用户充电事件占比Fig.3 Proportion of charging events for commuters and non-commuters

对通勤用户和非通勤用户不同充电地点的充电开始SOC（图4）、充电时长（图5）作交叉分布箱形图，图中自上而下分别是最大值、上4分位数、中位数、下4分位数及最小值，其余散点是异常值。

如图4所示，通过独立样本T检验分析表明，两类用户公共充电桩充电初始SOC无显著性差异。比较在家充电的初始SOC差异，可以发现通勤用户在家充电的起始电量较低，这是因为通勤用户行程规律，在家充电的情况一般为晚上下班，因此电量较低；而非通勤用户在家充电情况多样且频繁，更容易在电量较高时到家并开始充电。通勤用户工作地点初始SOC水平较家和途中高，因为大部分通勤用户将在家充电作为主要充电模式，工作地充电作为补充，在家满电出发，到工作地再继续补充。两类用户在家充电的初始SOC水平较途中充电更高，原因是用户午夜即使在电量较高时，仍会出于习惯在家充电，但途中充电是由于电量即将耗尽或低于安全电量，用户因里程焦虑而选择附近充电桩充电，因此初始电量较低。

图4 通勤与非通勤用户在不同充电地点初始SOC箱型图Fig.4 Initial SOC box diagram for BEV commuters and non-commuters at different charging locations

图5给出了通勤和非通勤用户在不同充电位置的充电时长。通勤用户充电时长分别为家＞工作地＞公共充电桩，这符合固定地点充电时间较长，途中充电时间较短的预期。通勤用户在家的充电时长大于非通勤用户。由于本文充电时长的判定标准是充电开始到拔掉插头或电量到达100%的充电时长，因此结论与通勤用户在家充电初始SOC较低相吻合。通勤用户与非通勤用户的途中充电时间中位数、下4分位数大致相似，但通勤用户上4分位数较长，这说明通勤用户途中充电的异质性较强，一部分用户偏好长时、慢充，但更大一部分用户偏好短时、快充；非通勤用户途中充电大多偏好快充。

图5 通勤与非通勤用户不同充电地点下充电时长箱型图Fig.5 Charging duration box diagram for BEV commuters and non-commuters at different charging locations

2.3 途中充电行为聚类分析

BEV用户途中充电行为异质性较强，但通勤与非通勤用户在途中起始SOC方面没有显著差异。为研究可能被掩盖的“特殊”途中充电模式，对途中充电行为进行细分，探究用户途中充电行为的潜在分类与偏好差异，对不同类别用户的途中充电行为进行群体差异分析。

K-means聚类分析需确定参与聚类的特征指标，避免使用相关性较强的变量进行聚类，通过皮尔逊相关性检验，选取初始SOC［3］、距离上次充电的行程距离［3］、充电时长［18-19］、充电速度［20］4个变量作为聚类指标：①充电开始SOC能够在一定程度上反映用户的里程焦虑；②距离上次充电行驶距离能够反映用户对电池的利用策略；③充电时长能够反映用户的停留时间偏好；④充电速度由充电段稳定电流来表示，电流绝对值越大，代表充电速度越快，用以反映用户对快慢充的偏好。

根据肘部法则和成本曲线（图6），选取最佳聚类数为4。通过K-means聚类算法，将途中充电事件样本聚为4类，聚类结果如表2所示，包括各类样本比例和聚类中心。

图6 成本函数曲线Fig.6 Curve of cost function

表2所示，聚类得到样本规模不同的4类组群，其中组群1包含了44.3%的样本，组群2包含了30.2%，前两类途中充电模式占据74.5%的样本数量，代表了BEV用户途中充电行为偏好模式。组群4占比最少，为9.9%。

具体分析每一类途中充电行为模式的特征，对比组群间属性特征分布，得到不同组群的特征规律，如图7所示。表3归纳总结图7中不同组群的潜在偏好差异性。

表3 途中充电行为组群特征总结Tab.3 Summary of cluster characteristics of enroute charging behavior

图7 途中充电行为组群特征分析Fig.7 Cluster characteristics of en-route charging behavior

（1）组群1：低焦虑快充模式

组群1包含了44.3%的途中充电样本，表现出较低的充电起始SOC，较高的上次充电行驶里程，归为低焦虑用户。偏好快充和较短的充电时长（以150 km纯电里程计算，－50 A的电流能够在2 h内为样本车型加至满电）。这种模式反映了用户有经验和良好的电池使用策略，在接近耗尽电池里程或达到最低可接受SOC的时候选择较为快速的充电模式，充电时间短。因此组群1可归纳为低焦虑快充模式。

在硅晶圆上用磁控溅射、紫外光刻、离子束刻蚀工艺制备的镍铬薄膜电阻线宽精度≤±5%,阻值均一稳定,电阻精度≤±0.5%,电学性能优异,在高精度硅基无源集成电阻器方向有广泛的应用价值。

（2）组群2：高焦虑快充模式

组群2包含了30.2%的途中充电样本，表现出较强的快充偏好，与组群1相似；不同之处在于组群2表现出较高的充电起始SOC和较短的上次充电行驶里程，在使用电池方面表现出高焦虑状态。组群1、2共同构成了74.5%的样本数量，意味着大部分样本BEV用户在途中充电时更加倾向于使用快充模式。因此组群2可归纳为高焦虑快充模式。

（3）组群3：高焦虑随时充电模式

组群3包含15.6%的途中充电样本，充电起始SOC与上次充电行程距离的分布较为分散，可以认为这类用户在途中充电时，电池电量状态对充电行为的影响不大，一旦有充电机会就进行充电。但总体而言，组群3在电池使用方面属于高焦虑用户，其聚类中心充电起始SOC均值很高（49.5%），超过其他三个组群。因此组群3可归纳为高焦虑随时充电模式。

（4）组群4：目的地充电模式

组群4是4个组群中占比最小的。与组群1类似，表现出较低的充电起始SOC，较高的上次充电行驶里程，但充电时长较为分散，偏好慢充，电池使用焦虑较低。这类用户可归纳为目的地充电类型，将活动与充电相结合，充分利用活动时间进行充电。此类充电行为与通勤用户的工作地充电模式相似，但在前期数据处理中已将工作地充电事件记录从样本中删除，因此推测此类组群充电时应包含除工作以外的出行活动，例如购物、娱乐等。但此类充电模式占比较小，推测用户将长时间活动与充电事件相结合的行为在现实中除固定地点以外的应用场景较少。

2.4 途中充电行为特征与组群特征的关联研究

通过分析途中充电行为其他特征与组群类型、通勤特征的关联性，进一步刻画BEV用户途中充电行为的差异性，揭示充电行为规律。

（1）途中充电开始与结束时刻关联特征

充电开始时刻表示用户开始途中充电的时间，充电结束时刻表示用户结束充电或者充电达到100%的时间。由图8可知，低焦虑快充、高焦虑快充和随时充电三类用户充电时刻分布相似，集中于中午、下午和晚上，少见于凌晨和上午。同时，这三类用户结束充电时刻的分布与开始充电时刻相吻合，集中于中午、下午和晚上。由于这三类用户占据超过90%的样本，三个组群的开始充电时刻分布能够代表上海市BEV用户途中充电开始时刻分布，可为未来研究提供数据基础。目的地充电用户表现出夜晚和凌晨的充电高峰，上午时段的充电结束高峰，与另三个组群有显著差异，可见目的地充电常与夜间休息时间相结合。

图8 四类途中充电行为组群充电开始与结束时刻分布图Fig.8 Distribution of charging starting and ending time of the four types of en-route charging behaviors

（2）组群比例关联特征

图9统计了通勤与非通勤用户组群比例分布，可以看出在非通勤用户中，低焦虑快充模式占据最高比例（46.05%），高焦虑快充模式占31.67%，快充模式共占77.72%。上海非通勤用户中存在一部分网约车司机，在一次订单结束时或想要休息、用餐时，将车辆停靠附近充电桩快充，快充结束后继续接单。目的地充电用户占据最低比例（8.7%），与总样本中组群分布的情况相似。在通勤用户中4种组群占比差距较小，该结果可能受样本量的影响，因为本文识别的89位通勤用户途中充电事件数量较少，大多在家或在工作地充电。样本BEV通勤用户途中充电事件的数量仅占非通勤用户的15.5%。

图9 通勤与非通勤用户组群比例分布图Fig.9 Proportion of BEV commuters and non-commuters

3 结论与展望

基于位置识别算法甄别途中充电段，以初始剩余电池电量、上次充电后行驶里程、充电时长和充电速度为核心指标，利用K-means聚类方法进行BEV用户途中充电行为潜在偏好分类，并基于上海市300辆150 km续航里程BEV车载实际运行数据开展了模型验证，主要结论：

（1）提出了BEV实际运行数据驱动、结合电池电量状态变化和GPS位置信息的BEV出行车辆停留段、出行段和充电段的识别方法；

（2）提出了BEV实际运行数据驱动的家和工作地位置的识别算法，区分通勤与非通勤用户，甄别非家和非工作地的途中充电事件；

（3）利用K-means，BEV用户的途中充电潜在偏好行为可聚类为低焦虑快充（44.3%）：表现出较低的充电起始SOC，较高的上次充电后行驶里程，偏好快充和较短的充电时长，具有良好的电池使用策略；高焦虑快充模式（30.2%）：偏好快充模式，但充电起始SOC较高；高焦虑随时充电模式（15.6%）：充电起始SOC高且分散，偏好慢充；目的地充电模式（9.9%）：活动与充电相结合的充电模式；

（4）高焦虑快充、低焦虑快充和随时充电模式的途中充电行为具有相似的充电开始与充电结束时刻分布，集中于中午、下午和晚上，少见于凌晨和上午。目的地充电模式的充电开始与结束时刻的分布与前三种类别具有显著差异。

本文虽然使用同一车型BEV运行数据，但提出的BEV途中充电段甄别方法和潜在偏好分类算法均可推广至其他车型。后续研究可扩大研究的样本量及车型，进一步验证结论的可靠性和有效性。

作者贡献声明：

李浩：论文主要构思者，指导数据分析，模型构建及论文写作。

陈钰：数据分析，模型构建，论文撰写。

俞璐：数据分析，论文撰写。

涂辉招：数据分析指导，论文撰写指导及修改。