基于自主学习智能体模型的枢纽站流线仿真及其组织优化

2023-11-22 08:17:46姚奕鹏陈赛飞

工业工程 2023年5期

傅惠，姚奕鹏，陈赛飞

(广东工业大学机电工程学院，广东广州 510000)

枢纽站客流存在流量大、流线复杂的特点。科学有效的客流组织优化方案是提升站内交通流效率的重要手段。智能体模型仿真可针对枢纽站内实际交通流情况描述旅客站内的运动特征，从实际数据出发评估站内客流组织优化方案，相较于采用数值仿真的方案能够更加细致地描述站场交通流情况。为减少站内客流组织优化方案的构建成本，评估方案的有效性，基于自主学习智能体模型的枢纽站流线仿真技术十分必要。

现有的枢纽站客流组织优化方案的制定方法大致可分为两类。第1 类从宏观旅客交通流建模出发[1]，通过建立多种宏观评价指标[2]，利用宏观交通流规律，指导生成枢纽站的客流组织优化方案。例如，Liu 等[3]基于多层时间序列着色Petri 网络和多目标优化模型，研究地铁站应急疏散场景下的人员疏散方案。Guo 等[4]建立地铁站的疏散指标与乘客行为、电梯配置等运营因素之间的关系模型，结合多目标优化模型获得地铁站客流疏散最优化方案。第2 类从微观角度出发，依赖Anylogic、Legion 等基于智能体模型或元胞自动机的行人仿真软件，细致刻画行人个体的行为与交互[5-6]，结合运营效果评估指标[7]，生成组织优化方案并做出评价[8-10]。例如，孙立山等[11]以北京市宋家庄交通枢纽为例建立微观仿真模型，研究枢纽站的设施部署的合理性；Liu 等[12]基于Anylogic 仿真软件，研究分层次的城市火车站行人网络系统。

目前，采用宏观交通流建模的方法缺乏对枢纽站场客流状况的细致描述，难以生成可具体实施的应用方案；虽然微观角度建模的方法是基于智能体模型的微观仿真，但是缺少利用实际数据验证行人行为模型的手段，难以保证模拟的交通流模型符合实际规律。现有智能体仿真软件无法超出单个计算节点的性能局限，仿真规模和效率受到较大限制。

针对上述问题，本文从微观仿真角度出发，构建基于自主学习智能体模型的枢纽站流线仿真框架，提供了仿真中行人智能体对实际数据的学习能力。同时，通过分布式的智能体仿真计算框架，提供仿真超出单个计算节点性能限制的能力，仿真规模和效率得到较大提升。最后，以广州南站作为仿真场景，基于站场实际运营数据，利用所提出的枢纽站流线仿真，对站内客流组织优化方案进行评估。

1 基于自主学习智能体模型的枢纽站流线仿真框架

基于智能体模型构建的仿真，可以从枢纽站的各个要素出发，设计每一个要素智能体模型之间的交互行为，以此达到符合现实规律的仿真效果。19 世纪80 年代Bratman 基于对理性和意图的哲学分析，提出BDI 模型 (Belief-Desire-Intention, BDI)，将个体的思维组成定义为信念 (belief)、愿望 (desire)、意图 (intention) 3 个组件，提供了个体组成的抽象表达模型[13]。其中，信念表现为个体的能力和知识，代表个体对环境和自身的状态的认知；意图表现为个体为实现各种目标而采取的方法和计划；愿望表现为个体的目标。

BDI 模型能够有效描述实体的感知、决策、响应的过程，可体现人、机器等实体的行为逻辑，适合作为智能体模型的基本形式。该模型广泛应用于机器人等智能体系统的智能体设计框架中[14-15]。但是，BDI 模型在实际应用过程中，难以对实体的抽象逻辑进行描述，因此，本文结合实体的实际行为数据，提出能够拟合实体抽象行为逻辑的自主学习智能体模型。基于BDI 模型，本文任意智能体个体的自我推理和决策过程可抽象为如下过程 (见图1) ：智能体通过信念组件获取环境感知信息，由愿望组件基于环境信息生成当前的目标，意图组件获取当前目标结合环境信息，生成自身的动作或计划并实施，进而更新自身状态。

图1 基于BDI 模型的智能体自我推理和决策过程Figure 1 Self-reasoning and decision-making processes of agents based on BDI model

1.1 基于BDI 模型的智能体模型基本属性构建

考虑主要对枢纽站内的旅客和设施智能体的状态和行为进行仿真推演，本文基于BDI 模型，构建了可用于描述枢纽站内旅客和设施智能体行为的基本属性与属性更新模型。

智能体包含两类基本属性，分别是参数属性与方法属性。任意智能体i的参数属性如下。

1) 任务：智能体所需要完成的一系列任务流程，驱动智能体进行自身状态和行为推演。例如旅客智能体在站内的乘车流程。

2) 状态：智能体所具备的一系列需要被计算更新的状态信息。例如旅客智能体的空间位置、移动速度等信息。

3) 目标：智能体经过自我决策后生成的短期行动目标。例如旅客根据当前自身位置和检票口位置，决定下一时刻到达的位置。

对任意智能体i，其在t时刻的属性表示为

其中，Pi,t、Ai,t、Si,t分别为智能体i在t时刻的任务、目标、状态。

假设t时刻下智能体数量为N，那么，仿真中所有智能体的参数属性构成当前时刻环境Et= {Ci,t},i∈{1, 2, ···,N}。

任意智能体i的方法属性如下。

1) 环境感知方法。

在t时刻下，智能体i的环境感知方法Fiu中，智能体获取环境信息Et，结合自身参数属性Ci,t，筛选出智能体自身可获知的环境信息ei,t，获得当前需完成的事项pi,t，返回获知的环境信息ei,t和当前所需完成的事项pi,t。描述为

2) 动作决策方法。

在t时刻下，智能体i动作决策方法Fid中，智能体结合自身可获知的环境信息ei,t、当前所需完成的事项pi,t和自身的状态属性Si,t，计算生成并返回当前短期决策目标Ai,t+1。描述为

3) 动作实施方法。

在t时刻下，智能体i的动作实施方法Fia中，智能体获取当前短期决策目标Ai,t+1和自身的状态属性Si,t，计算生成并返回智能体下一时刻的状态属性Si,t+1。描述为

为实现智能体能够准确描述对应实体的自我推理和决策行为，赋予智能体学习实际实体行为的能力，对智能体的方法属性，采用如下两类构建方式。

1) 根据实体的决策逻辑过程构建。

若所需构建的方法属性行为的逻辑流程清晰且易于描述，可根据实体具体的推理决策过程，构建智能体的推理分析流程，对输入的环境信息、所需完成的事项和自身状态进行处理，输出短期决策目标，构建获得的方法作为该智能体的指定方法属性。

2) 通过实体的行为特征学习构建。

若所需构建的方法属性行为的逻辑流程复杂且难以描述，则考虑构建抽象描述模型对实体行为进行描述。首先需要构建实体的行为反馈模型，该模型旨在描述实体在自身的状态为u时，所能做出的行为o。该模型依赖实体的实际行为数据进行构建，行为反馈模型描述为

其中，h为行为反馈函数；U为已知的实体状态集合；O为已知的实体行为集合。

其次，构建行为描述模型对智能体的行为进行描述，即对任意可能出现的状态值u′，行为描述模型输出该状态下的行为o′。模型表述为

其中，g为行为描述函数；ω 为行为描述模型的参数；U′为实体所有行为集合；O′为实体所有状态集合。

再次，建立参数优化模型，对行为描述模型的参数进行优化，使智能体通过行为描述模型学习实体的行为特征。

其中，J为所有数据标签集合；uj、o′j、oj分别为第j个状态值、实体行为反馈、智能体描述值。

最后，将优化参数后的行为描述模型作为智能体的动作决策或动作实施方法，完成对智能体的动作决策或动作实施方法的构建。

该方法提供了智能体对实际数据的利用方法，通过该方法，可使智能体的描述更加符合实际规律，具备了基于实际数据的自学习能力。

1.2 枢纽站场要素的智能体属性模型建立

基于智能体模型，根据实际枢纽站场内要素补充对应仿真中各类要素的智能体模型的属性，以建立枢纽站旅客流线仿真的要素智能体模型。

枢纽站内要素包括旅客、人脸验证闸机、安检闸机、检票闸机、扶梯、商铺以及各种墙体，本文考虑建立边界、服务台和行人三类智能体模型抽象描述枢纽站内的要素，智能体模型与枢纽站内要素的抽象对照关系如表1 所示。

表1 枢纽站内要素抽象对照表Table 1 The summary and comparison table of elements in a passenger transport hub

1.2.1 边界智能体属性建模

边界根据墙体特性可抽象为不可穿透的边界，并且不需要更新自身的状态信息，在仿真中仅用于提供空间限制信息。因此，对仿真中边界智能体集合W中的任意边界w，其在t时刻的状态Sw,t定义为

其中，Ew为边界坐标序列，即按照在枢纽站场平面中该墙体的边界折线的节点序列形成的坐标点序列，n为节点序列点个数；Lw为边界所在楼层。

在构建智能体仿真时，将所有墙体按照其空间信息，构建为边界智能体。

1.2.2 服务台智能体属性建模

服务台根据闸机、扶梯等设施特性，定义为可穿透的一块功能区域，具备与行人交互、更新自身状态的功能。对仿真中的服务台集合E中的任意设施e，其在t时刻的状态Se,t定义如下。

1) 服务台的边界，包括层和边界坐标信息。

2) 服务台交互的位置，包括层和边界坐标序列信息，该边界坐标序列即服务台的服务区域多边形的顶点序列。

3) 与服务台交互后的位置LEe，包括层和边界坐标序列信息，该边界坐标序列即服务台的离开服务区域多边形的顶点序列。

4) 服务台内部包含的行人智能体信息集合，描述为Me,t，对任意信息，有，r为包含的行人，为集合中包含的第n个行人的进入时间。

5) 服务台窗口数目。

6) 服务台的单次服务时间Te。

7) 服务台的工作状态SOe,t，包括“开放”和“不开放”两类状态。

其任务属性Pe,t定义为

其中，Pe,t为服务台的运行时间表，服务台按照该时间计划调整自身服务的开放与否；tmax为最大仿真时间；为t时刻下服务台e的工作状态，值为“开放”或“不开放”。

图2 服务台智能体方法属性流程Figure 2 The framework of service agent method properties

对实际环境中的闸机与扶梯，将其入口抽象为服务台的到达位置，出口抽象为服务台的离开位置，工作区域抽象为服务台的边界，单次可通过人数抽象为服务台的窗口数目，由此可构建闸机和扶梯智能体参数属性。

1.2.3 行人智能体属性建模

行人在仿真中，具备感知周边边界和服务设施，基于自身状态做出行为决策的能力。对仿真中的行人集合R中的任意设施r，其在t时刻的参数属性定义如下。

1) 行人的位置Lr,t，分别为行人二维空间位置的横、纵坐标及其所在楼层。

2) 行人的任务序列，任务序列由一系列空间位置或服务台智能体构成。

3) 行人当前的目标，即行人每一时刻下生成的短期目标。

行人的方法属性定义如下。

1) 环境感知。

行人智能体根据自身位置以及感知范围筛选所能获取的仿真环境信息。同时，按照自身任务序列，结合当前位置判断是否已完成目标。若已完成，则更新待实现事项为任务序列中的下一任务；若未完成，则保留待实现事项的值。

2) 动作决策。

行人智能体读取待实现的事项，结合自身状态，判断是否已到达实现待办事项的位置。若未到达，则结合所需要到达的位置、可获知的环境信息和自身状态属性，通过路径规划算法 (本文采用A*算法[16])，规划生成行人智能体的路径，选择路径的下一时刻位置作为行人智能体的目标。若已到达实现待办事项的位置，且待办事项为一个服务台，则将该服务台作为行人智能体的目标。

3) 动作实施。

行人智能体读取当前目标，若目标为一个位置点，则按照行人运动学模型 (本文采用社会力模型[17])生成下一时刻行人的空间位置，并更新行人自身的状态属性。若目标为服务台，行人智能体不处于服务台中，且该服务台仍有剩余服务空间，则将自身放置于该服务台的行人智能体集合中。

行人智能体的所有方法属性构成的更新流程如图3 所示。

图3 行人智能体方法属性流程Figure 3 The framework of Process of pedestrian agent method properties

1.3 仿真场景中智能体属性更新模型

仿真推演的进行依赖于仿真环境中智能体的状态属性的同步更新。

在每一仿真时刻t时，环境中每一智能体i均按照以下更新模型生成下一时刻t+ 1 时的智能体属性，基本更新模型描述如下。

基于上述的仿真推进过程，结合枢纽站内旅客与设施实体的行为，补充旅客和设施智能体的属性，在仿真过程中实时记录各个智能体的属性信息，即可获得枢纽站场内旅客流线仿真的运行数据，进而对站场运营指标进行评估。

1.4 基于分布式计算的智能体仿真计算框架

对任意智能体而言，每一次更新计算过程中，除与环境交换信息外，其计算过程均可独立进行。因此，可构建多个计算容器，建立容器间的信息交换连接接口，使智能体在容器内可通过信息交换连接接口与其他智能体进行信息交换，即可将多个仿真环境中的智能体分布在多个计算容器内，利用多个计算容器的计算能力进行仿真，以提高仿真的计算效率。

本文通过分布式计算的方式，将系统中的智能体平均分配至各个已有的计算容器中，构成计算集群。通过网络代理方式接管集群中计算容器间智能体对环境信息的获取。同时，建立一个仿真控制器，连接至网络代理；构建属性导入方法，将初始智能体属性通过网络代理下发至各计算容器构建智能体；构建仿真驱动方法，用以控制所有计算容器并同步所有智能体更新；在仿真进行过程中，仿真控制器将对每一智能体的属性值进行汇总输出，保留至仿真数据库中。在计算集群中，智能体接收到仿真控制器的计算命令后，调用计算容器的计算资源，结合更新模型更新自身属性。构建的智能体模型分布式仿真框架如图4 所示。

图4 基于分布式计算的智能体仿真计算框架Figure 4 The agent simulation computing framework based on distributed computing

以上构建的智能体仿真模型的优点如下所示。

1) 实体模型构建更加真实。

相较于传统仿真抽象的规律描述方式，基于BDI 模型构建的智能体模型具备更加细致的行为描述能力，结合智能体的自主学习模型，使得仿真模型具有更加符合现实实体行为规律的潜力。

2) 支持多类实体混合仿真。

该智能体模型具备描述任意具有自我推理和决策行为的实体的能力，行人、车辆等实体均具备这种行为，通过对智能体自我推理和决策过程的具象描述，即可搭建多类仿真智能体模型，实现在单个仿真内多类实体的仿真推演。

3) 支持更大规模实体仿真。

传统仿真软件如Anylogic、Pathfinder 等，在行人仿真计算中，对计算性能的利用都局限于单台计算机上。本文通过智能体分布式计算方式，充分利用多台计算机的计算资源协同推进仿真，可支撑更大规模的仿真需求。

2 行人智能体模型误差评估实验

为评估智能体仿真计算框架中行人运动轨迹的误差，以某校食堂为实验场景，以133 名志愿者为实验对象，开展室内行人运动测试。实验过程中，为志愿者定义了各自的任务序列，志愿者需按照任务序列完成到达指定位置或服务台的任务。实验采集了133 名志愿者在实验场景中的运动时空轨迹，共3 296 份数据，采集时长为25 min。将志愿者的开始时空断面位置、结束时空断面位置作为行人智能体的任务，启动仿真获得仿真中志愿者的行走轨迹。

对每一行人智能体，令任意行人的第j条实际轨迹时空数据为qj。

其中，xj、yj、tj分别为该行人的第j条实际轨迹的横坐标、纵坐标、到达位置时间。

令行人智能体仿真中行人的第k条仿真轨迹时空数据为。

行人智能体运动轨迹误差评估指标为

其中，K为行人仿真轨迹数据标签集合。

该指标描述了单位仿真步长下行人智能体与实际行人运动的平均误差距离。其中，仿真步长为1 s，误差距离单位为m，指标单位为m/s。

使用上述指标对所有智能体的仿真运动轨迹进行误差评估，得到误差直方图如图5 所示。其中，91%行人智能体的运动误差落在[0,12.6]的范围内；9%行人智能体产生了大于12.6 m/s 的运动误差，即大部分行人智能体在单次仿真下产生的平均偏差小于12.6 m/s。这说明本文建立的行人智能体动作决策和实施模型能够在较小的误差范围内拟合行人在设施内部的运动行为。

图5 行人智能体模型运动误差Figure 5 Motion errors of the pedestrian agent model

3 基于枢纽站场旅客流线仿真的设施优化

枢纽站场运营过程中，在客流水平较低时期，通过减少各类服务设施的开放数量，可减少运营成本；在客流水平较高时期，枢纽站场的服务设施开放量应满足旅客站内的服务需求，提高旅客在枢纽站内的服务体验。枢纽站场的旅客进站流程分为实名验证、乘坐扶梯、安检候车。其中，实名验证过程中的闸机数量和安检候车过程中的安检通道开放数量会影响旅客在站内的服务体验和站场运营成本。为降低设施运营成本并提高旅客在站内的服务体验，以广州南站作为仿真场景，基于站场实际运营数据，通过上述智能体仿真计算框架构建枢纽站旅客流线仿真。

广州南站的日常规旅客出行量约为15 万人，主要集中于8 时至20 时。取2021 年12 月15 日广州南站的实际入站客流数据作为实验数据，当日入站旅客总量为165 306 人，每小时客流分布如图6所示。根据广州南站实际建筑布局和设施部署情况，实验中于广州南站模型的一层实名验证的东北区、东南区、西北区、西南区，分别部署了17、15、16、15 台实名验证设备；在一层与二层换层接驳处、二层与三层换层接驳处均部署3 台双向扶梯；在三层的候车区入闸处共计部署44 处安检闸机。基于分布式自主学习智能体模型的枢纽站旅客流线仿真如图7 所示。根据仿真获取设施运营成本和旅客站内运动时间，通过调整优化实名验证闸机和安检闸机的开放数目及时间计划表，达到最小化枢纽站的设施运营成本和旅客站内通行时间的目标。

图6 客流需求和优化方案Figure 6 Passenger flow demand and optimization solutions

图7 广州南站“实名验证”、“乘坐扶梯”、“安检候车”仿真 (下)、广州南站旅客进站仿真 (上)Figure 7 The passenger simulation of Guangzhou South Railway Station (top), the simulation of "Real-Name Verification", "Escalator Riding","Security Checking and Waiting" in Guangzhou South Railway Station (bottom)

优化模型为

其中，m为所有设施总体运行时间；l为旅客在站内的平均通行时间；a1、a2分别为设施成本和通行时间成本的权重；F为广州南站旅客流线仿真模型；Q、S分别为实名验证闸机、安检闸机的开放数目时间表；F为进站旅客数目时间表；f4,f5,···,f22分别表示广州南站一天内从4:00, 5:00, ···, 22:00 起始1 h 内的进站旅客数；q4,q5,···,q22表示对应时间段内实名验证闸机开放数；s4,s5,···,s22表示对应时间段内安检闸机开放数；M1和M2分别是实名验证闸机和安检闸机的数目。

输入的客流需求及优化结果如图6 所示。图6的客流需求为平峰时间段下的每小时进站旅客数。根据优化结果可知，闸机开放数量与旅客数量成正比，在高客流时期应开放更多闸机口，且实名验证与安检闸机的平均服务时间相似，求得两类闸机的开放数目也接近。

优化前后所有闸机的平均排队长度对比如图8所示。可见在应用优化方案后，闸机的平均排队长度增加幅度较小，对旅客在枢纽站内的运动不会造成较大影响。同时，相对于所有闸机开放的运营方案，选择性开启闸机的方案节省了大量闸机运营的成本，使闸机的负载率由100%降低至57%。

图8 优化前后闸机平均排队长度Figure 8 Average queue lengths of gates before and after optimization

因此，在客流平峰期，南站可参照图6 中实名验证设施和安检通道开放数目，调节站场的设施开放数目，降低站场的设施开放运营成本。

4 结论与展望

本文基于BDI 模型构建一种具备自主学习能力的智能体模型框架，结合其分布式仿真驱动，可支持规模大、种类多、逻辑复杂的实体仿真。在此基础上，以枢纽站场的客流组织优化工作为背景，构建枢纽站场的要素智能体模型，同时评估了行人智能体模型的误差。搭建了基于广州南站的“实名验证”、“乘坐扶梯”、“安检候车”流程的旅客流线仿真模型，构建设施计划表优化模型获得了广州南站各类设施的服务计划表。本文得到以下结论。1) 通过本文建立的智能体模型及其构造方法可支撑枢纽站内的行人流线仿真，以较低的误差模拟行人在设施内的运动行为；2) 广州南站的入站流线的设施能够满足日常运营的入站客流需求，多余的设施能力能够通过设施优化方案得以节省。

本文仅对站内旅客的行为进行整体的建模，未考虑到不同出行需求、不同出行时间下的旅客群体的行为差异。从站场运营服务的灵活性来看，考虑旅客行为的差异性，有助于站场更加灵活调整站内设施部署方案，提供更加稳定的出行服务。未来工作将从旅客群体角度出发构建旅客模型，进一步提升对站场旅客的描述水平。