贾新茹,闫立斌,张 永,李 永,冯 焱
(1.中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081;2.中国铁路总公司 财务部,北京 100844)
铁路运输企业完成运输任务,按照国家规定的收费标准向旅客收取的货币收入称为运输收入,是铁路运输企业的主营业收入[1]。各次旅客列车客票收入汇总成运输企业客运营业收入,列车客票收入指标是衡量一趟列车运营情况的重要指标。近年来,高速铁路发展迅速,截止2016年底,每天开行动车组2330余对,高铁列车客票收入是保障高铁建设运营顺利实施并持续发展的主要资金来源[2]。铁路运输企业收入主管部门在上一年运输收入各项指标的基础上制定当年的预算,收入预算作为收入完成情况的参考参与到收入管理工作[3]。预算是在列车未开行的情况下进行的,对未来工作有指导意义,做好列车收入预算也是管理部门一项重点工作。铁路资金清算系统对已开行列车运营数据进行统计分析,不具备对新开车收入的测算功能[4]。目前,对未开行列车收入预算,是根据上一年的客票收入结合专家经验,同时再结合开行方案中的列车定员、票额数据进行一定比例的折算,这种手工测算不仅工作量大,精准度也不高,尤其是伴随新的售票组织管理方法(席位复用、共用、智能席位预分等)的应用,极大地提高了席位的使用效率,更增加了对列车客票收入估算的难度。业务部门需要一种简便、高效的旅客列车收入测算方法。从经营的角度看,列车客票收入是衡量一趟列车运营情况的重要指标,运输企业进行新开车效益估算时,也需要对列车客票收入进行估算[5]。基于以上需求,本文通过运用相关性理论对列车相关运输指标研究的基础上,提出了一种列车收入估算方法,方便业务部门实际操作使用。
旅客列车客票收入是该趟列车实际售出(除去退、废)的所有电子客票票价总和,计算公式如式(1)。
其中:N表示售出客票张数;P表示单价。从公式上可以看出,影响该趟车客票收入的因素为售出客票张数和客票单价,因此,影响客票收入主要因素为客票票价和总人数。
铁路旅客列车的价格政策属于集中管制、政府定价的形式。目前,普通旅客列车的基准票价率,仍执行的是1995年确定的每人公里5.861分(人民币);从2016年1月1日起放开高铁动车票价,由铁路运输企业依据价格法律法规的同时,根据市场供求状况依法自主制定;高铁动车组列车票价随线路开通时间和区域略有不同。既有普速车和高铁动车的票价机制虽有所差别,但由价格计算规则可知影响票价的主要因素大致相同:列车等级、发到站间里程、票种、席别;等级高的票价高、里程长的票价高、席别等级高的票价高。
铁路旅客列车主要的票种有:全票、学生票、孩票、残军票等;全票价是基础,其他票种票价是在全票票价的基础上按照相关规定进行折算;2016年售出电子客票中各类票种占比统计如表1所示,从表1中可以看出全票占比很高,因此,在进行客票收入测算时忽略其他票种票价影响,均按全票价格。
表1 票种占比统计表
通过对历史客流数据的分析,对旅客列车的席别及占比情况进行了分类统计,如表2所示,其中,普速列车硬席客流占总客流96%,动车组列车二等座占89.2%;从表2中可以看出各类列车客流贡献主要来自于其重点席别;本文所做的测算未对席别进行细分,反映的是各种席别的平均情况。
表2 旅客列车席别占比统计表
综合上述分析,列车等级和里程为主要价格影响因素。对于具体的一类列车,票价是一组稳定的、和里程有一定线性关系的常量,列车客票收入会随着售出张数(即客流)的变化而变化。旅客列车客票收入与列车客流有一定的线性相关性。
1.2.1 指标
(1)客流指标
客座率= 实际旅客周转量/图定周转量;是体现旅客列车运输效率的指标,反映列车运力资源被利用的程度。
(2)客票收入指标
满员收入=旅客列车单程全程满员,并且均为始发至终到全票旅客状况下的收入,记为满员收入。
收入实现率= 实际收入/满员收入;表示一趟列车实际收入占满员收入的比例,在一定程度上反映了列车经济收益情况。
1.2.2 指标间关系
一些客运指标之间虽然不存在直接计算的相互关系,但却以某种规律相互影响,称为指标间的相关关系[6]。皮尔逊相关系数广泛用于度量两个变量之间的相关程度,其值介于[-1,1]之间,该系数反映两个变量之间的线性关系和相关方向[7]。计算公式如式(2):
基于2016年全路旅客列车全年运营数据,统计出各不同字头(用N表示数值字头)列车的实际客座率(对应公式中的X)和收入实现率(对应公式中的Y)指标数据,计算得到两个指标变量间的皮尔逊系数,如表3所示。从表3可知,除了车次字头为N的列车弱相关以外,其他字头列车的客座率与收入实现率的相关程度均为“极强相关”。
表3 旅客列车客座率与收入实现率相关性系数表
跨两个或两个以上铁路局管界运行的列车为直通旅客列车(简称:直通车),只在一个铁路局管界内运行的列车为局管旅客列车(简称:管内车),直通、管内称为列车类型。直达列车(车次字头为Z的列车)是指无中间停站的列车。图1为直通直达列车客座率、收入实现率指标分析图。
图1 直通直达旅客列车客座率与收入实现率相关性分析
从图1可以看出:
(1)大多数直通直达列车的客座率基本在[70%,100%]区间范围内;
(2)直通直达旅客列车客座率与收入实现率变化趋势一致,取值也基本保持一致。
选取2016年全路旅客列车旅客发送量汇总统计数据。
选取旅客列车客座率作为目标变量。客座率是连续性数据,对其进行离散化处理[8]:对列车客座率按照等间距分隔,本文结合业务实践选取宽度为0.1,共分为10组(10%、20%……100%),记为[y1,y2,…,y10],其中,y1表示[0,10%]的客座率区间,在每一类样本数据中,每一个客座率分组对应多个单位里程收入。我们设定每个客座率分组所对应的多个单位里程收入中存在一个数值能使符合误差范围的列车样本比例达到最大,即区间最优值。
例如,第1组y1客座率对应的单位里程收入为 [p1,p2,…,pn],其中,pn表示客座率在[0,10%]区间时第n趟列车的单位里程收入(单位里程收入=客票总收入/旅客运行总里程),单位为元/km。设每个里程收入对应一个预测值xi,i∈[1,N],其中,i对应的是客座率的一个区间,N是该区间中第N趟车,该预测值满足预测相对误差,本文设定的预测误差在[-5%, 5%]之间,记为[a,b]。则每个单位里程对应的里程收入预测值为xi∈[a·pi+pi,b·pi+pi],只需求这些预测值的取值范围的交集,交集的中值就为最优预测值。
(1)进行数据清洗。数据清洗包括对样本数据集中缺失数据处理,格式或者取值错误数据处理,临客列车数据剔除,开行天数不足40天的车次数据剔除等。数据清洗在数据源端进行,在客运营销系统数据仓库中完成。
(2)确定相关影响因素取值,包括列车类型:直通、管内;列车等级:高铁列车G、动车组列车D、快速列车K、特快列车T、直达列车Z、其他列车即数字字头列车。
(3)对客座率取值的离散化处理,旅客列车客座率是连续型数据,按照间距0.1的标准进行划分。使用Py thon语言编写脚本,进行运算,分别对全路直通和局管列车单位里程收入进行统计、测算,具体测算结果参见表4和表5。
图2与表4是直通旅客列车收入测算图与表,从图上可以看出,直通列车单位公里收入随客座率整体呈现线性增长趋势。从图中也可以看出,高铁票价率高于其他等级列车。
图2 直通旅客列车收入测算折线图
表4 直通旅客列车不同客座率下单位里程收入测算表单位:元/km
图3与表5是管内旅客列车收入测算图与表,从图上可以看出,管内列车单位公里收入随客座率呈现大致的线性增长趋势。其中,管内G字头列车在客座率[60%,70%]和[90%,100%]两个区间均出现了跳跃。高铁列车的票价率高于其他等级列车。
图3 管内旅客列车收入测算折线图
表5 铁路局旅客列车不同客座率下单位里程收入测算表单位:元/km
基于测算表的旅客列车收入测算:假定一趟旅客列车,根据开行方案可确定里程为dkm,定员总数为F人,定员收入R满元,根据客流预测系统得到列车预测客座率a;按照列车类型、列车字头等级,查找里程收入测算表格中对应的里程收入k元/km,测算出该客运列车客票收入:R=d·k。
例如,假定要开行一趟北京南—上海虹桥之间的高铁列车(车次字头为G),其运营里程1 318 km,参考2016年京沪之间高铁列车平均客座率情况,该车次预期客座率为75%。查询“表4直通旅客列车收入测算表”,对应客座率70%和80%时对应单位里程收入分别是:178.9元/km,362.6元/km;该车预估客票收入在23.6万元和47.8万元之间,取均值后得到客座率75%的列车估算客票收入为35.7万元。通过对北京南—上海虹桥之间实际开行高铁列车运营数据的统计计算,客座率为75%时对应的日均收入为35.3万元,与预估收入的误差为1.1%。这种估算方式不仅操作简便,准确率也比较高。
本文探寻了一种铁路旅客列车客票收入估算的方法。首次提出并计算出列车收入测算表,为业务部门进行客运列车客票收入估算提供了一种宏观估算方法。
伴随高铁线路的建设、开通,各类列车开行的数量、不同等级列车数量占比每年都有变化和调整。为及时体现这种变化,收入测算表需要定期进行重新采样、重新测算。此外,为提高测算精度,可以扩大测算样本数据集,再增加1~2年的样本数据;也可以按铁路局集团公司为计算单位,为18个铁路局集团公司分列车等级分别测算收入测算表。同时,为提高算法本身的精度,可以增加分析维度,例如增加席别维度,针对每种席别进行单独测算。