张 铄,陈晓平
(1.福建师范大学 数学与统计学院,福建 福州 350117;2.福建理工大学 计算机科学与数学学院,福建 福州 350118)
随着科学技术的发展和各国开放程度的提高,全球贸易量急速增长,经济全球化逐渐成为当代世界经济的重要特征与世界经济融合发展的重要趋势。据统计,航运贸易量占全球贸易总量的90%。随着全球贸易量和船舶运力稳定增长,船舶的二氧化碳排放量却在不断提升。根据国际海事组织(IMO)相关数据,2021年全球航运的二氧化碳排放量达8.33亿t,与2020年的7.94亿t相比,同比增长4.9%,2021年全球航运占全球碳排放量已达2.4%。可见,船舶的碳排放问题需要引起重视。2020年,中国政府提出“2030年碳达峰”和“2060年碳中和”目标[1],“双碳”战略倡导绿色、环保、低碳的生活方式,加快降低碳排放步伐,有利于引导绿色技术创新,提高产业和经济的全球竞争力。国际海事组织(IMO)也提出航运业碳减排行动计划,目标于2050年实现碳排放量减少50%。相关措施表明全球已经开始重视碳减排问题,对航运的碳减排也十分重视。船舶的油耗与碳排放量息息相关,因此对于船舶油耗的监控与预测也逐渐引起关注。但是船舶燃料消耗估计存在困难,因为船舶的燃料消耗取决于许多外部因素,如发动机状况、运输距离、海况、天气状况等,可靠的油耗预测是航运规划、能源监管和效率优化的重要基础和重要指标。各国航运公司在降低海洋污染方面面临着越来越大的压力,其中航运公司的碳排放量占全球总量的2.5%。但是除了节能减排,航运公司也需要考虑船舶的有效运营来降低成本,并提高盈利能力。船舶燃料成本约占船舶航行成本的2/3,超过船舶总运行成本的四分之一[2]。因此,航运公司一直专注于实施燃油效率措施。为了监测和提高燃料效率,最终提供一种形式化的优化方法,在优化前我们需要一个合适的建模框架,推导出能够准确预测在不同运行概况和环境条件下的船舶油耗的模型,有助于之后的一系列优化操作。然而,在航行过程中,由于安全和运输进度的复杂要求,提高能源效率的方法非常有限。因此,许多研究工作都致力于在保证船舶安全的前提下,优化航行速度,达到节约油耗的目的。
回顾与燃油效率和油耗预测模型相关的科学文献,Bialystossis等[3]对滚装船的中午报告进行统计分析,以确定船舶油耗的影响因素,对观测到的海态曲线进行拟合。Besikci等[4]使用人工神经网络来预测船舶油耗。Meng等[5]提出了一种基于离群值分数的数据预处理方法。利用集装箱船的中午报告数据构建了两个回归模型,第一个模型将船舶的油耗与速度和位移连接起来。第二种模型建立在第一个模型之上,利用天气条件和第一个模型提供的信息。Yao等[6]研究了不同尺寸集装箱船的油耗与船舶速度之间的相关性。Wang等[7]提出了一个最小绝对收缩和选择算子LASSO回归模型。Lepore 等[8]利用巡航船舶运行数据应用不同类型的回归模型,并对每个模型进行二氧化碳估计。LI等[9]融合8艘集装箱航行报告船数据与气象数据,并应用于11种广泛采用的机器学习模型。牟小辉等[10]利用随机森林构造油耗预测模型,并利用偏相关分析得到单个因素与油耗间的定量关系。Yang等[11]提出一种基于遗传算法的预测船舶油耗的灰箱模型。王晓东等[12]提出了一种基于岭回归优化算法的船舶航速与油耗模型。陈陆等[13]以某一远洋船舶作为研究对象,对船舶的实际数据进行分析,结合GBDT(梯度提升决策树)算法构建船舶油耗的预测模型。郑丽晖等[14]采用非参数核回归方法,对福州市PM2.5进行实证研究。
从以上文献回顾可以看出,船舶的油耗预测建模是一个相当活跃的研究领域。由于目前文献中大多数使用了不同的数据集,具有不同的采集和建模方法,这些不一致导致无法很好地确定船舶油耗预测结果最佳的建模方法。翻阅文献,发现很少学者将非参数核回归的方法与船舶油耗估计建模相结合。考虑到这一点,本研究主要贡献是:(1)使用非参数核回归方法构建一个新的模型来预测船舶的油耗;(2)将非参数核回归方法构建的油耗模型与碳排放相结合,对船舶碳排放进行分析并提出相应建议。
在本文中,数据集由远航船舶的中午报告信息组成。识别并筛除记录的异常值,从原始数据中提取有用特征,最后将筛选后的数据供各个模型使用,执行此过程是为了提高油耗模型预测的准确性。在清洗异常记录值后,最后选取了6个变量,原始数据样本量也由553减少到535。描述性统计如表1所示。数据集包含以下变量:Speed(kn)表示航速,Wind speed(m/s)表示风速,Wave height(m)表示浪高,Sea current(m/s)表示水流速度,Distance(km)表示日航行距离,Fuel oil consumption(t/d)表示每日油耗;WINP表示风向,对风向变量进行预处理,处理方法为按常用等级划分方法进行离散化分箱操作,风向按八方位风向划分法,如图1所示。其中C表示静风,N表示北风,NE表示东北风,E表示东风,SE表示东南风,S表示南风,SW表示西南风,W表示西风,NW表示西北风。
表1 描述性统计
1.2.1 Bagging回归
Bagging回归是一种并行式集成学习方法。通过在数据集上进行有放回的随机抽样,构建多个具有一定相关度的子样本数据集,然后在每个子样本数据集上运用相同的预测模型,最后对回归预测结果进行简单平均。
1.2.2 随机森林回归
用随机森林回归法创建并组合多个决策树,在每个节点的所有竞争的自变量中,随机选择几个来竞争拆分变量,接着通过在样本数据集中抽取样本来创建新的树,并从这些树中提取随机森林,对回归预测结果也是进行简单平均。
1.2.3 支持向量机回归
支持向量机回归的工作原理是推导出最优的超平面,在超平面范围内准确预测训练样本的目标值[15]。根据所选内核的属性,支持向量机回归既可以是参数模型,也可以是非参数模型[16]。
1.2.4 广义可加模型
广义可加模型对传统广义线性模型的非参数拓展,可有效处理解释变量与效应变量间复杂的非线性关系。
1.2.5 梯度提升决策树模型
梯度提升决策树模型是一种基于迭代所构造的决策树算法,此算法对决策树与集成思想进行了有效的结合[17]。其主要由三个概念组成,回归树、梯度提升和缩减。回归树是使用最小化均方差,每个节点可以得到一个预测值,最后累加所有树的结果作为最终结果。梯度提升是一种理念,沿着梯度方向构造一系列弱分类器,并以一定权重组合起来,形成最终决策的强分类器。缩减以残差作为学习目标,是基于模型过拟合的考虑。
1.2.6 非参数核回归
非参数回归相比于参数回归,它不需要数据的先验信息,模型函数形式由数据本身决定,参数的特征和数量是变化的[18]。非参数回归的基本模型为
Yi=m(Xi)+εi。
(1)
(2)
(3)
(4)
式(4)中,(h>0)称为带宽或调节参数,则N-W核估计为
(5)
式n中核函数K(u)满足下列条件
(6)
1.3.1 标准化均方误差(NMSE)
标准化均方误差(NMSE)对均方差进行了标准化改进,通过计算拟评估模型与以均值为基础的模型之间准确性的比率:标准化均方误差取值范围通常为0~1,比率越小,说明模型效果越好。其公式为
(7)
1.3.2 平均绝对误差(MAE)
平均绝对误差(MAE)表示的是观测值与真实值的误差绝对值的平均值,其值越小,说明误差越小。其公式为
(8)
1.3.3 决定系数(R2)
决定系数(R2)表示一个随机变量与多个随机变量关系的数字特征,当R2越接近于1的时候,说明拟合效果越好。其公式为
(9)
1.3.4 均方根误差(RMSE)
均方根误差是预测值与真实值偏差的平方与观测次数n比值的平方根,在实际测量中,观测次数n总是有限的,真值只能用最佳值来代替,即均方根误差是用来衡量观测值同真值之间的偏差,当RMSE越小,说明观测值同真值偏差越小。其公式为
(10)
1.3.5 比较结果
在讨论了建模方法之后,将代入远航船舶的数据集构建一系列模型,并计算出各个性能指标,研究的目的是比较各回归模型在船舶油耗预测的性能,其中数据集按传统的训练集测试集7∶3划分。
如图2所示,分别表示Bagging回归(bagging)、随机森林回归(randomforest)、支持向量机回归(svm)、广义可加模型(gam)、梯度提升决策树模型(gbm)和非参数核回归(np)的各个性能指标。从图2中的MAE图,可以看出非参数核回归的MAE值最小。MAE值越小,说明模型误差越小。显然与其他方法相比,非参数核回归模型的误差最小。从图2的NMSE图可以看出非参数核回归的NMSE值最小,说明与其他方法相比非参数核回归模型效果好。从图2的RMSE图,可以看出非参数核回归的RMSE最小,说明与其他方法相比非参数核回归模型的偏差小。最后,通过图2的R2图进行比较,可以看出其他方法的R2虽然均大于0.75且接近,但是R2都小于非参数核回归的R2,说明非参数核回归模型的拟合效果最好。
图2 各个模型的性能指标比较
通过各个模型的性能指标(表2)的比较,可以得出与Bagging回归、随机森林回归、支持向量机回归、广义可加模型、梯度提升决策树模型相比,非参数核回归模型的拟合效果更好,误差更小,说明非参数核回归模型的效果更好,对此远航船舶的数据集的油耗预测是更为精准的。
表2 各个模型的性能指标值
表3 带宽及变量显著性检验
使用bootstrap方法抽取100次样本,选定其中一个自变量,其余自变量取中位数,然后建立该自变量与因变量的部分回归关系图,结果如图3所示。图3中,虚线表示因变量的置信区间。
图3 非参数拟合图
从图3可以看出,当船舶低速行驶时,航速对船舶油耗的影响很小,当船速增加时,特别是当航速大于10 kn时,航速与船舶油耗呈正相关关系,随着船速的继续提高,船舶油耗也会不断增加。天气状况显然对船舶行驶产生的油耗也会造成影响。从图3中还可以看出,风速前期影响不大,但当风速高于6 m/s的时候,船舶油耗呈明显快速上升趋势。从总趋势来看,浪高和水流速度与船舶油耗也呈正相关关系,船舶油耗会随着浪高和水流速度的提高而增加。当浪高和水流速度达到一定高值时,船舶的油耗值将趋于平稳,不再大幅度增加。图3中的风向图可以看出不同的风向对船舶油耗的影响差异较小,说明船舶遇到不同的风向,会及时调整船头与航向,减少阻力来减少油耗。最后,船舶的日航行距离增加会始终导致船舶油耗快速增加。非参数核回归的结果说明,船舶油耗与船舶自身行驶状况、各气象条件的关系较为复杂,因此需要根据精准的油耗预测模型,结合经济状况以及船舶原本的航行计划,设计出最低油耗规划。
随着航运业的迅猛发展,船舶数量大幅增加,碳排放作为温室气体的来源之一,对全球环境影响巨大。如何减少碳排放,提高燃油利用率,正成为航运企业关注的焦点。碳排放因子是指单位燃油消耗量产生的二氧化碳排放量,其主要取决于燃料的含碳量和碳氧化率,所以燃料种类不同,碳排放因子也不一样。对于远航船舶而言,主机类型一般为低速柴油机,使用重油,对应的碳排放因子为3.114。船舶的碳排放公式为
Q=Fuel oil consumption ×CF。
(11)
Q(t)表示每天船舶的碳排放。式(1)中Fuel oil consumption(t/d)表示的是燃料每日消耗的油耗,CF表示碳排放因子,即单位重量的燃料产生的碳排放量。Q值越小,表示船舶完成一定货物周转量下碳排放越少,即船舶能效越高。
图4的各变量重要性图分析了各变量与船舶油耗的关系,从中可以看出,船舶油耗与日航行距离和航速的关系更为密切,因此分析船舶碳排放重点需要分析日航行距离和航速这两个变量。结合碳排放进行分析,根据图3非参数拟合图可知,当航速大于10 kn时,航速与船舶油耗呈正相关关系。通过图5频率图可知,该船舶大部分时间的船速位于15~20 kn之间,日航行距离位于400~500 km之间。随着船速的继续提高,船舶油耗也会不断增加,碳排放也会持续增加。当日航行距离越长,船舶油耗也会越高,碳排放量也会处在一个高值。因此可知该远航船舶的碳排放量大部分时间处于比较高的阶段,如图5所示。本文由于缺少相关的经济数据和其他相关信息,因此无法结合碳排放对该船舶进行更具体的分析以及更合理的规划,希望在经济条件允许的情况下,该船舶适当调节优化航速与合理分配日航行距离,可以更好地减少船舶产生的碳排放。
图4 各变量重要性图
图5 频率图
与众多的陆上行业相比,航运业是最绿色节能经济的运输方式,然而从可持续发展的角度来看,航运减排是永恒的话题,若不及时采取有效的节能减排措施,未来航运业将面临更加严酷的挑战。除了上述对船舶航速与航线的优化,还可以通过一系列技术手段来降低船舶的碳排放。比如说,可以寻找新能源或其他可替代燃料,逐步淘汰化石燃料;船体优化,提高发动机的效率,装载更好的气象导航;定期对船舶进行保养维护等。IMO的研究显示,船龄、燃油质量等也会间接影响到船舶的碳排放情况。当前全球航运业发展的总趋势是向“低碳经济”转型,为了实现航运业与生态环境和谐统一发展,还需提供法律、金融、税收等“软环境”[20]。希望未来随着船舶能效提升,替代燃料以及新航运减碳政策的执行,航运的碳排放可以在高位震荡后回落。
在本文研究中,基于远航船舶的相关数据进行了油耗估算研究。根据研究方法获得如下结果。
(1)本研究创新性地使用含有连续性变量与类别变量这两种数据类型的混合型数据,通过非参数核回归方法与船舶油耗相结合,构造了预测模型,并通过标准化均方误差(NMSE)、平均绝对误差(MAE)、决定系数(R2)和均方根误差(RMSE)4个性能指标,与Bagging回归、随机森林回归、支持向量机回归、广义可加模型、梯度提升决策树模型进行了比较,得到船舶油耗预测最优模型。接着完成变量间的相关性与重要性分析,该预测模型方法可以应用于不同的航线,得到的模型可以准确地估计在不同输入条件下运行的船舶的燃油消耗量。
(2)本研究对非参数核回归船舶油耗预测模型进行了实证分析,分析了各变量对油耗的影响。可知航速、风速、浪高、水流速度和日航线距离与船舶油耗呈正相关关系,接着对此船舶进行了碳排放分析,可知该船舶碳排放量大部分时间处于比较高的阶段。
(3)此次研究的仅为一艘船舶,在未来的工作中,可以分析更多不同的船舶,收集更多的航行数据集,以验证和进一步改进油耗预测的模型和框架。未来可以探寻更多的新模型进行比较,验证此模型的有效性与精准性。同时,收集相关的经济数据,结合现有模型与碳排放进行非线性规划,优化航速,设计更优的航线,来减少船舶的碳排放。
在经济全球化的背景下,对如何推进航运的碳减排,本文提出以下建议。
(1)完善相关管理体系,各国航运部门应出台更多符合该国国情的法律法规。将营运船舶划分标准等级,将那些高耗能高碳排放的船舶逐步淘汰出航运市场,推进绿色航运发展。加大执法力度,保证相关法律法规的有效执行,建立与维护健康、良性的市场秩序,防止船运公司之间的恶性竞争。
(2)船运企业要通过一系列技术手段来降低船舶的碳排放,政府要出台相关的扶持政策。船运企业可以寻找新能源或其他可替代燃料,逐步淘汰化石燃料;船体优化,提高发动机的效率,装载更好的气象导航;定期对船舶进行保养维护。这些措施对船运公司的资金财政状况提出了严峻挑战,因此各国可以出台相应的财政补贴,减免一定税收,设立专项基金,缓解各船运公司的压力,提升其国家航运业的国际竞争力和影响力。
(3)加强国际间的交流与合作,共同推进航运业的碳减排。经济全球化逐渐成为当代世界经济的重要特征之一,也是世界经济发展的重要趋势。在加大科技投入的前提下,各国可以互相合作,分享与借鉴航运减排的有效信息或者措施,提升船舶能效,设计更合理的航线,建立航运碳交易市场,充分发挥碳交易市场的资源配置功能,达到航运碳减排的目标。