基于朴素贝叶斯分类器的垃圾分类系统

2021-01-13 08:17:02郑唯加
关键词:朴素贝叶斯分类器

李 勇,郑唯加

基于朴素贝叶斯分类器的垃圾分类系统

李 勇1,郑唯加2

(1.安徽财经大学 统计与应用数学学院安徽 蚌埠 233030; 2.安徽财经大学 金融学院,安徽 蚌埠 233030)

选取2008—2018年上海市生活垃圾数据,首先利用灰色预测模型对未来4年垃圾产生量进行预测得出:未来垃圾产生量将会继续增长,给出垃圾分类的必要性;然后设计朴素贝叶斯分类器,使用已有数据进行训练,建立生活垃圾分类系统并给出分类判断标准;最后,结合垃圾分类系统给出相应的政策建议,以便更准确高效地进行垃圾分类处理。

朴素贝叶斯分类器;灰色预测模型;垃圾分类;上海

1 上海市未来垃圾产生量预测

1.1 研究思路

为方便问题研究,本文做出如下假设:(1)假设垃圾短时间不会完全降解;(2)假设人口不会较大幅度波动而是稳定在正常值。为验证实施高效准确垃圾分类的必要性,根据2008-2018年上海生活垃圾每年的总产生量,利用GM(1,1)灰色预测模型对上海2019-2022年生活垃圾产生量进行预测。

1.2 理论基础

灰色系统理论自提出以来,广泛应用于经济管理和教育科学等领域。关于数列预测的单变量一阶微分的GM(1,1)预测模型[4]是使用最广泛的一种灰色预测模型。该模型的原理[5]可以简要概括为:首先利用累加的方法使数据具有指数规律,然后建立一阶微分方程并对其进行求解,最后将求得的结果再累减还原,即可得到灰色预测值。灰色系统GM(1,1)预测模型的建模分析具体步骤[6]如下:

与此同时,还不断加大了全县77个探矿权的科学规范管理,与河南省地质调查院等22个地勘单位建立了合作关系。全县不仅又探明钼金属233万t,而且还新探明白钨59万t,铅锌126万t,黄金74万t,为本县的矿产资源可持续发展提供了充分的资源保障。

1.3 研究过程及结果

首先,利用MATLAB软件对数据进行预处理,通过计算发现数据的级比均落在可容覆盖内,因此无需对原始数据进行平移变换,可以直接对其进行灰色预测建模。然后,根据已有数据,利用MATLAB软件设计程序计算出2019-2022年的上海垃圾产生量的预测值。

如图1所示,可以看出GM(1,1)预测模型在预测时基本无较大差距,预测值与真实值之间偏差较小。从图中可以看到,上海作为一个高密度的人口城市,未来4年每年的垃圾总产量呈现出继续增长的态势。因此,实施垃圾分类十分必要,垃圾分类过程中,如何实现精准高效分类成为资源高效处理利用的关键点。

图1 上海生活垃圾产生总量实际与拟合预测图

2 垃圾分类系统的建立

2.1 研究思路

为方便研究,假设贝叶斯分类器中的每个属性独立地对分类结果发生影响且所有因子都相互独立。由于朴素贝叶斯分类器采用属性条件独立假设,可以避免贝叶斯的公式难以从有限的训练样本直接估计后验概率的困难[7-8]。因此,本文选择朴素贝叶斯分类器,利用上海市的垃圾分类数据,对分类器进行训练,从而建立垃圾分类系统。

2.2 理论基础

如果

如果各个特征属性是条件独立的,则根据贝叶斯定理有如下推导:

因为分母对于所有类别为常数,因为只要将分子最大化皆可。又因为各特征属性是条件独立的,所以有:

根据上述分析,本文针对垃圾分类设计如下朴素贝叶斯分类的流程,如图2所示。

2.3 研究过程

埋填、堆肥;

(3)获取训练样本。本文利用上海市2017年的垃圾处理数据作为训练样本。

(4)计算训练样本中每个类别的频率。使用训练样本中数据计算得到表1。

表1 各类别频率表

(5)计算每个类别条件下各个特征属性划分的频率,见表2。

表2 各特征属性划分频率表

(6)使用分类器进行测试。使用训练好的分类器选取单位垃圾测试分类精度,得到如下分类概率,见表3。

表3 各类别相应概率表

从结果中可以看到,该单位垃圾应焚烧处理,通过分类器的鉴别,将其归入可回收垃圾类别。经检验核对,该单位垃圾属于可回收垃圾。这表明当特征属性较多时,朴素贝叶斯分类器对个别属性具有抗干扰性。

(7)使用分类器进行整体鉴别。使用经过预鉴别的分类器对全体样本进行分类,并与真实数据进行比对,利用表示分类效果,越接近1代表与真实数据越接近,分类效果越好。得到分类器效果如表4所示。

表4 分类器效果表

3 结论

本文使用灰色预测模型对上海市未来垃圾产生量进行预测,该模型预测不需要大量的样本且不要求数据具有规律性分布,计算量小且具有相对较高的精度。后续考虑利用函数变换、灰色系统建模理论和演化算法理论对灰色预测模型进行改进研究。本文采用的朴素贝叶斯分类器具有相对稳定的分类效率,对小规模的数据表现很好,能处理多分类任务,适合增量式训练,尤其是数据量超出内存时,可以一批批的去增量训练。

结合基于朴素贝叶斯分类器建立的上海市垃圾分类系统,本文给出以下建议:(1)加强生活垃圾分类投放的宣传和指导工作,建立不同种类垃圾的压缩收集网点,将分类回收的垃圾分别运送至定点进行集中处理;(2)对于企业和单位产生的大件垃圾,安排专人进行回收处理;(3)完善相关的制度与法规,争取实现政府引导、相关部门监督、全民参与。全面提升垃圾回收效率与利用率,实现垃圾的资源化与无害化处理。

[1] 顾旺. 我国城市垃圾分类处理问题研究[D]. 南京: 南京理工大学, 2015.

[2] 吴双金. 上海市社区生活垃圾分类激励机制实效探索[D]. 上海: 华东理工大学, 2016.

[3] 任翔宇. 基于系统调控视角的城市大型生活垃圾处置设施邻避问题的影响因素评估[D]. 上海: 华东师范大学, 2016.

[4] 曹雪静, 王海霞, 李同兴. 多变量灰色预测模型在国民生产总值指数预测中的应用[J]. 曲阜师范大学学报: 自然科学版, 2020, 46(1): 47-51.

[5] Julong D. Introduction to grey system theory[J]. Journal of Grey System, 1989, 1(1): 1-24.

[6] 杨名桂, 杨晓霞. 基于灰色预测模型的重庆市入境旅游客流量预测[J]. 西南师范大学学报: 自然科学版, 2010, 35(3): 259-263.

[7] 杜婷. 基于属性选择的朴素贝叶斯分类研究与应用[D]. 合肥: 中国科学技术大学, 2016.

[8] 阿曼. 朴素贝叶斯分类算法的研究与应用[D]. 大连: 大连理工大学, 2014.

[9] 范彦勤. 基于贝叶斯分类器的个人信用评估研究[D]. 西安: 西安电子科技大学, 2014.

[10] 李丹. 基于朴素贝叶斯方法的中文文本分类研究[D]. 保定: 河北大学, 2011.

Garbage Classification System Based on Naive Bayesian Classifier

LI Yong1, ZHENG Wei-jia2

(1.School of Statistics and Applied Mathematics, Anhui University of Finance and Economics, Bengbu 233030, China; 2.School of Finance, Anhui University of Finance and Economics, Bengbu 233030, China)

This paper selects 2008—2018 Shanghai municipal solid waste data, first uses the gray prediction model to predict the garbage production in the next four years, the future garbage production will continue to grow, which obtains the necessity of garbage classification; then designs the naive Bayes classifier, uses the existing data for training, establishes the garbage classification system and gives the classification criteria; finally, combined with the garbage classification system, the corresponding policy recommendations are given in order to more accurately and efficiently carry out garbage classification.

Naive bayes classifier; grey prediction model; garbage classification; Shanghai

TP397.2

A

1674-3261(2021)01-0049-04

10.15916/j.issn1674-3261.2021.01.011

2020-03-29

国家自然科学基金资助项目 (11601001); 全国大学生数学建模组委会后继研究(夏令营A1401)

李勇(1963-),男,安徽蚌埠人,副教授,硕士。

责任编校:刘亚兵

猜你喜欢
朴素贝叶斯分类器
隔离朴素
朴素的安慰(组诗)
四川文学(2020年11期)2020-02-06 01:54:30
他是那样“笨拙”和朴素——30多年后,我们为什么还需要读路遥?
当代陕西(2019年23期)2020-01-06 12:18:04
最神奇最朴素的两本书
当代陕西(2019年9期)2019-05-20 09:47:38
BP-GA光照分类器在车道线识别中的应用
电子测试(2018年1期)2018-04-18 11:52:35
贝叶斯公式及其应用
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于贝叶斯估计的轨道占用识别方法
一种基于贝叶斯压缩感知的说话人识别方法
电子器件(2015年5期)2015-12-29 08:43:15