基于机器学习的高校公共资源安全评价与科学管理*

2021-06-27 03:16郭琳李英王瑜瑜陈欢余发有杨宪华
科技促进发展 2021年9期
关键词:错误率公共资源决策树

■ 郭琳 李英 王瑜瑜 陈欢 余发有 杨宪华

1.商洛学院电子信息与电气工程学院 商洛 726000

2.商洛学院保卫处 商洛 726000

0 引言

高校公共安全保障同时具有师生人身安全、设备资产安全和资源合理利用等方面的重要意义,是高校科学管理的研究热点。通常,一所高校公共资源的安全检验范畴,主要分为教学楼与实验室安全、体育设施安全、宿舍食堂消防、食品卫生、安全文化建设及机构设计与制度建设等方面[1-2]。由于高校存在人口密集、活动形式多样、资源复杂和非封闭性等特点,不仅需要成熟的管理模式,还要考虑以学生为本、安全投入和资源节约等因素[3],而传统安全评估采用调研法、问卷调查法、历史资料回顾和案例研究法等[4],用安全检查量表给评价指标打分,然后求和计算出安全评估值。

随着人工智能技术的发展,研究者开始关注投入低、效率高的安全评价技术。2016年重庆科技学院郑亚清等人[5]提出前馈神经网络预测模型,分析了消防设施安全管理过程中诸多因素对高校消防安全的影响。2018年福州大学彭桂平等人[6]提出层次分析法和模糊综合分析法,从管理制度、组织、设施、宣传教育和维稳建设等维度构造安全管理评价体系,对绩效评价过程和结果做了实例验证;2019年华南理工大学黄邓楷等人[7]利用问卷平台对校园交通和人身财产事故等方面的环境安全感进行统计评价,提出用环境设计预防犯罪理论分析学生安全感;2019年南阳医学高等专科学校侯艳丽[8]运用多阶段分层整群随机抽样方法,调查大学生自我安全防范意识需求,梳理提升措施并实施干预;2020年西安建筑科技大学何立等人[9]利用层次分析法对诱发体育设施事故的危险源进行调查、识别和评价;2020年山东科技大学吴立荣等人[10]提出用模糊综合评价法从安全制度、人为因素、仪器设备与化学品、应急管理等方面建立安全评价指标体系,确定高校实验室安全等级。

诸如以上研究是通过构造安全管理评价指标体系和评价模型,分类别对高校公共资源运行情况进行检验和评价。但是固定变量指标及定性评价,无法适应高校公共安全的动态行为,同时会产生人为误差,容易使评价过程和结果流于形式。为了研究一种全面型、主动性干预方法,发挥快速干预优势,主动解决高校公共资源动态安全问题,本文在教育部高校思想政治工作创新发展中心专项的支持下,得到了项目实施的阶段性成果,提出了一种机器学习模型,完成安全变量的表征,再通过规则构造评价权重集,最后反复训练得到分类与评价结果。

1 安全评价指标体系的建立

1.1 高校公共资源的类型

高校公共资源具有公共服务特性,供全校师生共同使用,也适当对外开放,是高校教学、科研、人才培养和服务社会的重要物质条件,是高校赖以生存和持续发展的物质基础[11]。高校公共资源从功能上划分,通常包括多媒体教室、实验室、机房、体育场所、办公室、图书馆、食堂、生活超市、浴室、医务室和实习基地等基本资源区,还包括校园道路、花园、活动室、校门、快递点和学校临时服务点等辅助资源区。

1.2 安全分析方法

在使用高校公共资源的过程中,由于人为因素、物品因素、环境因素或管理因素引发人员伤害、财产损失或环境污染等安全事故。其中人和物的不安全状态是直接原因,环境和管理的不安全状态是间接原因,从而由安全隐患升级到安全事故。安全事故具有随机性、突变型、危害性和因果相关性,需要从安全事故发生的时间、地点、种类和规模上查找规律和原因,加强安全投入和积极预防,才能降低安全事故发生率。目前已有的安全分析方法很多,例如事故树分析法(FTA)、事件树分析法(ETA)、故障类型影响分析法(FMEA)、危险和可操作性研判(HAZOP)和安全检查表(SCL)等[12],基于安全角度对高校资源中的危险因素进行分析,继而提出改进措施。本文提出以人为核心,人、物、环境和管理四维并重的安全分析方法,揭示事故现象和高校公共资源安全利用的关系,罗列总结安全影响因素,为建立高校公共资源安全评价体系奠定基础。

1.3 评价指标体系

高校公共资源安全评价体系既要考虑高校公共资源安全性,还要考虑学校规模和资源利用率,兼顾安全使用标准和投入产出价值。本文以地方本科高校为例,通过对校园公共资源调研和安全因素分析,听取了专家、管理人员的意见,参考相关调查和研究资料,设计了高校公共资源安全评价指标体系,如表1所示,其评价指标包括基本资源、交通与消防环境、安全教育和安全管理4 类一级指标,以及它们所属的20 个二级指标。通过分析安全影响因素,二级指标中的基本资源包括餐饮环境、住宿环境、学习办公、医疗卫生防疫和体育锻炼等方面;交通与消防环境包括道路与环境、机动车管理、行人管理、校门管理、巡视和电子监控等方面;安全教育包括安全培训、心理辅导和安全文化建设等方面;安全管理包括机构与制度、保安配备、安全信息员、检查登记和应急预案等方面。评价指标的全面性,会直接影响到安全评价的准确性,但是因素过多会掩盖关键因素,同时增加评价体系的复杂性。提出的安全评价二级指标,可根据需要分解为三级指标,使用类似方法进行更详细的安全评判。

表1 高校公共资源安全评价指标体系

1.4 评价流程

高校公共资源安全评价中,安全变量包括人、物、环境和管理,物和环境是物质基础,人是核心,管理是重要保障。物和环境是相对静止的,通过检查容易发现安全隐患,而人和管理是相对运动的,很难通过人为表象和数据表格发现安全问题。所以,需要一个科学的评判标准和灵活的应用模型,在上述高校公共资源安全评价指标体系的基础上,对公共资源使用过程中固有或潜在的安全变量进行分类评价。评价流程如图1所示,先通过学校、院系和职能部门采集安全检查量化数据表;然后对照安全评价指标内涵和专家意见,得到安全变量的原始权重赋值,通过评价指标体系获得安全变量的编码和特征度;再把安全变量样本输入到随机森林算法中进行分类,得到安全变量分类结果和评价错误率;然后由层次分析-灰色关联算法得到安全评价结果。

图1 评价流程图

2 公共资源安全评价模型

2.1 评价算法

随机森林算法包含多个决策树的随机分类器,准确度高、处理能力强,适合于分类和变数评估等问题[13-14]。常用的有原始森林算法,改进的随机抽样森林算法(Random-RF)。如图2所示的随机森林算法示意图,引入了决策树结构,从根节点开始将安全变量样本根据特征进行抽样分类,每个类别决策树得到一个训练集,重复随机抽取n次的N个样本数据。

图2 随机森林算法示意图

决策树数量根据所选取的变量数目及组合确定,随后在生长过程中以指数最小原则选出符合评价指标体系中若干特征变量的最优集合,通过构建的N 个决策树形成随机森林。随机森林法将公共资源安全评价的半定性、半定量问题转化为定量问题,将安全评价样本集输入到随机森林,经过模型分类训练后,得到投票数结果作为分类结果和安全变量权重值。

层次分析法和灰色关联度算法[15],都属于无监督学习算法。层次分析法是根据同级影响因子间的相对重要性估分,计算得到因子权重,强调了打分过程的主观性,而灰色关联度算法是根据序列几何形状的相似性来确定序列重要关系,强调行为结果的客观性,所以兼顾二者优点构建了层次分析-灰色关联混合算法(AHPGRA)。通过层次分析法计算出所有指标的基础权重xi,然后构建评价指标重要性判断矩阵V,确定比较集列和最优指标集,再对指标进行离散性的规范量化,然后通过公式(1)计算安全评价指标的关联系数,经过加权求和得到安全变量的加权关联度。(1)式中δ为评价分辨系数,本文取0.4;δj为评价质量关联系数.通过公式(2)得到灰色关联系数矩阵R,再结合前面的权重矩阵V,由公式(3)计算得到灰色关联度值Sj,T为安全变量特征。

2.2 评价模型

通过融合随机森林算法和层次分析-灰色关联算法,建立用于高校公共资源安全评价的随机森林-灰色关联模型(GRA-RF),模型结构如图3所示,由随机森林算法得到安全变量分类结果和分类错误率,再由灰色关联算法得到高校公共资源安全度的评价值。安全检查量表作为训练样本,通过评价指标体系预处理后,得到的变量特征数据T1 至T20,再通过引导软件程序(Bootstrap)从对应训练集中抽取N 个样本构成N 个决策树,不剪枝完全自然生长得到随机森林分类器,通过多数投票表决得到分类结果和分类错误率;最后将测试样本输入到层次分析-灰色关联模块中,经过分层加权关联度计算,得到安全变量分类评价值。根据灰色关联度值对高校公共资源安全度进行分级评价,当评价样本的安全度为0.9~1 时,认为安全水平优秀,为0.8~0.9 时认为优良,为0.7~0.8 时认为一般,为0.6~0.7 时认为及格,为0~0.6时认为不及格。

图3 随机森林--灰色关联评价模型结构

3 实例分析

选取陕西省4 所相似规模的地方本科高校,作为GRA-RF 模型的训练样本A1~A4。通过调查和采集了样本的公共资源安全数据,如近三年学校师生规模、安全机构设置、安全制度、电子监控与巡视覆盖比、专职保安占比、校门和楼宇管理、食堂宿舍与教室消防达标水平、安全标识设计、车道与人行道划分、安全教育和宣传力度、应急预案设计、事故发生类型和次数等,填写安全检查量表,对照安全评价指标内涵,对安全变量进行编码和权重赋值。

然后利用图3所示的随机森林决策器,进行学习训练。通过引导软件从表1中的4个一级特征和20个二级特征中抽取N 个变量特征,带入GRA-RF 模型中得到N个变量分类结果。如图4所示安全变量的权重值,其中最重要的安全变量是医疗卫生防疫(0.085),第二层次是消防措施(0.078)和餐饮环境(0.072),第三层次是住宿环境(0.068)、巡视与处理(0.065)和学习办公(0.061),第四层次是校门管理(0.058)、机构与制度(0.055)和机动车管理(0.053),第五层次是检查记录(0.048)、安全文化建设(0.045)、道路与环境(0.043)和应急预案(0.042),之后的安全变量权重均小于0.4,说明以上变量是影响校园安全水平的重要指标;最后层次是安全信息员(0.028)和行人管理(0.022),此类变量在安全评价体系中的影响最小。

图4 随机森变量分类结果

GRA-RF 模型评价之初与层次分析法相似,需要根据安全检查量对样本的安全变量进行人工权重赋值,之后再对安全变量进行编码、组合和优化,对众多变量特征进行融合和机器训练,找到最佳安全变量组合。在模型计算过程中,随机森林树节点变量数目和决策树数目非常关键,决定了评价模型的分类水平。对于高校公共资源不同测试样本,或者不同的决策树初始抽样值,机器训练的错误率均值不同,选择错误率均值最低时的变量及数目作为最佳安全变量集,当错误率趋于稳定时决策树数目设定不变,机器训练过程结束。所以,通常使用分类错误率结果决定模型训练周期。GRA-RF模型的分类错误率如图5所示,随着决策树数目增加,分类错误率明显下降,并且当决策树数目从20 增长到500 附近时,分类错误率趋于稳定不变,确认500为本次的最优分类决策树数量,此时样本A1~A4的分类错误率分别为14.2%、16.3%、15.6%和13.5%。

图5 随机森林-灰色关联模型分类错误率

选取陕西省某市地方高校B1为测试样本,通过GRA-RF 模型进行机器测试评价,分类决策树数量设定为500。该校设有专职机构保卫处,有治安科、政保科和校卫队等,以及由大学生组成的校卫队协会,有门卫制度、值班巡逻制度、科室管理制度、校园交通安全管理规定等;设有校医疗保健机构、心理健康咨询中心、院系心理辅导站、班级心理委员;设有资产管理处,有设备管理科、校产管理科等;设有后勤保障处,有水电管理科、公寓管理科、校园管理中心、餐饮服务中心等。自建校40多年来没有发生一起重、特大安全事故。测试样本通过层次分析-灰色关联模块进行分级评价,得到20*M 个灰色关联度,再分级评价得到离散化数据文本,再计算得样本安全评价等级。测试样本B1经过模型机器学习,公共资源安全评价值为0.813,安全水平达到优良,而单独用层次分析法得到的评价值为0.725。GRA-RF 模型评价值高于层次分析法,相对误差为+12.1%,评价结果可信度更高。

4 结论

本文在人工智能技术背景下,采用了机器学习技术手段,建立了随机森林-灰色关联安全评价模型和安全变量分类评价指标体系,为高校公共资源安全评价和资源科学利用奠定了基础,为高校平安校园建设、公共资源管理和政府投资决策提供依据。具体研究结论如下:

(1)高校公共资源安全变量分类排名结果前10的依次是医疗卫生防疫、消防措施、餐饮环境、住宿环境、巡视与处理、学习办公、校门管理、机构与制度、机动车管理和检查记录,处于最后层次的是安全信息员和行人管理。

(2)当新建模型的决策树数目增长到500时,安全变量分类错误率趋于稳定不变,此时采集的高校训练样本的分类结果达到最优。如果分类错误率超过允许范围,可通过添加样本的基础数据,或改变评价指标体系中安全变量的基础权重,然后重新进行机器训练评价。

(3)相较于以前的研究成果,基础数据缺失、人为主观臆断等问题对研究分析过程的影响缩小了,所以本文新建的GRA-RF模型的评价结果可信度更高。

然而,在建设平安校园和节约型校园过程中,还涉及到政治、社会与经济环境的差异化问题,各高校在应用模型评价时存在一定难度,研究工作还需要调整和优化,建议如下:

(1)把政治、社会与经济环境条件纳入评价指标体系。

(2)利用大数据平台及时采集评价对象的大量历史数据,避免人为因素的偏差。

(3)继续细化定性指标的权重量表,缩小分类错误率。

总之,高校公共资源安全变量的智能识别和资源优化管理,是高校深入践行科学发展观的重要内容,是建设平安校园和节约型校园的重要抓手,弘扬“浪费可耻、节约为荣”优良传统,打造“艰苦奋斗、以人为本”的校园新风尚。本文的研究成果亦可以扩大服务对象范围,为国家行政部门、企事业单位等大型组织机构,提供相似的研究技术,主动干预评价公共安全,科学投入与利用资源。

猜你喜欢
错误率公共资源决策树
公共资源交易平台构建及体制机制创新
盆景乎?风景哉?
信息时代基于决策树对大学生情绪的分类
简述一种基于C4.5的随机决策树集成分类算法设计
小学生分数计算高错误率成因及对策
正视错误,寻求策略
决策树学习的剪枝方法
广东:基本建成公共资源交易平台
解析小学高段学生英语单词抄写作业错误原因
降低学生计算错误率的有效策略