基于决策树算法的留学生安全预警系统的设计与实现

2019-09-12 10:41张予露王吉富李志坤边缘赖申婷李瑞改
智能计算机与应用 2019年4期
关键词:安全事件决策树预警系统

张予露 王吉富 李志坤 边缘 赖申婷 李瑞改

摘 要:近年来,来华留学生人数呈逐年递增的趋势,这大大增加了管理者对留学生学业情况、人身安全以及国家安全管理的难度。如何对潜在的安全问题进行预警,在安全事故发生前及时采取有效的预防措施成为各高校国际交流学院的重要问题。本系统采用决策树算法中的ID3算法建立留学生安全预警模型,将学生信息作为数据,找到可能发生安全事件的学生,并对这类学生进行预警。本系统的设计可以促进各学校留学生安全管理工作的顺利开展,同时也能够防患于未然,加强对留学生人身安全以及国家安全的保障。

关键词:来华留学生;安全预警;预警系统;预控文章编号:2095-2163(2019)04-0248-04 中图分类号:TP391.7 文献标志码:A

0 引 言

中国经济的发展,使世界各地的学生希望来华进修。根据教育部2017年发布的数据,2017年来华留学生有48.92万人,这些人来自204个国家和地区,就读于全国935所高等院校,中国已成为世界第三、亚洲最大留学目的国[1]。留学生人数的增多,导致留学生管理难度加大,同时来华留学生安全事故时有发生,不仅威胁到留学生个人,还可能危及国家安全,因此留学生的安全问题也成了一个重点问题。目前,中国大多数院校没有留学生安全预警措施。为此,研发设计了留学生安全预警系统。

1 研究背景

最近几年,中国逐渐提高的教育水平使越来越多的外国学生希望来中国进修,致使来华留学生人数不断增加,与此同时,留学生影响国家安全以及高校安定的各种不和谐因素也随之增加。如留学生之间的文化背景差异、宗教信仰冲突、生活变故等等,使维护涉外治安稳定工作面临着严峻的挑战。卓娅·安尼瓦尔在研究高校留学生管理问题及对策时指出,这些问题可能会导致留学生在学业,人身安全等方面出现问题[2]。此外,部分来华留学生对中国法制观念淡薄,再加上部分高校对其管理强度不够,使得部分留学生不能适时得到正确的引导和帮助,导致来华留学生违法犯罪案件增多,违反学校规章制度、破坏社会治安事件增多,甚至还出现威胁到其他留学生及中国公民人身安全事件,安全管理任务日益繁重。为适应新的形势,注重留学生安全管理机制研究,完善留学生安全管理体系,提高留学生管理人员的管理能力和工作效率,促进来华留学生安全管理的科学化、高效化成为亟待解决的问题。

信息技术可以帮助留学生安全管理工作,进行安全预警,提高工作效率。在留学生安全管理机制研究方面,刘芳对高校留学生安全管理问题及其对策进行了深入的研究[3],阐述了预警机制的重要性,同时对于留学生在华期间所发生的突发事件、文化冲突、意外伤害等危及到人身安全的问题建立预警机制。预警机制能够提前发现产生矛盾的原因,管理人员可以提前做好措施,减小安全事件的影响范围甚至避免安全事件的发生,做到从出现事件再补救到提前预警避免事件发生的转变。战浩楠在探究新时期来华留学生管理工作策略时提到要建立留学生突发事件的预防机制[4]。

段伟,江钦徐对来华留学生突发事件预警防控机制的建构进行了深入的研究[5],阐述了留学生安全预警机制的必要性,凡事预则立,不预则废,从安全事件管理的目的和效果来说, “未雨绸缪”远胜于“亡羊补牢”。安全事件管理的最好方式是将危机扼杀在摇篮里,增强对安全事件的管理,最重要的是加强对安全事件的预测,这样做可以及时对潜在的安全事件进行预警,提前消除安全隐患,同时在危机发生时提高管理人员的反应速度,尽快找到解决办法,以降低安全事件造成的损失。目前,虽然在留学生信息管理自动化系统开发方面有很多研究案例,同时各高校都意识到安全管理与预警的重要性,但是在针对留学生人身安全和保障国家安全的预警与管理等方面,还没有成型的系统出现。因此为了加强对安全事件的预警防控,本课题组设计了留学生安全预警系统,以保障留学生学业完成、人身安全和国家安全。

2 留学生安全预警系统模型设计

2.1 预警流程

本系统将预警分为3个方面:学业预警、个人人身安全预警、国家安全预警,每个方面分为2个预警等级,分别为安全和不安全。运用决策树分类算法对留学生进行安全预警。本模型中将所有学生数据中的80%作为训练数据,剩下20%作为测试数据,训练数据的输入需要特征和结果,而测试数据只需要输入特征,最后通过分类器得到的结果与其原本数据进行比较,获得模型的准确率。若是经模型判断该学生在任意一个或幾个方面需要进行安全预警,则本系统将立刻向该学生的负责老师发送预警信息。

2.2 决策树算法概念

决策树是通过向训练数据进行学习,获得特征变量和输出变量在不同取值下的训练数据分类以及数据预测规律;是一种带有特殊含义的树结构,其每个根结点(非叶子结点)代表数据的一种特征标签,然后将数据按照不同的特征值划分为几个子集,得到的每个子集均为这个根结点的子树,重复该过程,最终得到决策树的每个叶子结点即为数据的最终类别。决策树的常用算法主要有ID3、C4.5、CART等,本模型采用ID3算法。

2.3 决策树学习过程

(1)特征选择。表示在训练数据的特征里选择一项看作当前节点的分类标准,根据不同的特征量化评估标准,得到不同的决策树算法。

(2)决策树生成。根据所选择的特征量化评估标准,从根节点开始从上至下生成子节点,直到数据集不可分为止。

(3)剪枝。为了尽量对训练样本进行正确分类,决策树一般通过主动剪枝来降低过拟合的风险,基本的剪枝策略有预剪枝和后剪枝2种。

2.4 ID3算法

ID3算法是Ross Quinlan发明的一种最为常用的决策树算法,对ID3算法来说,总是倾向于生成小型的决策树,但也不一定每次都生成最小的树型结构,因为这是一个启发式算法。在信息论中,期望信息越小,那么信息增益就越大,从而纯度就越高。ID3算法是一种以信息增益来量化评估属性,选择增益最大的属性进行分裂的算法。

可以采用信息熵来度量样本“纯度”。假定当前样本集合D中第k类样本所占的比例为pk,则D的信息熵定义为:

2.5 留学生安全预警模型

留学生安全预警模型采用决策树算法中的ID3算法。以学业安全预警模型为例,可得到如图1所示的決策树。

2.6 预测结果分析

该模型的实验环境为MATLAB,测试中将收集到的数据中的80%作为训练数据,20%作为测试数据。得到预测结果如图2、图3、图4所示,测试结果正确率分别为75.79%、97.99%、86.93%。

3 留学生安全预警系统设计

3.1 留学生安全预警系统架构

按照系统设计目标,留学生安全预警系统的总体架构设计如图5所示。留学生管理与安全预警系统的用户类型包括系统管理员、教师、宿舍管理员、学生4类。系统由数据采集与存储子系统、留学生安全预测与评价子系统、预警子系统等组成,相关信息通过数据库进行存储。数据采集与存储子系统由可以采集留学生信息的前端系统构成,系统应用asp.net框架、数据库技术等采集留学生各项信息,实现对留学生数据的监控和历史对比分析。

3.2 留学生安全预警系统功能

工作主要流程为:系统通过留学生信息前端采集子系统进行数据的获取,采集方式为教师或管理员将旷课、成绩等数据手动输入系统,或在学生使用系统进行请销假时自动记录请销假数据。同时,留学生安全测评与评价子系统对每名学生的学业、人身安全和国家安全进行在线预测,如果预测结果为需要预警,则立即通过预警子系统将该学生预警信息发布给其对应的管理员和教师用户。系统功能结构如图6所示。

3.3 系统实现

本系统采用的集成开发环境是Microsoft Visual Studio,运用C#语言开发,数据库管理系统采用SQL Server 2008 R2。系统运行效果界面如图7、图8所示。

4 结束语

本文主要设计了留学生安全预警系统,具有很重要的现实意义,一方面,可以对潜在的安全问题预警,在安全事故发生前及时采取有效的预防措施;另一方面可以使留学生管理工作更加高效、全面。

参考文献

[1]教育部. 2017年全国来华留学生数据发布[EB/OL]. (2018-03-31).https://www.mxbang.cn/archives/6072.

[2] 娅·安尼瓦尔. 浅谈高校留学生管理的问题及对策[J]. 学理论,2011(34):199-200.

[3] 刘芳. 高校留学生安全管理对策研究[J]. 教育观察, 2013, 2(19):19-21,47.

[4] 战浩楠. 新时期来华留学生管理工作策略探究[J]. 边疆经济与文化,2014(1):124-125.

[5] 段伟,江钦徐. 来华留学生突发事件预警防控机制的建构[J]. 现代教育科学,2014(4):127-131,144.

猜你喜欢
安全事件决策树预警系统
学校肺结核流行趋势控制及预警系统监测分析
2020年度区块链领域安全事件达555起
俄太空预警系统探测到64枚导弹发射
简述一种基于C4.5的随机决策树集成分类算法设计
决策树学习的剪枝方法
交通流量增长下的空管安全预警系统研究
优质护理干预对精神科护理安全事件发生率的影响探析
决策树在施工项目管理中的应用