实习生安全管理系统的设计与开发

2015-06-07 11:59
实验室研究与探索 2015年8期
关键词:示警离群数据流

傅 彬

(绍兴职业技术学院,浙江 绍兴 312000)



实习生安全管理系统的设计与开发

傅 彬

(绍兴职业技术学院,浙江 绍兴 312000)

针对目前大学生实习过程中,由于实习生相对分散,存在较多的人生和财产安全隐患,提出了利用GPS、移动基站和GPRS网络,通过手机的运动轨迹,准确定位并记录学生行踪,并能在危机时刻示警的实习生安全管理系统。实验结果表明,该系统具有较好的定位和示警效果,在不增加成本的前提下增强了对实习生的安全管理,可以有效的减少大学生实习生初入社会可能遇到的安全问题,为大学生的人身财产安全提供新型的保障。

智能手机; 示警; 定位; 安全管理

0 引 言

学生实习管理工作是学校管理工作的重要组成部分,由于实习生相对分散,给学校的实习生管理带来的很大的难度,也存在着较多的安全隐患。一旦出现危机又不为人所知,结果将不堪设想。针对实习生安全管理的研究具有重要的现实意义。本文基于Android智能手机,综合利用GPS、移动基站和GPRS网络,设计一种具备能够记录学生行踪,并能在危机时刻示警的手机程序。

根据工业和信息化部的统计,2013年国内手机用户数量已超过12亿,智能手机使用普及率不断提高。基于智能手机的应用服务范围也越来越广[2]。大学生群体属于对数码电子产品比较敏感和前卫的群体,智能手机在大学生当中的普及率比社会的普及率要高,手机更成为了大学生形影不离的“伙伴”[3]。手机的物理运动轨迹与大学生的物理运动轨迹基本保持一致,通过定位手机得到实习生的位置及运动轨迹,使用一种改进的基于加权频繁模式的数据流离群点检测算法,找出频繁模式的相关属性定位离群点的异常属性,该算法得到适当训练后,具有良好判断准确性[4]。

1 相关研究背景

1.1 实习生安全措施

解决实习生安全的措施有很多,但是大多数是从立法和教育的理念上展开的。例如,文献[4]提出,要从法律的层面上,对高效实习生实习权确认和保障,对高效实习生劳动权确认和保障,对高校实习生社会保障权的确认和保障;同时提出要从学生、单位、学校和社会层面,建立起预防和处理实习生发生意外伤害的极值,以最大限度的降低这种灾害发生的可能性[5]。查阅文献发现,国外针对此类研究相对较少,其中提到,利用智能手机作为社会突发情况处理时候的工具,该文章指出,即使是在喧闹的城市里头,如果你不主动发出示警,那么周围的人也很难知道你遭遇了什么突发情况,而手机可以辅助当事人向周围或者社区警察发出警报,从而获得相应的帮助[6]。

本文提出了一种基于技术上的实习生安全系统,辅助以国内常用的法律教育等手段,切实保护实习生的生命财产安全以及各项权益。系统基于Android智能手机,综合利用GPS、移动基站和GPRS网络,设计一种具备能够记录学生行踪,并能在危机时刻示警的手机程序。此外,将收集到的数据发送到远程服务器,并在服务器上通过一些数据挖掘的算法,准确定位实习生的位置,并用数据可视化的方式展示到Web网站上,一旦有紧急事情发生,学校便可以根据手机位置,迅速找到学生所在地点,并采取进一步措施。此外,当程序得到大规模应用时,便可以收集数据,并能从这些数据中分析得出更多的信息。

1.2 定位技术

随着通信技术的不断变更,GPS系统成为了手机的标准配置,绝大多数的智能手机,不仅具备通信功能,还可以当成一个GPS定位系统[7]。GPS系统以高精度、全天候、高效率、多功能、操作简便、应用广泛等特点著称,它能够连续为各类用户提供三维坐标和精确的时间信息,观测定位时间较短。而且在GPS测量点之间不要求相互通视,受天气影响不大,被广泛应用于各个领域。但GPS有个致命的弱点,就是当手机位于室内时,就会出现信息不足的问题。

GPRS是一种基于GSM系统无线分组交换技术[8],利用GPRS定位是通过计算手机信号登录的通讯信号基站的位置来定位手机位置,其定位速度快,不受环境及终端影响。但这种方式定位精度相对较低。

本文将GPS和GPRS定位进行了有效结合,在绝大多数情况下,只通过GPS就可以采集相对精准的数据,但在个别极端情况,提供了使用GPRS定位的紧急备用方案。

1.3 离群点检测

近年来,基于数据挖掘概念的离群点检测研究取得了一定的发展,较有代表性的有Knorr等提出了基于距离的离群点检测算法[9],该方法通过数据对象最近的邻居K的距离来判断是否是离群点,距离异常更接近Hawking的异常本质定义,但它存在时间复杂度高,对高维失效,不能挖掘局部离群点等缺点。

Breunig等提出了基于密度的离群点检测算法[10],该方法对不同密度区域中的数据也能很好地处理,解决了局部离群点的离群程度的度量和挖掘问题,但仍存在时间复杂度高,对于高维数据索引结构不如顺序扫描,参数选择困难等问题。

He等提出了基于频繁模式的离群点检测算法[11],该方法将频繁模式作为通常模式,一个数据中包含频繁模式越少,成为离群点的可能性越大,解决了高维数据离群点检测问题,降低了时间复杂度,但由于需要多次扫描数据集,因此不适合数据流环境。

本文在频繁模式的离群因子概念的基础上,提出了数据流离群度量——加权频繁模式离群因子,并针对数据流特点,快速而有效地检测离群点。

2 离群点检测算法

离群点检测就是从大量复杂的数据集中发现存在于小部分异常数据中的新颖的、与常规数据模式显著不同的新的数据模式[12]。在研究了数据挖掘相关理论的基础上,拟设计一种改进的基于加权频繁模式的数据流离群点检测算法,在保证精度和时间复杂度同时,找出频繁模式的相关属性定位离群点的异常属性,然后给出该实习生当前的安全等级,并将该安全等级返回给移动终端[13]。同时,该算法还应具有一定的学习能力和容错性。学习能力是指当离群状态被用户确认为是正常状态时,将该状态通过一定的加权添加到正常点数据库中;容错能力是指能够自动处理明显不合理的数据,不会频繁的发送确认信息。该算法在得到适当的训练之后,应具备良好的判断准确性。

2.1 相关定义

设数据流对象集C={C1,C2,…,Ci,…,Cn}(1≤i≤n),其中,Ci为数据流中第i个数据,X={X1,X2,…,Xn}是数据所有项的集合。

定义1(模式P的支持度)。模式P的支持度

其中:P·Count代表数据流中满足模式P的数据个数;∥C∥代表数据集中含的数据总数。

定义2(频繁模式)。P为任意模式,如果满足

Sup(P)≥minsup,则P是频繁的,称为频繁模式,其中minsup为用户自定义最小支持度阈值。

定义3(频繁模式离群因子)。

定义4(加权频繁模式离群因子)。

2.2 算法描述

文献[18-19]中都提出了基于频繁模式的离群点检测算法,但这类算法主要针对传统静态数据集,需要至少两次的扫描来挖掘数据中的频繁模式和根据这个频繁模式来计算出每个数据的离群度。这样的执行效率较低,时间复杂度仍有进一步降低的空间,空间复杂度较大,无法适应高维数据流的应用要求。文献[16-17]中都提出了在设定支持度阈值和误差因子的情况下,得到频繁模式的估计值,保证支持度大于阈值的所以频繁模式均被输出,小于阈值-误差因子的所有模式均不输出,但是这两种算法没有对出现假正的频繁模式数量的保证。

为了克服上述缺陷,本文提出了一种FODFP-Stream算法,它能在算法动态发现与维护频繁模式的同时,也能维护候选离群集及离群因子,能够保证出现假正的概率,降低计算离群因子的代价,实时反映高维数据流的离群集及离群因子的动态变化,适应数据流离群点检测的频繁模式发现与维护。

数组C表示所有手机定位数据;CandOutlier表示候选离群点数据集;CandSet和Lattic分别表示高维候选频繁模式集和频繁模式集,其包含的元组结构为(item_id,supp,time,length),其中:item_id为模式编号;supp为模式的支持度;time为刷新时间;length为模式的长度。算法实现时,采用HashTree对元组进行存储、查找和更新等操作,具体算法描述如下:

算法:FODFP-Stream

输出:离群点集合Outlier。

(1) 将读入数据存入数组C,依次读入每条记录Xi。

(2) 将Xi中的所有模式存入高维候选频繁模式集CandSet中。

否则从CandSet和Lattic中删除Pi的所有超集。

否则就从Lattic中删除该模式Pi。

3 系统测试

本系统由移动终端和服务器端组成,其中移动终端为安装了本系统客户端程序的智能手机,服务器端由Web服务器和数据库组成,Web服务器采用Apache服务器,数据库采用MySQL。移动终端通过GPS和GPRS进行定位,采用GPRS、WiFi传输数据。

程序默认随机启动,进行自检操作,包括检查硬件和网络状况,如果手机未打开,则提示用户打开。这个过程在程序运行过程中也会不定时的运行,以确保手机硬件和网络状况良好。接着,系统会同时打开采集模块和网络监控模块。首次启动客户端程序后需要进行用户登录或注册新用户。启动客户端程序后,该程序将在后台中运行,读取GPS或GPRS定位数据,如图1所示。经过简单的预处理,如果有能被简单的专家系统所识别的异常存在则示警,否则继续数据采集并定时发送给服务器。系统拥有调用手机自带摄像头进行拍照签到功能。用户在紧急状态下通过自定义一种手机行为(例如某个特定动作晃动手机,这么设计的目的在于个别紧急状况下,用户无法点亮屏幕或者进行语音通话),触发自救功能,并通知服务器,如图2所示。同时在服务器端可以查看到实习生的运动轨迹,如图3所示。

图1 读取GPS定位数据

图2 示警信息

4 性能测试

启动客户端程序,将智能手机放在手上、口袋中,分别收集了正常和异常状况的数据集,其中正常状况的收集方法为:模拟实习生多天的上下班情况进行收集;异常状况的收集方法为:模拟实习生遇到危险时的情况进行收集。正常状况采集到的数据有60个样本,异常状况采集到的数据有10个样本。从能耗情况、定位误差及示警时延和误报率对系统进行性能测试。

(1) 能耗情况。能耗情况主要通过待机时长和内存占用率来反映,结果见表1。

图3 实习生运动轨迹

表1 能耗情况测试

(2) 定位误差及示警时延。示警时延主要由移动终端定位、启动摄像头、发送短信、拨打电话和数据传输5部分组成。其中启动摄像头、发送短信、拨打电话的时间是有智能手机自身决定的,这里主要对移动终端定位和数据传输进行了在GPS和GPRS下的定位测试以及分别通过GRPS和WiFi的网络环境进行测试,结果见表2。

表2 定位误差及示警时延测试

(3) 误报率。误报主要包括发生意外时没有正常报警和正常情况下错误报警2种情况,测试结果见表3。

表3 误报率测试

5 结 语

该项目得以成功部署应用后,可以有效地减少大学生实习生初入社会可能遇到的安全问题,为大学生的人身财产安全提供新型的保障。系统还能及时处理紧急事件,在关键时刻减少生命财产损失,最终形成大学生实习生安全的数据库,为各类决策提供参考信息。

[1] 汤继承. 当前大学生安全教育的问题成因及对策研究[D].武汉:华中师范大学,2006.

[2] 吴义太,邓有莲. 大学生实习期间权益保护中存在的问题与对策[J]. 现代教育科学,2010(7):28-30.

[3] 严敏婵,陈 晖,卢爱金,等. 1032起医学实习生不安全事件分析及对策[J]. 中国农村卫生事业管理,2010(9):728-729.

[4] 陈红梅. 对高校实习生法律身份的新认识——兼谈实习生劳动权益的保护[J]. 江淮论坛,2010(2):111-116,123.

[5] 乔海丽. 浅谈如何建立预防和妥善处理实习生发生意外伤害的机制[J]. 佳木斯教育学院学报,2012(2):182-183.

[7] Xueming Luo. "Access Control Research Based on Trusted Computing Android Smartphone." Intelligent System Design and Engineering Applications (ISDEA), 2013 Third International Conference on. IEEE, 2013.

[8] 贡知洲,路昭亮. Android发展的分析与研究[J]. 价值工程,2013(2):185-186.

[9] 肖港松,陈晓云.基于加权动态网络的频繁模式挖掘研究[J].微型机与应用,2011(19):7-10.

[10] 孔 谦. 基于Android的GPS测试仪的设计与实现[D].北京:北京邮电大学,2012.

[11] 周 峰. 基于Android智能手机平台的GPS开发[D].苏州:苏州大学,2011.

[12] 李春明,董仁才,赵景柱. 基于智能手机平台的环境噪声监测研究[J]. 安全与环境学报,2012(2):115-118.

[13] 薛鹏涛,冯志慧,许金良,等. 基于智能手机的干线公路养护巡查系统[J]. 河南农业大学学报,2012(4):434-437.

[14] Lewis P, Winstanley and T. McCarthy. "Synchronised Encoding of GPS NMEA Messages onto High Definition Video Streams." Machine Vision and Image Processing Conference, 2007. IMVIP 2007. International. IEEE, 2007.

[15] 吴健生,黄 力,刘 瑜,等. 基于手机基站数据的城市交通流量模拟[J]. 地理学报,2012(12):1657-1665.

[16] 王胜波,张 兵,孙 亮,等. 手机报警定位技术在警务中的应用[J]. 警察技术,2012(3):46-49.

[17] 阿斯力别克(Kutlumuratov Assylbek). 流数据挖掘算法在金融领域的应用研究[D].广州:华南理工大学,2012.

[18] Liu Weiguo, and Jia OuYang. "Clustering Algorithm for High Dimensional Data Stream over Sliding Windows." Trust, Security and Privacy in Computing and Communications (TrustCom), 2011 IEEE 10th International Conference on. IEEE, 2011.

[19] Zhang Peng,etal. "Classifier and cluster ensembles for mining concept drifting data streams." Data Mining (ICDM), 2010 IEEE 10th International Conference on. IEEE, 2010.

[20] Zhou X Y, Sun Z H, Zhang B L,etal. A fastoutlier detection algorithm for high dimensional catego rical data streams[J].Journal of Soft ware, 2007, 18(4): 933-942.

Design and Development of the Safety Management System for Trainee

FUBin

(Shaoxing Vocational and Technical Institute, Shaoxing 312000, China)

In the internship process, the students are relatively dispersed, there exists hidden harm of life and property safety This paper proposed a safety management system by using GPS, mobile base station and GPRS network. Through the motion trajectory of mobile phone, it can accurately position and record the location of every intern student, and alarm in times of crisis appearing. The experimental results show that, the system has good positioning and warning effect. It does not increase cost, but strengthens the security management of trainee, and can effectively reduce the safety problem of college interns entering society may encounter, and provide new security for the personal property of college students safety.

smart phone; alarm; position; safety management

2014-10-11

浙江省教育厅科研项目(Y201431515);绍兴职业技术学院科研课题(201301)

傅 彬(1980-),男,浙江绍兴人,硕士,高级技师,研究方向为无线传感网络、信息安全。

Tel.:13732490399;E-mail:734198787@qq.com

X 931.0

A

1006-7167(2015)08-0284-05

猜你喜欢
示警离群数据流
犬在搜索训练中 示警常见问题分析
汽车维修数据流基础(上)
汽车维修数据流基础(下)
浅谈气味搜索训练中口令“非”和无奖励的使用
一种相似度剪枝的离群点检测算法
浅析搜爆犬跟随示警的训练方法及要点
离群数据挖掘在发现房产销售潜在客户中的应用
基于数据流聚类的多目标跟踪算法
北医三院 数据流疏通就诊量
应用相似度测量的图离群点检测方法