马馨雅
摘 要:在不少情境下都存在着考勤制度,例如公司针对外勤员工的考勤,老师针对学生的考勤等。目前现存的一些考勤方式往往存在一定程度上的漏洞,使得被考勤的人员总是有机可乘。基于此,文章提出了一种将GPS定位和人声识别结合于一体的考勤方式,以防止员工或学生在考勤时钻空子。
关键词:GPS定位;声纹识别;考勤
考勤制度存在于人们生活中的许多方面,涉及的人除了常见的公司员工,还有广大大学生等。早些时候,常见的考勤的制度是纸质签到,后期又延伸出了扫码签到等,但是显而易见地,这种考勤方式是最容易被代签的。后来,又有了指纹签到等较为高科技的签到方式,但是该方式的速度较慢,成本较高,且不利于外勤人员进行签到。目前最常使用的还有使用软件,根据判断签到时的GPS定位进行签到,这种方式虽然成本较低,便于管理外勤人员,但是一旦“人机分离”,依旧很容易作弊[1]。
因此,本文提出了一种将GPS定位和人声识别结合于一体的考勤方式。目前,GPS定位技术已经较为成熟,许多考勤软件中都在使用这项技术。但是光靠GPS定位来签到也容易作弊。声纹识别技术,是生物识别技术中较为成熟的一种,它能够有效地辨别人声。结合了GPS定位和人声识别的系统,能够在定位的同时,识别使用者是否用户本人,这就可以有效地避免作弊现象的发生。
1 概述
1.1 声纹识别技术
声纹识别的基本原理可以理解为:将要判断的说话人的模型特征与训练模型进行匹配,之后再根据得到的匹配率或概率值进行辨认或确认操作[2]。
本文中,本人选择的是梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)。MFCC和基于线性预测的倒谱一比较,MFCC的顯著优点是:它不依赖全极点语音产生模型的假定。并且,通常在与文本无关的说话人识别系统中,MFCC可以非常好地提高系统的性能[3]。在文本相关的声纹识别系统中,MFCC的表现也十分优异。因此,可以选用MFCC。本文中,把MFCC用于隐马尔可夫模型(Hidden Markov Model,HMM)的训练过程与识别过程中。HMM模型在声纹识别系统中应用得较为广泛[4],HMM中针对每一帧语音,每一个音素都有特征向量,而此处,采用何种特征向量,则可以按照具体情况而定。
1.2 GPS定位
该系统是基于安卓系统开发的。安卓是一款开源的系统,其开发成本较低,可用的API较多。在这个系统中,拟基于百度地图LBS定位,进行SDK二次开发。同时还利用了百度地图LBS云来作为该系统的服务端。之所以采用这种开发方式,是为了减轻该系统的服务器端的压力。图1为云存储字段定义方式的部分摘录。
2 系统设计
图2是声纹识别模块的结构。从图中我们可以清楚地看到,图上一共有两个录音设备。第一个录音设备是用于训练模型,用户在第一次使用该系统时需要根据系统提示的文本进行语音输入,系统会对用户的声纹进行采集并提取特征,进行模型的训练,并将该模型上传到服务器上;之后,在正式使用该系统时,用户需要语音输入系统给出的文本,由系统对声纹再次进行采集并提取特征,将得到的模型与服务器上的模型进行匹配。如果匹配成功,则认定为用户本人。此时,如果GPS定位也在预设地点的某个范围内,则认为是一次成功的打卡行为。
在第一次进行声纹模型采集时,使用的文本是固定的。但是在随后的使用中,为了防止预录音的情况发生,系统所给出的文本将会是随机的。
外勤人员的考勤地点并不固定,且室外环境较为嘈杂。因此,本文中为了提高这个考勤系统在嘈杂环境下的性能,声音要进行过滤。同时,用户的语音特征不是保持不变的,而是会发生改变的。在研究本系统的过程中会进行许多次实验测试以及计算来确定一个最优阈值。
3 结语
本文中研究的是一款Android平台上的结合了声纹识别和GPS定位的双重认证考勤系统。用户在使用该系统时需要先上传自己的声纹模型,考勤时需要通过语音输入来匹配声纹模型,若匹配成功还需结合GPS定位的情况,只有在工作地点的某个范围内,才能算作是一次合格的考勤。同时,管理员还可以在后台查看员工的打卡情况,包括打卡时间、定位情况和声纹匹配结果。而且管理员还可以发布打卡任务。该系统简单易用,成本较低,适宜广泛推广,并且能够有效地减少考勤的作弊情况,提升用人单位的监管效率。
[参考文献]
[1]季敏飞,彭媛媛,万可鑫.基于GPS与声纹的手机考勤识别研究[J].电脑迷,2017(7):174.
[2]沈阳丽,赵启升.GMM-UBM声纹识别技术研究与应用[J].电脑编程技巧与维护,2017(16):84-86.
[3]曹辉,徐晨,赵晓,等.说话人识别中的Mel特征频率倒谱系数[J].西北大学学报(自然科学版),2013(2):203-208.
[4]姚敏锋.基于HMM的声纹考勤算法改进[J].电脑与信息技术,2016(5):22-25.