文/金振乾
基于击键特征的身份识别技术在考试系统中的应用
文/金振乾
在线考试使用简便,功能强大效率高,受到师生欢迎。但在线考试过程中容易出现替考行为。为减少此类情况发生,本文提出通过击键特征进行考生身份识别,通过记录和分析学生使用键盘的参数,进行身份识别,从而有效帮助教师发现替考行为。
行为特征 击键特征 身份识别
在线考试因收发卷方便,批改和统计结果准确率高、速度快,正在被越来越多的教师采用。但在考试过程中,学生不是直接将试卷提交给教师,而是利用终端提交给服务器,导致更容易出现替考行为。因此必须使用其他身份验证措施,减少乃至杜绝替考行为。其中,行为特征识别能够兼顾识别效果、成本和复杂度,适用于考试环境。
早在20世纪80年代,Gaines等人研究发现,每个人敲击键盘的特点是不同的,并由此产生了击键动力学。相关研究成果表明,综合分析每个人敲击键盘时的按键力度、按键位置、按键行程、按键持续时间、按键间隔时间等参数,可以有效分辨用户的真实身份。
通过击键特征进行身份识别的过程中,特征数据覆盖面越广,数据量越大,算法越先进,越容易得到准确的判断结果。
在现实环境中,很难收集到高覆盖面的大量特征数据,从而降低了识别效果。
特征识别的目的在于减少和杜绝替考行为,因此在学生登录系统环节采集特征样本,识别目的为用户身份是否与账户名相对应。这是因为:大多数学校使用的在线学习系统兼顾作业和考试功能,学生在平时会多次登录系统并输入学号、账号和密码等信息。这些信息均为固定击键序列,学生输入熟练,模式性更强,受硬件因素影响小,更容易识别;击键特征识别的目的是辅助教师发现替考行为,只需要提出警告即可,具体处理仍由教师进行。
击键特征主要通过四种时间参数来表现:
P-R时间:按下一个按键到释放该按键的时间间隔,也叫持续时间;
P-P时间:相邻两次按下按键的时间间隔;
R-P时间:释放一个按键到按下下一个按键的时间间隔,也叫间隔时间;
图1:12431023号学生击键特征分布图
图2:12421005号学生击键特征分布图
R-R时间:相邻两次释放按键的时间间隔。
系统只需监测P-R时间和R-P时间,即持续时间和间隔时间,另两个参数可用P-R时间和R-P时间推算。系统需要采集的数据包括:
输入学号时P-R时间:
输入学号时R-P时间:
输入姓名拼音时P-R时间:
输入姓名拼音时R-P时间:
输入密码时P-R时间:
输入密码时R-P时间:
其中:
x表示学号长度;
y表示姓名拼音长度;
z表示密码长度;
m表示采集数据的次数。
图1和图2分别为学号为12431023和12421005的两名学生输入自己学号时的R-P数据分布。
每个学生的击键数据是有规律的,每次击键的特征数据符合正态分布规律,即大量数据会集中于某个区间之内。但也有大于这个区间或小于这个区间的数据,即噪声数据。为简化计算,本文将噪声数据舍弃,不进行计算,并采用数据标准差进行识别运算。
计算正常数据的标准差:
Si是数据集中第i个数据的标准差;
k是数据集中第i个数据的采集次数。
当学生登录考试系统时,采集输入学号、输入姓名拼音、输入密码时产生的R-P值和P-R值,共六组数据。计算每一组数据和对应数据集的平均值的差值。假设每组数据中有N项数值,将会产生N个实际数据和平均值的差值,如果有一定范围数据的差值小于标准差,就认为该组数据是由正确的学生输入的,可认为登录学生的身份没有被仿冒,否则向监考老师发出警报,以便教师进行进一步核查。
在测试过程中,笔者共提取了22名学生的击键数据,其中17人的数据有效。经过验证,如果范围阈值设定为70%,该算法可以实现11.8%的FAR(False alarm rate,合法用户的拒绝比例)。如果将阈值降低到65%,那么FAR可以降低到0%。
较高的阈值可能产生较高的误报率,但会减少替考的可能性;而较低的阈值误报率较低,但也会降低替考者的识别比例。综合监考教师工作量、服务器运算量、误报率和替考识别率等多方面因素,阈值设定为65%到70%之间可以取得较好的平衡。
在后续研究中,将进一步研究噪声数据对识别率的影响,同时使用计算机深度学习等算法,在不过多增加运算压力的前提下提高识别率,降低误报率,使之发挥更大的作用。
[1]程叶霞,薛质.基于击键特征匹配的单点登录系统[J].通信技术,2012,45(01):99-101.
[2]傅博.基于击键序列特征提取的用户身份认证[D].陕西师范大学,2008.
[3]张治元,田国忠.基于击键韵律的身份认证模型设计与实现[J].计算机应用,2009,29(10):2799-2801.
[4]朱明,周津,王继康.基于击键特征的用户身份认证新方法[J].计算机工程,2002,28(10):138-139.
作者单位 河南司法警官职业学院 河南省郑州市450000
金振乾(1981-),男,河南省封丘县人。硕士学位。讲师。研究方向为程序设计和信息化教学方向的研究。