GRNN在学生写作成绩预测中的应用研究

2016-09-26 02:16胡帅顾艳姜华渤海大学大学外语教研部辽宁锦州121013
电子设计工程 2016年11期
关键词:训练样本神经网络样本

胡帅,顾艳,姜华(渤海大学 大学外语教研部,辽宁 锦州 121013)

GRNN在学生写作成绩预测中的应用研究

胡帅,顾艳,姜华
(渤海大学 大学外语教研部,辽宁 锦州121013)

由于学生英语写作成绩预测受诸多因素影响,具有高维、非线性特点,本文基于广义回归神经网络(GRNN)算法原理,构建了GRNN学生英语写作成绩预测模型,并与弹性BP算法改进的BP神经网络模型的预测结果进行对比分析。仿真结果表明:改进的BP神经网络模型的预测最大相对误差为3.23%,GRNN模型的预测最大相对误差仅为-0.72%,表明所建立的GRNN模型的预测精度高、泛化能力强、收敛速度快、调整参数少,验证了将GRNN应用于英语写作成绩预测方案的可行性。

广义回归神经网络;BP神经网络;成绩预测;模型

对学生英语写作成绩的准确预测可为教师调整写作教学方法和学生自主学习提供有益参考。传统的预测方法采用简单的线性模型来预测。由于影响学生英语写作成绩的因素很多,使学生英语写作成绩预测呈现高维、非线性特性,所以,传统方法的预测结果误差较大,难以满足实际需要。随着人工神经网络技术的快速发展,基于神经网络的数据挖掘方法为学生英语写作成绩预测提供了新的解决途径。广义回归神经网络(General Regression Neural Network,GRNN)算法简单、逼近精度高、具有良好的非线性收敛性能[1]。文中尝试构建基于GRNN[2-4]的大学生英语写作成绩预测模型,以期解决传统方法预测精度不高的问题,并与弹性BP算法改进的BP网络模型作对比,验证GRNN预测模型的有效性。

1 GRNN的算法理论基础

GRNN由输入层、模式层、求和层、输出层4部分构成[5]。令随机向量X和随机变量Y的概率密度函数为f(X,Y),当X= X0时,则Y对X0的回归值的计算方法如式(1)所示,样本集(Xi,Yi),(i=1,2,3,…,n)非参数估计如式(2)所示。

式(2)中n为训练样本容量,w为样本向量维数,SPREAD为径向基函数的分布密度,d表示样本向量之间的欧式距离,计算方法如式(3)和式(4)所示。将式(3)和式(4)代入式(2)并经过化简最终可得式(5),由式(5)可知,径向基函数的分布密度SPREAD是唯一人为可调参数[6-7],只要取值适中,即可将所有训练样本的因变量综合进行考虑,且此时不同训练样本点与测试样本点之间的距离也一并进行计算,离测试样本点接近的训练样本点将会获得更大的权值[8]。

2 GRNN预测模型的建立

2.1写作成绩评价的指标体系构建

以往研究表明学生英语写作成绩受多种因素影响,如汉语写作能力、口语能力、词汇水平、,语法、文化因素等。本文基于已有研究发现并进一步细化,最终确定用于学生写作成绩预测的评价指标体系共包括12项评价指标。分别为:口语(X1)、听力(X2)、词汇(X3)、语法(X4)、阅读(X5)、翻译(X6)、学习动机(X7)、学习兴趣(X8)、跨文化交际能力(X9)、写作策略(X10)、语篇知识(X11)和英美文化知识(X12)。

2.2原始数据获取

学生英语写作评价体系中的X2、X5和X6三项得分依据学生大二第一学期英语四级考试分项成绩(均折合成满分为10分);X1由口语测试获得;X3、X4、X11和 X12分别由测试获得;X7、X8、X9和X10分别由问卷调查获得。为了提高预测模型的准确性、和保证样本数据的科学性,将采集到数据中的倾向性数据(评分全部为满分或全部为零分的数据)剔除,保留有效数据后,计算60位学生的各指标的平均得分,获得用于学生写作成绩预测的原始数据如表1所示。

表1 预测原始数据

2.3分布密度参数的确定

在建立GRNN时,分布密度SPREAD的取值直接影响GRNN的逼近性能,SPREAD的值越小,GRNN的逼近精度越高,但取值过小将会产生过拟合现象;SPREAD的值越大,GRNN的逼近精度越低,但拟合曲线相对较为平滑[8]。文中采用循环训练算法,在SPREAD=0.3,0.4,0.5,0.7,1.0情况下,利用GRNN对1-40号训练样本进行逼近实验,不同SPREAD值条件下的GRNN逼近结果对比如图1所示。从图1可以看出,当SPREAD=0.3时,GRNN相对误差最小,几乎为0,此时逼近性能最佳,所以,文中在建立GRNN预测模型时,最终确定SPREAD的值为0.3。

图1 不同SPREAD值条件下的GRNN逼近结果对比

2.4BPNN模型参数的确定

本文采用GRNN模型对写作成绩进行预测,并用弹性BP算法改进的BPNN模型作为对比预测模型。对于标准BPNN模型,经反复试验,最终确定其网络拓补结构为12-15-1;隐含层传递函数采用tansig函数;输出层传递函数采用purelin函数,采用基于弹性BP算法的训练函数trainrp;学习函数采用learngdm;误差性能函数采用均方误差函数mse;学习速率设为0.1。

3 仿真实验

3.1预测模型的训练

目标精度设为0.001、最大迭代次数设为10 000,将表1 中1-40号样本作为训练样本集,分别对GRNN与BPNN预测模型进行训练。GRNN与BPNN对于训练样本集的相对误差曲线如图2所示。可以看出,所建立的2种预测模型均具有较高的逼近能力,GRNN预测的相对误差几乎为0,与实际值几乎完全一致;BPNN预测的最大相对误差达到-1.71%,并且在训练样本区间内相对误差波动较大。这表明,与BPNN预测模型相比,GRNN预测模型在逼近能力、学习速度上都具有明显优势。

3.2预测模型的泛化能力测试

将表1中41-60号样本作为测试样本集,对GRNN与BPNN预测模型进行泛化能力测试。GRNN与BPNN的预测结果如图3所示。GRNN与BPNN对于测试样本集的相对误差曲线如图4所示。从图3和图4可以看出,GRNN与BPNN都达到了较高的预测精度,GRNN对测试样本集预测的最大相对误差仅为-0.72%,但是,BPNN预测的最大相对误差已经达到3.23%,并且在测试样本区间内误差波动范围较大。这说明GRNN在逼近能力和学习速度上较BPNN有更大优势,仿真实验发现,所建立的GRNN模型即使样本数据较少,但是预测效果依然很好,而BPNN模型则需大量样本才能进一步提高其预测精度,但这势必增大网络模型的复杂程度,并且如何确定BPNN的拓补结构、如何选取传递函数、如何避免局部极小值以及网络收敛速度过慢都使其在应用时存在很大局限性。

图2 GRNN与BPNN对于训练样本集的相对误差

图3 GRNN与BPNN的预测结果

图4 GRNN与BPNN对于测试样本集的相对误差

4 结 论

本文应用GRNN对在校大学生英语写作成绩进行预测分析,仿真结果表明,尽管学生英语写作成绩的影响因素很多,呈现较大的非线性,但是,因为GRNN的人为调节参数很少,具有很强的非线性映射能力,故所建立的GRNN预测模型的运行速度、预测准确性都明显优于BP网络,可以较好地完成写作成绩预测任务,具有较强的实际操作性。

[1]丁硕,常晓恒,巫庆辉,等.基于GRNN与BPNN的二维向量模式分类对比研究[J].国外电子测量技术,2014,33(5):56-58.

[2]王晓光,周慧,张有君.应用GRNN模型对给水管网水质的综合评价[J].沈阳理工大学学报,2011,30(4):63-66.

[3]DING Shuo,CHANG Xiao-heng,WU Qing-hui.A Study on Approximation Performances of General Regression Neural Network[J].Applied Mechanics and Materials,2014(441): 713-716.

[4]DING Shuo,CHANG Xiao-heng,WU Qing-hui.Application of General Regression Neural Network in Characteristic Curve Fitting of Optical Fiber Micro-bend Sensor[J].Applied Mechanics and Materials,2014(441):116-119.

[5]丁硕,常晓恒,巫庆辉.GRNN与BPNN的函数逼近性能对比研究[J].现代电子技术,2014,37(7):114-117.

[6]贾花萍.GRNN神经网络在电力系统负荷预报中的应用[J].电子设计工程,2012,20(3):14-16.

[7]郭婉娥.Elman与GRNN神经网络模型在水环境承载力评价中的应用——以文山州区域水环境承载力评价为例[J].水资源与水工程学报,2013,24(4):184-188.

[8]何汉林,孟爱华,祝甲明,等.基于优化的GRNN和BP神经网络的磁滞曲线拟合对比分析[J].机电工程,2013,30(1): 116-120.

【相关参考文献链接】

杨艺,虎恩典.基于S函数的BP神经网络PID控制器及Simulink仿真[J].2014,22(4):29-31.

任伟建,陈奕君.基于神经网络的移动机器人多传感器数据融合研究.2014,22(12):5-8.

李钢,吕国芳.基于正则化RBF神经网络的混凝土强度预测[J]. 2014,22(13):52-54.

闫妍,张云鹏,张一弛,等.基于BP神经网络的食品价格的预测[J].2014,22(15):47-49.

刘朝云,翟春燕,李书臣,等.神经网络专家系统在电机故障诊断中的应用[J].2014,22(15):159-161.

费晶,李赵兴.基于BP和RBF神经网络的新型融合技术研究[J]. 2014,22(17):96-98.

管艳娜,李孝安.基于神经网络专家系统的推理研究[J].2014,22(20):20-22.

邹云.基于神经网络的海面溢油图像分类算法[J].2014,22 (20):168-170.

樊润洁,朱亚男.基于神经网络的传感器非线性误差校正方法[J].2014,22(23):56-59.

Study of application of GRNN in student writing score prediction

HU Shuai,GU Yan,JIANG Hua
(Teaching and Research Institute of Foreign Languages,Bohai University,Jinzhou 121013,China)

Prediction of student English writing scores is influenced by various factors.It has high dimensional and nonlinear features.A prediction model of students’English writing scores was established in this paper.The model was based on the algorithm principle of generalized regression neural networks(GRNN).Its prediction result was analyzed and compared with that of a BP neural network model improved by resilient back-propagation.The simulation results indicate that:the largest relative error of prediction produced by improved BP neural network model is 3.23%,while the one produced by GRNN model isonly-0.72%.This implies that the GRNN model has higher prediction accuracy,better generalization ability,faster convergence speed and less adjusting parameters.Thus the feasibility of applying GRNN to English writing score prediction is verified.

general regression neural network;BP neural network;score prediction model

TN609

A

1674-6236(2016)11-0015-03

2015-07-14稿件编号:201507105

辽宁省教育厅科学研究一般项目(W2015015);辽宁省社会科学基金资助项目(L14CYY022)

胡 帅(1980—),女,黑龙江双鸭山人,硕士,讲师。研究方向:语料库语言学、神经网络理论及其应用研究。

猜你喜欢
训练样本神经网络样本
用样本估计总体复习点拨
人工智能
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
推动医改的“直销样本”
随机微分方程的样本Lyapunov二次型估计
宽带光谱成像系统最优训练样本选择方法研究
基于稀疏重构的机载雷达训练样本挑选方法
基于神经网络的拉矫机控制模型建立
村企共赢的样本