李毓刚 张龙飞
【摘 要】应用PSO优化算法代替BP算法中的梯度下降法训练神经网络的参数,可以达到全局寻优和快速高效的目的,并且可以避免局部极小问题。本文应用定量与定性相结合的方法,应用基于PSO神经网络数字模型,建立了数字参考咨询服务评价模型,并利用该体系指标对高校图书馆的参考咨询服务评价进行了实证研究。
【关键词】数字参考咨询;PSO;神经网络;评价
1数字参考咨询服务评价体系综述
根据数字参考咨询服务以用户为中心的原则,参照目前国内外的评价体系建立评价数字参考咨询服务的指标体系。本文把指标体系划分成数字参考源、参考咨询服务、用户满意度、技术平台、咨询队伍5个一级指标,再分别根据其特征进行指标的二级和三级细分。如表1所示:
2粒子群神经网络算法
2.1评价方法的选取
利用BP神经网络建立数字参考咨询评价体系也已有研究。鉴于BP神经网络算法处理信息能力强,可以并行处理数据,自身还具有学习、联想和记忆能力,这种算法不但可以避免选取权重和相关系数时人为因素的干扰,而且评价结果也更加客观。但BP神经网络应用的是最速梯度下降法修正权值,也存在着一些弱点:①学习收敛速度慢;②容易陷入局部极小值;③网络结构不确定。而粒子群优化算法是用PSO算法替代BP算法中的梯度下降法训练神经网络的参数(即权值和阈值),可以弥补BP算法的缺点,改善神经网络性能,加快搜索速度,并且能够防止BP算法的过早收敛,使其不易陷入局部极小,增强了网络的泛化性能。因此本文提出了一种利用粒子群算法训练神经元网络的模型,来解决数字参考咨询服务评价的问题。
2.2粒子群神经网络优化算法原理
粒子群优化算法(PSO) 通过模拟鸟类觅食行为而发展起来的一种群体智能算法。每个个体能够记住自己当前所找到的最好位置;此外,还记住群体中所有鸟中找到的最好位置。这两个最有变量使得鸟在某种程度上朝这个方向努力。将这种思想抽象成数学模型就是:设N个粒子组成的一个群落,搜索空间为D维,第i个粒子的位置表示为向量(xi1,xi2,…, xid);第i个粒子“飞行”历史中最优位置(即该位置对应解最优) pbest为(pi1,pi2,…,pid)。其中整个粒子群迄今为止搜索到最优位置gbest为(pg1,…,pgd)。第i个粒子的速度为向量Vi=(Vi1,vi2,…,vid)。每个粒子的位置按如下公式进行迭代变化(“飞行”):
vid(t+1)= ωVid(t)+c1r1[Pid-Xid(t)]+c2r2[Pgd-Xid(t)] (1)
Xid(t+1)=Xid(t)+Vid(t+1) (2)
其中ω为惯性权重。c1,c2为正常数,被称为加速因子,通常c1=c2=2。r1 和r2为[0,1]区间服从均匀分布的随机数。粒子群的规模N也可以根据搜索空间的维数D用下面公式计算:
另外,粒子在不断根据速度调整自己的位置时,还要受到最大速度Vmax的限制,当vi超过Vmax时将被限制为Vmax。粒子群初始位置和速度随机产生,然后按式(1)和式(2)进行迭代,直至满足终止条件。
公式(1)由三部分组成,第一部分为粒子先前的速度,说明粒子的目前状态;第二部分为“认知”部分,表示粒子本身的思考,鼓励其飞向自身曾经发现的最佳位置;第三部分为“社会”部分,表示粒子间的信息共享与相互合作,鼓励其飞向整个粒子群曾经发现的最佳位置。三个部分共同决定了粒子的空间搜索能力。
2.3粒子群优化神经网络(PSO-BP)算法步骤
BP神经网络的训练过程是根据样本集对神经元之间的连接权值、阀值进行调整的过程。基于粒子群优化神经网络训练过程亦如此,先将神经元之间的所有连接权值、阈值编码成实数向量来表示种群中的个体;随机生成这些向量的群体,接着按照算法原步骤迭代;迭代中新生成的个体向量还原为神经网络权值和阀值。计算所有样本通过神经网络产生的均方差指标(适应度),如果均方差小于系统指定的误差精度ε,则训练过程停止,否则迭代继续进行,直到达到最大迭代次数。用PSO算法训练BP神经网络的具体流程如下:
Stepl:首先初始化网络结构。设定网络的输入层、隐含层、输出层的神经元个数。
Step2:初始化种群的规模N,惯性权重ω、加速因子c1和c2、最大速度Vmax、最大迭代次数nmax、精度要求ε;
初始速度Vid,初始位置Xid。
Step3: 根据适应度函数计算每个粒子的适应度值(即神经网络的输出均方误差MES)
2.3.1训练集中每个样本都有一个输出值,按照当前网络的结构和权值、阈值,计算出每个样本的输出值。
2.3.2通过公式:
Step4: 对每个粒子,用它的适应度值和个体极值pBest的适应度值比较,如果较好,则替代pBest;对每个粒子,用它的适应度值和全局极值gBest的适应度值比较,如果较好,则替换gBest;
Step5: 考察粒子的适应度和当前的最大迭代次数,若MES>ε或未到达最大循环次数nmax,进入下一步;否则退出;
Step6: 根据公式1和2更新粒子的速度和位置,生成下一代粒子;
Step7: 迭代次数加1,同时调整惯性权重ω;回到Step3。
Step8: 输出一组全局最优粒子映射为神经网络的权值和阀值。
Step9: 训练结束。
3实证研究
3.1评价指标的标准化
根据设置好的参数选取为训练样本。首先将训练样本数据归一化处理,将处理后的数据带入优化后的神经网络模型进行仿真,再把测试样本进行归一化处理,训练结束得到的结果就是数字参考咨询服务综合评价结果。
结合中国地质大学图书馆的数字参考咨询服务做了问卷调查。考察师生对数字参考咨询服务的评价情况,请师生对参考咨询各项指标打分,并给出综合评价分。共收回70份问卷,其中有效问卷40份。选取37个样本作为训练样本,其他三个样本数据作为验证样本。并将所有有效样本的数字参考咨询服务评价各指标均值作为测试样本(数据如下表2)。综合测试样本测试后的结果作为中国地质大学图书馆数字参考咨询服务评价最终结果。
3.2模型建立
基于PSO优化BP神经网络的算法流程,应用Matlab7进行编程实验。本文应用一个隐层的BP神经网络拓扑结构。因为在数字参考咨询服务的评价模型中有29个三级指标,所以网络输入层的神经元个数为29。模型的建立最终需要对数字参考咨询进行综合评价,所以输出层的神经元个数为1。隐含层节点数根据经验,确定为8。应用s型函数Sigmoid作为激活函数。
粒子长度D为30*8+8+1=249;粒子群的个数N设置为40个;学习因子c1=c2=2;设置粒子最大迭代次数nmax设置为300次,粒子最大速度Vmax设置为0.5,最小误差ε为0.00l。在本文中,引用了惯性权重线性下降的粒子群改进算法。故需要确定惯性权重的最大值为wmax=0.90;wmin=0.30。
按照粒子群优化神经网络(PSO-BP)算法步骤,训练完毕后得到的前全局最优粒子映射为网络的权值和阈值。首先将训练样本数据归一化处理,将处理后的数据带入优化后的神经网络模型进行仿真,然后把仿真结果进行归一化处理。最后,把所有样本的均值作为综合测试样本,训练后得到中国地质大学图书馆参考咨询最后综合得分。
根据设置好的参数,分别应用BP神经网络模型和PSO-BP神经网络模型对实验数据进行实验。传统BP 神经网络的收敛速度为 2121步,而用改进粒子群优化的BP神经网络的收敛速度仅为150 步,说明用PSO 算法训练BP 神经网络权值可以显著提高网络的收敛速度。
4结论
应用PSO优化算法代替BP算法中的梯度下降法训练神经网络的参数,可以达到全局寻优和快速高效的目的,并且可以避免局部极小问题。该算法不但具有全局搜索能力,而且提高了局部搜索能力。从而极大地改善了结果通过模型得出的数字参考咨询服务的综合评价结果。更加客观真实地反映了数字参考咨询服务的质量情况,为新时期图书馆整体服务质量的评估提供了客观依据。
参考文献:
[1]杨菊枝.数字环境下高校图书馆的参考咨询及其评价[J].图书馆学刊,2005(5):83-84.
[2]白涵颖.数字参考咨询评价体系研究[J].图书馆学研究,2007(6):70-72.
作者简介:
李毓刚(1980.4~),男,汉,南海,副高(国家网络规划师),软件工程。