一种基于概率神经网络的企业R&D人才评价模型

2015-09-26 01:49陈林辉
现代计算机 2015年20期
关键词:训练样本胜任概率

陈林辉

(中石油燃料油有限责任公司华南销售分公司,广州 510240)

一种基于概率神经网络的企业R&D人才评价模型

陈林辉

(中石油燃料油有限责任公司华南销售分公司,广州510240)

0 引言

随着经济社会不断发展,企业经济对社会经济的作用越来越重要,企业的竞争也越来越激烈,竞争的核心在于企业利润,而企业的利润来自于创新的比重越来越大,因此企业的竞争依赖于企业知识创新——R&D(Research and Development)。在国外,大型的跨国企业在R&D领域研究较早,因此凭借其在R&D领域先进的技术和管理理念,在产品的产业链中牢牢占据了高端,对产品的高新技术领域形成了绝对的优势,这些都归功于企业的R&D投入;国内的企业要想在当今高端技术产品市场占有一席之地,必须加快R&D的创新研究,而R&D创新的根本是人才,何谓R&D人才,即该人员可以胜任R&D工作,因此构建一个科学合理的R&D人才胜任能力评价模型,对于当今国内企业的发展有着重要的意义。

对于企业R&D人才评价模型研究,国外比较早,早在1973年,美国哈佛大学教授戴维·麦克利兰(David McClelland)首先在其R&D人才的评价模型中提出,R&D人才胜任力并不等同于智力的论文,并用该模型来检测工作绩效或职业成功,但是该模型准确性较差[1];国内在这方面研究较晚,早期比较有代表是王重鸣首先在管理心理学中提出了胜任力并首先研究了我国企业高层管理者胜任力特征的结构[2];仲理峰对企业胜任力进行了界定[3];薛琴做了一些关于胜任力在绩效方面的补充[4],徐芳、张兰在胜利力评价方面做了一些延伸拓展[5-6]。上述的研究仅仅是停留在胜任力质的界定上,无法对胜任力实现有效的度量,不利于企业创新的有效管理,不利于现代企业的科学管理[7-8]。

基于上述问题,本文提出了基于PNN企业R&D人才评价模型,该模型是以广东某电子科技公司的R&D胜利力评价体系为基础,以实现对企业R&D人员进行有效的识别为目标,以概率神经网络为工具进行构建的。最后将该评价模型应用于实际,证明该模型有效。

1 基于PNN企业R&D人才评价模型

1.1概率神经网络理论基础

(1)贝叶斯决策分类

贝叶斯决策分类是数据挖掘分类算法中一个经典的分类算法,它是利用概率的不同分类决策与相应的决策代价之间的定量折中。简单地可以描述为:假设有两种分类模式α1、α2,对于要进行分类的样本,表示为X=(x1,x2,x3,…,xn)。

若h1l1f1(X)>h2l2f2(X)认为样本X属于α1;

若h1l1f1(X)>h2l2f2(X),则认为样本X属于α2;

在上述推理中,h1,h2分别为分类模式α1、α2的先验概率,h1=(N1/N),h2=(N2/N),其中N为训练样本的总数,N1和N2分别为分类模式α1、α2中训练样本中具体的个数;l1,l2分别为将α1、α2训练样本错误地划分到对方区域的所承担惩罚的损失或者代价。f1和f2为α1、α2中的概率密度,但是在贝叶斯分类决策中,正常情况下很难有效地获得较准确的概率密度,而实际应用中只能根据现有的概率密度计算其统计值。

针对于贝叶斯决策分类不足,Parzen在1962年提出Parzen窗口方法[9],该方法是一种从随机样本中估算概率密度的方法,是一种非参数检验方法,该方法认为,只要训练的样本足够多,所获得的概率密度函数能无限逼近真实值。其公式表示如下:

在(1)式中,α表分类模式,Xαi代表分类模式中α中的第i个训练特征向量;(1)式中m为分类模式α中所用于训练的样本个数;而p为待分类样本的特征向量维数,σ为平滑因子,平滑σ不同取值对PNN的分类的准确性有很大影响。目前该值是通过实验方法获得。

(2)概率神经网络模型

概率神经网络(PNN,Probabilistic Neural Networks)于1989年由D.F.Specht博士首先提出,是一种常用于模式分类的神经网络,也是神经网络模型的一种,PNN是基于统计原理的神经网络模型,在分类功能上与最优贝叶斯Bayes分类器等价,其实质是基于贝叶斯最小风险准则发展而来的一种并行算法,同时它不像传统的多层前向网络那样需要用BP算法进行反向误差传播的计算,而是完全前向的计算过程。它训练时间短、不易产生局部最优,而且它的分类正确率较高[10];同时该学习算法不需要训练,算法学习一次完成,比BP快5个数量级,比RBF快2个数量级,该算法模型结构如图1所示。

图1所示,输入层是接受来自训练样本的值,将其输入到概率神经网络,其神经元的个数为训练样本的特征维数。

图1 典型的概率神经网络模型I

样本层,又称模式层,用来计算输入层的特征向量与训练样本的匹配关系,其值的大小为训练样本的个数之和,模式层的计算公式如下:

在(2)式中,Wi为输入层到模式层的连接权值。从(2)可以简单地估算出该分类的概率秘密度,每一类求和层为将隶属于该类的概率密度累加,求和层只与隶属于该类的模式层相连,不和其他模式层相连。

竞争层又称输出层,该层主要负责是从各个分类模式中估计的概率选择最大的概率值做为输出神经元设置值“1”,其他概率,其他待识别样本的输出一律为0。

1.2基于PNN企业R&D人员分类模型构建

本文以广东某电子科技公司的胜任力的指标体系为模型的理论基础,广东某电子科技公司指标体系的研究小组是由公司R&D主管、人力资源部经理、人力资源管理专业人士和作为咨询专家的高校教师所组成;他们的工作方式采用事件访谈的方式和问卷调查的方式相结合完成的。

本文评价模型以PNN理论为手段,以广东某电子科技公司的胜任力的指标体系为基础构建新型的企业R&D人才的评价模型,该评价指标体系包括三级指标,一级指标称为目标层,决定该样本的最终分类;二级指标为准则层,决定最终分类的各个特征向量;三级指标为指标层,该层是关于第二层的细分,详细如图2所示。

对于是否为企业R&D人才主要是看其是否具有企业R&D人员胜任力,企业R&D人员胜任力评价体系也为企业R&D人才评价体系。

该指标体系认为,正直高绩效R&D团队的一个明显特征是团队成员相互高度信任。正直是信任的最重要维度,因为如果对别人的道德特征和基本的诚实都缺乏把握,信任的其他维度就没有意义了。正直是判断R&D人员是否值得信赖的最关键的特征之一。自信是指R&D人员对他能胜任研发工作的信心。高自信者对自身主要素质及能力有较高的评价,在研发工作面临困难的情况下,低自信者更易降低努力程度或干脆放弃;相反,那些高自信者会努力把握挑战。同样主动性强的R&D人员具有高度负责的精神,工作热情旺盛,精力充沛,对待研发工作一贯积极进取,从来不需要上级督促。而成就倾向是R&D人员追求卓越、实现目标、争取成功的内驱力,高成就倾向的R&D人员与其他人的区别之处在于他们想把研发工作做得更好,等等。

从上述分析可知,正直、自信、主动性强的人以及有成就倾向的人才是企业创新成功的保证,才是企业R&D人才的基石。同时作为企业R&D人才也应该具有能够处理好人际关系和团队合作意愿能力,这些都为企业R&D创新成功提供了支撑;而宽广的知识面和较强的专业知识都是企业R&D人才必须具备的。一个成功企业的R&D项目除了要求R&D人才要具有强悍的专业技术能力外,还要具有迅速解决问题分析及解决能力、技术创新能力、科技评价能力以及强悍的学习能力,这些都是企业R&D项目成功的技术保障。

图2 企业R&D人才评价体系

如何让企业R&D高管能快速地识别哪些员工才是企业需要的R&D人才,既有利于企业节省成本,也有利于企业获取更大的收益,这些才是本文研究的重点和任务。基于评价体系模型,本文给出了基于PNN 在R&D人才的评价模型,该模型的建模过程如下:

(1)训练样本归一化处理,首先从整体样本中选取m个有代表性的样本X=(x1,x2,x3,…,xm),每个样本的向量维度为p,建归一矩阵如下:

在(3)式归一化为(4)式,

而C即为归一化后的学习样本为(5):

(3)模式距离的计算

该距离是指样本矩阵与学习矩阵中相应元素之间的距离。假设将由m个p维向量组成的矩阵称为待识别样本矩阵,则经归一化后,需要待识别的输入样本矩阵为:

计算欧氏距离:就是需要识别的归一化的样本向量di,与每一个归一化后的训练样本(Cj)的欧氏距离E。

其中,归一化的训练样本Ci,i=1,2,…,m;归一化的待分类样本dj,j=1,2,…,m;Eij:表示第i个待分类样本(di)与第j个训练样本(Cj)的欧氏距离。

(4)模式层高斯函数的神经元被激活。学习样本与待识别样本被归一化后,通常取标准差σ=0.1的高斯型函数。激活后得到初始概率矩阵为(9)式:

(5)假设样本有m个,那么一共可以分为c类,并且各类样本的数目相同,其数量为k,则可以在网络的求和层求得各个样本属于各类的初始概率和为式(10)。

(6)计算概率,即第i个样本属于第j类的概率。

根据probij的值决定其分类。

2 实证分析

本实验平台采用Intel Pentium CPU 3.2GHz,内存为2GB,OS为Windows XP,以MALTLAB 7为仿真软件,以广东某电子科技公司从事R&D工作的人员为基础,从该公司选取含有R&D工作的人员样本分成5组,分别含有R&D工作的人员15,25,35,45,55人为对象进行研究,总人数分别为150,250,350,450,550。以广东某电子科技公司的R&D人才的胜任力指标B11、B12、B13、B14、B21、B22、B31、B32、B41、B42、B43、B44、B45、B5作为PNN的输入向量p1,p2,…,p14。将PNN构建的模型与RBF模型在识别率和训练时间上的进行比较。实验情况如下表。

表1 RBF和PNN在识别率上的比较

表2 RBF和PNN在训练时间上的比较

上述实验数据表明,从识别率来看,RBF的识别率与样本的数量有关,当样本较少时,RBF的识别率较低,而PNN具有明显的优势;并且PNN的识别率具有很好的稳定性,均保持在94%以上。同时从训练时间来看,PNN的训练时间基本比RBF的训练时间要快上2个数量级,因此从训练时间看,PNN评价模型优势同样明显。

3 结语

本文首先基于当今国内R&D人才评价模型的不足,以广东某电子科技公司的R&D人才的胜任力评价体系为基础,以贝叶斯决策分类为理论基石,提出了一个具有能够用线性学习算法完成非线性学习算法所做的工作,同时保持非线性学习算法的高精度特征的基于PNN企业R&D人才评价模型;最后将该评价模型与基于RBF的评价模型进行比较,结果表明该评价模型更有效。因此该评价模型可以作为企业实现R&D人员管理的一个科学参考,为企业参与市场竞争提供一个有力的依据。

[1]McClelland D C.Testing for competence rather than for intelligence[J].American Psychologist,1973,28:1-14.

[2]王重鸣.管理心理学[M].北京:人民教育出版,2000:112.

[3]仲理峰,等.家族企业高层管理者胜任特征模型[J].心理学报,2004,36(1):110-115.

[4]薛琴.胜任力及相关概念辨析[J].商场现代化,2008(3):47-50.

[5]张兰霞,张燕.知识型员工胜任力的评价指标与方法[J].东北大学学报(自然科学版),2006,27(8):75-79.

[6]徐芳.研发团队胜任力模型的构建及其对团队绩效的影响[J].管理探索,2003(2):34-39.

[7]方涛.基于组合分析的政府R&D投入绩效优化模型[J].科技管理研究,2013(18):49-52.

[8]曾亿武,张梓泓.广东省R&D投入产出水平综合评价——基于因子分析和聚类分析的区域比较[J].科技管理研究,2013(4):71-75.

[9]摆玉龙,杨志民.基于Parzen窗法的贝叶斯参数估计[J].计算机工程与应用,2007,43(7):55-58.

[10]Jiten P,Choi S-K.Classilication approach for reliability-based topology optimization using probabilistic neural networks[J].Structural and Multidisciplinary Optimization,2012,40(4):529-543.

In order to effectively evaluate the enterprise R&D people,enhances the competitiveness of enterprises in the industry,puts forward a new type of R&D people evaluation model based on PNN.This model is based on R&D appraisal system of a company in Guangdong,by means of probabilistic neural network classifier,as a scientific evaluation model which can quickly identify the enterprise R&D people.At the same time.Puts this model into practice,and compares the evaluation model with RBF model,the result shows the new model better. Keywords:

R&D;Evaluation System;PNN;Evaluation Model

An Enterprise Model of Enterprise R&D People Based on PNN

CHEN Lin-hui
(Southern China Sales Branch,Petro China Fuel Oil Co.,Ltd.,Guangzhou 510240)

1007-1423(2015)20-0039-06

10.3969/j.issn.1007-1423.2015.20.009

陈林辉(1981-),男,广东人,硕士,助理工程师,研究方向为软件工程

2015-05-25

2015-07-08

为了对企业的R&D人才进行有效的评价,提升企业在行业中的竞争力,提出基于PNN的企业R&D人才评价模型研究,该模型是以广东某电子科技公司R&D的胜任力评价体系为基准,以概率神经网络分类器为手段,可以快速识别企业R&D人才的科学评价模型。给出详细的构建过程。最后将该模型应用实践,将该评价模型与传统的基于RBF的评价模型进行比较,实验证明该评价模型更优。

R&D;评价体系;PNN;评价模型

猜你喜欢
训练样本胜任概率
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
软件工程胜任力培养及实现途径
人工智能
基于胜任力理论模型的冰雪人才培养新策略
提升历史教师胜任力应关注三维素养
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究