◆张江 王世玲 刘星程 谢敬锐 水冰洁
(云南省军区 云南 650051)
目前企事业单位对员工考评的方式较为单一,常常以简单指标作为评判依据,即以员工的考勤打卡情况、项目价值、项目数量和项目完成度等作为考评指标。然而上述的指标并不能完全反映一个员工的实际能力和影响力。实际上,企业员工在日常工作中往往会积累大量的信息,例如员工与客户之间或是员工之间的邮件往来信息,员工在出差、会议过程中产生的各种信息交互。其实这些数据最能体现一个员工在日常工作中的活跃度和影响力。然而直接评判这些信息已经超出了人的直观理解力,需要借助数据分析技术才能挖掘出这些数据中的潜在价值。本文通过社交网络技术对企业员工在日常工作中形成的各种业务数据进行挖掘,并将结果作为员工考核评价的重要参考。
社交网络是指由多个社会成员及其相互间关系组成的一种网络结构。从计算机处理的角度来讲,社交网络的节点代表社会成员,节点之间的连线代表社会关系,对这种网络结构的研究即称之为社交网络分析。随着以Facebook、“微博”代表的社交网络应用的发展,对社交网络进行分析也成为业界的研究热点。通过社会成员和关系抽象为节点和连线可以构建出社交网络分析模型,并可使用不同的度量指标从多角度分析社交网络的结构特征。社交网络分析主要采用“中心度”、“接近度”和“中介度”三种指标来度量网络节点的重要性和网络的集中程度,从而分析整个社交网络的结构特点和节点关系。
本方案选用邮件、论文发表和会议发言(出差与客户交流也列入会议发言)三项数据来构建综合考评社交网络数据集,下面以邮件数据分析为例阐述利用数据分析技术综合评价员工的基本流程。
首先对“参评员工”的邮件信息进行信息采集及预处理,删除其中的垃圾邮件、重复邮件和工作无关邮件,对于涉及同一项目的多份邮件则只当作一份邮件。采集完毕后,由评审专家组评估每封邮件的重要性,并按照统一的标准设定一个权值。
邮件信息采集完毕后,方案将根据这些信息构建邮件数据社交网络图。本文选用的构图工具为Gephi,根据采集的信息按照Gephi的格式要求分别构建网络节点表和“边”表。如图1所示,网络节点表的每一行和一个“参评员工”所对应;“边”表的每一行对应一封邮件,其中Source为发件人,Target为收件人,而3.1设置的邮件权重则录入“边”表的Weight字段。
需要特别指出的是,本文为了能够更直观地显示员工在网络拓扑中的“热度”对比,没有加入收件人为企业客户的邮件信息,意即只选用了企业员工内部发送的邮件信息,这和真实情况是有很大出入的。
图1构建邮件信息网络节点表和边表
将节点表和边表的信息导入之后,即形成了邮件信息网络的原始拓扑图,首先选择合适的布局(如Fruchterman Reingold),之后对网络图的各种统计量进行计算,再对拓扑图的外观进行设置,最后形成了邮件信息网络的最终分析结果(图2)。
图2邮件信息网络节点“热度”分析结果
图2中,节点的大小代表节点的“加权度”,意即用户对外发送的邮件数量再带上权值,由于邮件的权值已经过专家组的论证,所以节点的大小可以在一定程度上反映“参评员工”在实际工作中的活跃度和影响力。图2中的边代表员工之间发送的邮件,边的粗细代表邮件的多少,通过这样的图示方式可以直观地看出“参评员工”与其他员工的交流情况,对于员工人际关系的评估也可作为一个参考。
使用同样的方法可以对员工论文发表数据集和员工会议数据集进行类似的分析并得到各自的分析结果,然后再根据这三项独立的结果对员工进行评估。
为了能够更为直观地看到员工之间的综合情况对比,本文采取将所有的“数据集”按照一定的权重比例加入同一张网络图,再根据这张网络图直接比较“参评员工”的综合情况。为此,首先要将论文数据集加入邮件网络图。论文数据集的节点由员工节点和期刊节点组成,一条边则代表一次发文,论文的权重可以由专家组进行评估,也可以直接选用期刊的影响因子。由于发一篇论文与写一封邮件的难度和影响力完全不一样,所以在论文数据集导入邮件网络图之前可以将论文的权重按照统一的比例加大。
采用同样的方式可以加入会议数据集,最终得到类似于图2的综合三项数据的分析结果。
本文针对目前企事业单位对员工评价手段单一的现状,提出了一种利用数据分析技术对员工活跃度和影响力进行综合展示的方案,为企业考核员工提供了一个有力的参考。