韩王莹
(陕西职业技术学院陕西西安710100)
随着现代信息技术的发展,数据挖掘被应用在各个不同的领域,从而实现对大量信息的有效挖掘。作为企业人力管理,如何借助数据挖掘技术实现对企业管理的科学化、合理化,并从大量的数据中挖掘中有利于企业决策的信息,成为当前思考的重要问题。对此,本文通过构建决策树算法,并对其在人力资源管理中的应用进行了详细的分析。
决策树主要被运用于分类的一种树结构。它是一个以树状结构表示的分类器,并通过大量的训练样本来产生。在树状结构当中,每个不同的节点都是对属性的判断,整个树状结构中叶子的节点则成为分类的最终的结果。其每个内部的节点代表对属性的测试,一条线则代表一个测试的结果。最上面的节点为根结点。
决策树算法进行分类主要分为两部分,一部分是通过训练集建立决策树模型,另一部分则是对数据的输入。在对决策树建立的过程中,包括两个阶段:第一为建树;第二为剪枝。建树则是递归的过程,剪枝则是对决策树进行适当的修正。而ID3算法作为决策树中的典型算法,其原理则是利用信息增量值对节点的最佳分裂指标质量进行衡量。
假设H=F1*F2*…*Fn为n为有穷向量空间,其中Fi的表示为又穷离散符号集合,H当中的元素e=<V1,V2,…Vn>为例子,其中Vi∈Fi,i=1,2,…n。假设PE和NE表示为E中的两例子集,成为正例集与反例集。PE和NE的大小分别用p和n进行表示,并假设在向量空间H上的决策树对其中任意的例子进行分类的概率和H当中的正反例概率是保持一致的,并且通过决策树可作出正确的判断的信息量为:
如以其中的属性A作为该决策树的一个根,则A具有Vv(v=1,2,…,v)个不同的值,由此通过该信息可以得到决策树可以将H分为v个不同的子集,由此可以得到子集Hi的信息熵E(Hi):
通过公式(2)以A作为根节点的信息增益的值:
对人力资源的数据挖掘很多,如优秀专业技术技术模型、员工忠诚度等。以优秀专业技术人才为例,该模型主要根据人力资源管理模型当中所建立的相关人才指数体系的内容对具体的属性进行选取,其中的人才指数包括学历、职称、年龄和职位等。因此,通过决策树算法,则构成系统数据挖掘模型。
通过对企业人力资源管理的调查发现,在当前的人力资源管理中,很多企业的人力资源管理集中在人事管理和档案管理。同时对人力资源数据库进行的挖掘,通常为企业人力部门提供相关的决策信息。因此,结合企业的实际需求,本文将该系统分为人事管理、数据挖掘管理两个子系统的独立的应用程序。其中人事管理根据要求分为人事管理、资料管理、系统设置、查询统计、员工考核与培训等功能。其具体的功能如图1所示。
图1 系统功能设计Fig.1 System function design
人力资源管理子系统中,包括人事档案、系统管理、查询、培训考核、工资等功能。人事档案管理主要实现对企业员工基本信息的管理,包括姓名、年龄、职称等综合情况,并可对其中的信息进行修改、添加和删除;系统管理功能对系统的相关功能参数、数据备份、日志管理和系统的权限进行管理;查询管理包括查询和统计两大功能。其中查询功能主要对系统相关信息进行查询统计,包括个人基本信息查询、工资查询、考勤查询等;培训考核主要根据企业人力资源管理制度对员工进行培训和相关指标的综合考核。如指定部门培训计划、月度培训计划、培训指标设定等;工资则主要对员工的应发工资、实发工资、公积金、保险等内容的管理。数据挖掘子系统包括员工忠诚度挖掘、优秀人才挖掘、人才招聘挖掘等。
结合系统功能的需求,本文选择B/S访问模式对系统进行布局。其主要的原因在于传统C/S结构在系统数据维护和更新方面比较麻烦,并且维护的成本也通常比较高。而B/S模式其典型的优点在于应用程序和数据库的独立性,使得对应用程序的修改不需要再根据以往的C/S模式一样,需要对系统数据库进行更新。在客户端的选择方面,用户只需要根据安装web浏览器即可实现对系统的访问和数据的挖掘,从而给用户带来很大的方便,提高了系统的实用性。对此,本系统其具体的架构如图2所示。
图2 系统整体架构Fig.2 Overall system architecture
应用层:用户通过互联网对功能的请求,将请求首先传送给应用服务器,并通过页面中的ASP脚本实现应用层和业务层的响应。
业务层:该层作为该系统的逻辑控制中枢,负责对客户请求进行逻辑处理。该层分为应用服务器和应用程序。通过应用服务器对请求的分配,从而传递给不同的应用程序,并通过业务层中的COM组件实现与数据层的响应。
数据层:通过ADO.NET组件实现与数据库的连接。包括connection对象、command对象等。
整体系统的工具采用VS2005,并以SQL server 2008作为数据库。
结合人力资源管理系统的相关情况,本文对数据挖掘系统的整体挖掘设计则如图3所示。
系统登录的流程主要包括以下步骤:第一,打开功能界面;第二,输入用户名和密码;第三步,系统匹配。匹配成功,进入第四步;匹配错误,则提示“用户名或密码错误”;第五步,进入功能界面并结束登陆流程。其功能界面如图4所示。
该界面其具体实现代码如下:
procedure TLOGIN.BitBtn1Click(Sender:TObject);
var
s,str1,str2,str3:string;
b:Int64;
i:integer;
begin
str1:=dblookupcombobox1.Text;
str2:=trim(edit2.Text);
if adoquery1.Locate('username',str1,[])=true then
begin
str3:=adoquery1.Fieldbyname('password').AsString;
图3 DM系统总体结构Fig.3 DMsystem architecture diagram
图4 登陆界面Fig.4 Login screen
if str3=trim(str2)then
begin
userid:=adoquery1.Fieldbyname('id').AsString;
username:=adoquery1.Fieldbyname('username').
AsString;
hide;
jhgy.ShowModal;
close;
end
else messagebox(0,'密码错误,请重新输入!','错误',mb_ok);
end
else
messagebox(0,'操作员不存在,请重新选择!','错误',mb_ok);
end;
4.2.1 接口的实现
为实现数据挖掘系统中的决策树算法与其他接口的连接,本系统对该系统的文件进行统一规定,主要包括Names文件、Data文件、Tcshow和Rcshow文件等。
4.2.2 属性定义
该模块主要给用户提供自定义属性的功能。在数据挖掘中包含很多的属性,因此,为挖掘的需要,本文在系统中输入不同的属性,如职称、姓名、职位等。同时针对不同属性,提供属性合并的方式,“大专、大本”进行合并,都统称为“一般学历”。
4.2.3 数据抽取
采用随机抽取的方法对数据进行抽取。其步骤为:系统自动将带入到随机产生的哈希函数当中。从而得到其地址。如果大于抽取的记录或者是发生冲突的时候,则采用开放地址IFA重新生成函数,直到该过程合适位置,最后将所有的数据都存入到RecPos()当中。
4.2.4 决策树生成
Step1:从name、data等文件中国独处相关的数据,并将其分别存储到rec、target等数组当中;Step2:处理连续性属性;Step3:生成TreeRec;Step4:生成决策树;Step5:剪枝.
4.2.5 数据挖掘结果
本文以46例优秀技术员数据作为样本,选择性别、年龄、职称、学历、婚姻和党派作为关联属性,通过挖掘可以得到职称作为员工的一个重要的评价。高职称大多为优秀人才,中低职称当中的优秀的人才则很少。
文中以数据挖掘在人力资源管理系统中应用和系统的设计作为研究内容,构建了对企业优秀人才、员工招聘和员工忠诚度的挖掘系统,同时实现了基础的人力资源管理功能,更好的辅助企业做好对人力资源管理的日常工作和决策,从而使得该系统具有很大的实用价值。
[1] 王双苗.我国企业人力资源管理现状及发展趋势分析[J].生产力研究,2012(2):210-211,251.WANG Shuang-miao.HRMsituation and development trend analysis of China’s enterprises[J].Productivity Research,2012(2):210-211,251.
[2]李旭军.计算机信息管理系统设计原理探究[J].咸宁学院学报,2012(8):139-140.LI Xu-jun.Computer information management system design principles to explore[J].Xianning College,2012(8):139-140.
[3] 谢枫平.数据分类中决策树算法的一些改进[J].龙岩学院学报,2009(2):22-26.XIE Feng-ping.Some improvements in data classification decision tree algorithm[J].Longyan University,2009(2):22-26.
[4] 杨静,张楠男,李建,等.决策树算法的研究与应用[J].计算机技术与发展,2010(2):114-116,120.YANG Jing,ZHANG Nan-nan,LI Jian.Research and application of decision tree algorithm[J].Computer Technology and Development,2010(2):114-116,120.
[5] 汪海锐,李伟.基于关联规则的决策树算法[J].计算机工程,2011(9):104-106,109.WANG Hai-rui,LI Wei.Decision tree algorithm based on association rules[J].Computer Engineering,2011(9):104-106,109.
[6] 朱前飞,高芒.COM组件和ActiveX技术在B/S体系结构中的应用[J].计算机工程与设计,2011(9):104-106,109.ZHU Qian-fei,GAO Mang.COMcomponents and ActiveX technology in the B/S architecture application[J].Computer Engineering and Design,2011(9):104-106,109.
[7] 刘泽洪,于洪鹏.基于多Agent的分布式数据库管理系统[J].电子科技,2011,24(4):50-53.LIU Ze-hong,YU Hong-peng.Multi-Agent based distributed database management system[J].Electronic Science and Technology,2011,24(4):50-53.
[8] 吴楠,高佳.基于ArcEngine的信息管理系统关键技术研究[J].现代电子技术,2013(12):74-77.WU Nan,GAO Jia.Key technology research information management system based ArcEngine[J].Modern Electronics Technique,2013(12):74-77.