摘要:数据挖掘特有的根本理论密切关联企业架构中的职员培训。数据挖掘路径下,应能建构适宜的数据库,创设概念模型、总体架构之内的物理模型、逻辑特性的模型。对职员培训关涉的若干信息妥善予以挖掘能辨识职员培训特有的影响要点,缩减耗费掉的培训金额,提升总体成效。
关键词:数据挖掘技术;企业职工培训;数据库;概念模型;物理模型;逻辑模型 文献标识码:A
中图分类号:TP311 文章编号:1009-2374(2015)10-0061-02 DOI:10.13535/j.cnki.11-4406/n.2015.0884
从现状看,数据挖掘范畴内的技术,惯常用于金融、大规模特性的商业之中。然而,企业预设的职员培训,较少采纳这一技术。对于搜集得来的培训信息,仍停留于建构某一数据库、单一情形下的数据查验。数据信息特有的决策价值,没能充分被发觉。本文依循数据挖掘的本源原理,创设了新颖情形下的数据库。采纳挖掘手段,予以深入调研。数据挖掘得来的适宜结论,能为后续时段的培训规划,提供最佳指引。
1 新颖技术的特性
搜集得来的初始数据通常数目偏多,数据表征出来的不完整倾向应当被注重。原初的数据夹带着噪声,且带有模糊特性及随机特性。数据挖掘依托着的手段,是从搜集得来的最初数据以内提炼出潜藏着的、不被知晓的、带有高层级价值这样的信息、关联着的知识等。惯用的挖掘方式包含关联规则、建构好的决策树、神经网络及特有的贝叶斯、建构的粗糙集、对应着的模糊集、挖掘流程内的聚类分析。细分出来的挖掘步骤整合了初始时段的数据预备、数值的选取、预处理特有的流程、侧重的挖掘流程、模型更替及转变、后续时段的挖掘
评价。
数据挖掘概念。数据挖掘是从大量的、不完整的、有噪声的、模糊的和随即的数据中,提取隐含在其中的、人们事先不知道的、潜在的和有价值的信息和知识的过程。数据挖掘的技术最常用的数据挖掘技术主要有决策树、关联规则、贝叶斯、神经网络、聚类分析、模糊集和粗糙集等。数据挖掘的步骤数据的挖掘过程主要包括5个阶段:数据准备、数据选择、数据预处理、数据挖掘、转换模型及模式评价。
2 构建数据库
数据挖掘特性的新颖技术不能脱离建构起来的数据库。它能从数目偏多的信息之内提炼得来可用的数值。职员培训特有的领域以内,数据库可以归整在册范畴的一切职员,对于获取到的关联结果予以辨识解析。数据库存留着的信息之内涵盖基础数据、培训得来的真正
结果。
2.1 拟定物理框架
职员培训特有的数据库,应设定适宜情形下的物理模型。拟定好的物理模型是数据特有的存留方式、多层级的数据组织。例如:某企业筛选出来的数据库,带有关系型这样的特性。搭配的管理系统设定成SQL架构下的server。建构起来的物理框架包含表1模式:
表1
2.2 拟定概念模型
职员培训关涉的概念模型能够明晰预设的系统界限,拟定根本主题。数据库涵盖着的根本信息是职员固有的自身信息、这一时段的培训成绩。归整好的这些信息凸显了单一性,但又潜藏着某些关联。采纳数据仓库,提炼并归整这样的数值,以便提炼得来决策依凭的可用信息。依循细分出来的职员特性、建构的主题,把总体范畴内的培训结果,分成多个层级,并归入数据库。
3 选出来的运用实例
3.1 采纳的关联规则
依循的评判指标,是体系架构中的置信度、对应着的支持度。必备的概率信息包含物品集特有的出现频次。最小数值的支持度表征着筛选出来的这一项目,在统计之中凸显了最低层级的重要价值。最小数值的置信度表征着设定好的这类规则,凸显了不可靠的倾向。采纳关联规则,建构精准模型,以便解析某一时段的培训状态。
3.2 采纳的模型
抽取出来的数值涵盖固有的职员信息、测试得来的成绩等。采纳预设的规则,操作这些数值。这样做能够明晰数值潜藏着的彼此关联,抽取得来的字段含有单位称呼、职员个体姓名、微机处理特有的等级。
3.3 具体的挖掘步骤
预处理特有的时段中,为了辨识设定好的关联规则,对于初始数据予以概念化。采纳A这样的符号来表征职员固有的年龄。这种情形之下,A(1)特有的信息,表示年龄没能达到25岁;A(2)表征着年龄涵盖在25岁至35岁;A(3)表征着年龄超出了35岁。采纳H这一符号,表明测试特有的通过状态。H(1)涵盖着没能通过的职员,H(2)涵盖着通过的职员。经由离散化特有的处理以后,得来最终结果。
3.4 后续的挖掘步骤
在测试之中,职员特有的通过人数,总和5940;没能通过的人数,总和1810。没能通过的概率,占到了22%。采纳预定的关联规则来挖掘这样的数据。体系范畴内的每类行为都设定了这一规则。这就表明输入数值及对应着的输出之间带有偏强的关联。
3.5 解析得来的结论
数据特有的重要性,也即兴趣度,能够辨识频繁项、设定好的规则等。依循降序排列可以获取明晰的规则列表。例如某次解析得来这种结论:年龄超出50这样的职员、工龄超出25这样的职员或者高级别范畴内的职员通过培训概率还是偏大的。与此同时,学历层级偏低的职员,通过等级与特有的学历,凸显了相关的倾向,这样的对应符合惯常的认知。
由此可见,学历层级偏低这样的职员在接纳新认知时能力是偏弱的。针对企业以内的这类职员,在接续的培训之中应多加注重。设定出来的培训形式,应符合带有差异特性的职员群体;划分的培训时段应倾向于认知偏弱的职工。例如:可以添加课时,调整预设的培训时段,保障体系以内的这些职员,能参与拟定好的培训规划。此外,对于接纳能力偏强这样的职工,可适当缩减原有的课时,缩减设定好的多样科目。这样做可缩减耗费掉的培训经费,并创设最优情形下的整体效益。离散化情形下的数值处理验证了归结出来的这一结论。
4 结语
数据库建构依循的根本原理不能脱离数据挖据。企业培训之中,借助挖掘得来的多重信息,能够解析各时段的培训成果。连续值固有的属性,在设定好的挖掘流程内得以离散化,这就为接续的深入挖掘提供了基础。调整拟定好的培训规划,确保预设的新规划,符合职员培训特有的真实状态。
参考文献
[1] 黄瑛.企业数据挖掘技术在企业信息化中的应用[J].电脑知识与技术,2011,(27).
[2] 胡玉琦.数据挖掘技术在企业职工培训中的应用[J].数字技术与应用,2011,(11).
[3] 鲍建成.数据挖掘技术在企业经营管理中的应用分析[J].电脑知识与技术,2008,(36).
[4] 卢建昌,樊围国.大数据时代下数据挖掘技术在电力企业中的应用[J].广东电力,2014,(9).
[5] 黄勇,曾薇,黄毅.数据挖掘技术在企业管理中的应用研究[J].福建电脑,2007,(4).
作者简介:王靖夫(1990-),男,河南省烟草职工培训中心培训管理科职员,研究方向:职业培训。
(责任编辑:秦逊玉)