数字化转型下的企业人力资源信息系统研究

2022-03-07 12:36张志成张瑞权
电子技术应用 2022年2期
关键词:数据仓库信息系统人力资源

要 蕾 ,张志成 ,张瑞权

(1.北京卫星环境工程研究所,北京 100094;2.华北计算机系统工程研究所,北京 100083)

0 引言

随着云计算技术、大数据技术、人工智能技术和物联网技术高速发展,为了适应时代的发展和顺应信息化发展的浪潮,企业必须进行数字化转型。企业人力资源管理作为企业管理的重要组成,其数字化转型的核心诉求是:强化业务赋能,快速敏捷反应,加速服务转型,大力培养人才,自身职能转型。在这一诉求下,提高企业人力资源系统的智能化水平、将前沿信息技术融入人力资源管理信息系统之中,迅速建设一套适应当下企业发展的人力资源系统成为了企业的当务之急,也是企业数字化转型的重点之一。

1 人力资源信息系统发展现状

HR SaaS 成为趋势,信息化转型较早的企业采用了本地部署的e-HR 软件,基本满足了企业办公线上化、流程自动化、数字化管理的要求。但是传统的e-HR 软件培训成本高、后期维护难度大、升级迭代困难是当下面临的难以解决的问题。而随着数字化转型的进一步深入,在人力资源管理的基础需求上扩展出了企业人力资源管理决策支持等新的需求。企业采用HR SaaS 迅速集成新功能成为一种较好的解决方案。

随着云计算技术和移动互联网技术的蓬勃发展,现阶段的人力资源系统很好地结合了云端和移动端的技术发展,提供更加智能、便捷的管理工具,实现了去中心化的组织发展方向[1]。在人工智能技术、大数据技术的发展下,基于语音交互等技术的交互方式正在渗入企业的人力资短信息系统之中,较为先进的企业已经采用了AI 简历筛选、AI 面试等手段进行候选人的选拔,不但提升了招聘者的效率,也保证了选拔的公平公正。部分企业利用大数据技术以及海量历史数据,构建了大量数据模型应用于招聘、培训等领域,形成了复杂的知识图谱,结合人工智能技术辅助企业进行决策。

2 未来人力资源信息系统的发展方向

2.1 去中心化的建设架构

“去中心化”的本质是一种开放、共享的思想[2],现阶段的人力资源系统是从管理层的角度出发设计和实现的,随着微服务技术的发展,人力资源信息系统的应用可以实现松耦合,各应用实现完全的服务化和组件化,以此为基础,企业也可以实现去中心化的组织架构数字化转型,如图1 所示,基于微服务和低代码技术,企业可以为员工提供个性化的服务,并通过此方式分析员工的意图和感受,结合HR 的运营数据,实现更好的去中心化的人力资源管理转型。

图1 基于微服务的组织架构转型图

2.2 人工智能技术深入渗透

目前虽然较多企业已经利用人工智能技术实现了面试、简历筛选评估、语音交互的智能化转型,但是很多传统人力资源管理业务,例如人事、考勤、薪酬等方面的人工智能渗透较弱,有学者对此问题进行了数据统计研究。研究显示,在员工领导力、组织发展、员工的激励与认可、员工分析等方面人工智能的应用微乎其微,在这些方面由于每个公司的情况不同,大数据积累较弱,知识图谱构建薄弱。随着人工智能技术的进步和各公司数字化底座的持续建设和完善,例如实现人力资源系统与财务系统的联动,则可以实现薪酬管理的智能化转型,通过加强企业数字化底座的建设,在未来,人工智能技术将渗透到人力资源系统的各个业务领域,实现获取信息、提炼知识、生成智能的过程[3],实现公司人力资源系统的全面数字化转型。

2.3 数据一体化的实现

目前的企业人力资源系统主要有两种建设部署模式,一种是传统的e-HR 软件,常见于大型企业,开展信息化较早,有一套功能较为完善的人力资源系统,目前面临的问题是软件功能过时、升级迭代难,另一种是部署轻量级的HR SaaS 产品,常见于中小型企业,但由于人力资源管理模块多,系统复杂,垂直化的SaaS 部署难以打通底层数据,形成了“烟囱式”的独立的信息系统,同时,不同SaaS 服务商服务方式的差异程度越大,其标准化水平越低,不确定性也越大[4]。未来新型的人力资源系统将采取数据一体化的模式,以数据仓库技术为基础,融合各垂直系统的多源异构数据,进行分层数据处理,对数据进行标签化、结构化的分层存储,通过此方式构建的人力资源系统,升级迭代时以微服务的方式部署新应用,无需构建与其他应用和系统的数据接口和传输通道,大大降低了开发成本,同时数据仓库的构建也实现了不同模块数据的全面打通,防止“烟囱式”的业务系统形成。

3 基于数据驱动的人力资源信息系统的设计与研究

根据上文所述的人力资源系统发展现状以及未来发展方向,本文提出了图2 所示的一种新型人力资源系统架构,以新兴技术为基础,以企业的数字化转型的内在需求为核心,形成了一套以数据为驱动的人力资源系统。

图2 数据驱动的人力资源信息系统架构图

3.1 数据获取层

数据是企业最重要的资产之一,数据获取层的目的是获取企业人力资源相关的全部数据,具体有本地数据、公司内网数据、第三方平台三个来源,涵盖了人力资源系统的全部应用,以及与人力资源信息系统相关的其他系统数据。本地数据主要是公司本地部署服务器上的数据资产,例如人员信息、薪酬信息、组织人事等本地存储的结构化数据。内网数据包括了通过VPN 连入公司内网的员工上传的相关数据,以及各分公司的数据,例如在零售业中,各个门店的人员信息、考勤信息等数据的获取。第三方数据,主要是企业在第三方平台存储的数据,例如购买了SaaS 服务,存储在公有云平台上的数据,以及从第三方平台获取到的外部数据,例如从第三方招聘平台上获取到的简历等。在数据获取方面国内部分学者借鉴国外相关领域数据标准,尝试探索了诸如数据质量标准和元数据标准等的研究[5],结合现有研究成果,在获取人力资源相关数据时应当从以下几个维度考虑获取数据的全面性:一是数据的口径要保持一致,每次获取同一来源的数据时,统计方式、统计范围要一致,二是数据完整性和有效性,三是获取的数据要具备时效性,对不同来源、不同应用的数据制定不同的获取策略,对于紧急度较高的数据要及时获取。

3.2 数据处理层

数据处理层的底层由数据仓库服务器集群组成,它通过ETL(提取、转换和加载)的过程从多个异构数据源收集、清理和转换数据,研究表明为了更好地完成数据清洗过程,一定要结合特定应用领域的知识[6],所以本架构的数据获取层直接从各个业务系统中获取数据进行数据清洗,利用现有业务系统的数据逻辑进行ETL。人力资源信息系统的业务复杂,数据来源多样,数据模态千差万别,如关系数据、XML 数据、图数据、流数据、标量数据、矢量数据[7],数据仓库将来自不同来源的数据聚集到一个单一的、集中的、一致的数据存储中,以支持数据分析、数据挖掘、人工智能和机器学习。数据仓库系统使组织能够对PB 级的历史数据进行强大的分析,而这是标准数据库无法做到的。数据仓库集中来自各种数据源的数据会进行数据清除,消除重复,并使数据标准化,从而创造出一个单一的数据来源。这样会使决策者更快地洞察业务的本质。因为来自不同来源的数据限制了决策者自信地制定业务战略的能力,数据仓库支持数据集成,允许用户在每个业务决策中利用公司的所有数据。

数据集市是数据仓库的子集,主要关注特定的业务线、部门或主题领域。数据集市使特定的数据对一组定义的用户可用,这允许这些用户快速访问关键的见解,而不浪费时间搜索整个数据仓库。数据集市的构建采取自底向上的分析模式,目的是识别所有潜在的星型模式[8],从每个实体-关系(ER)模型开始,执行详尽的分析,不断发现候选实体,将这些实体作为中心节点,生成大量有向图。每个图对应一个潜在的星型模式,它由事实实体和它周围的所有可能维度构成。人力资源系统的子系统会有与其对应的数据集市,例如薪酬系统、招聘系统等。数据集市是为满足特定需求而设计的,其数据主题相对狭窄。虽然数据集市仍然可以包含数百万条记录,但它的目标是在最短的时间内为业务用户提供最相关的数据。数据集市简化了数据访问,提升了效率,用户可以利用有针对性的数据洞察来实现他们的特定目标。随着用户在更短的时间内识别和提取有价值的数据,企业可以从加速的业务流程和更高的生产力中获益。同时,数据集市的维护也更加容易,相比于庞大的数据仓库,对于数据集市的部署和运维工作也更具有效率。构建数据集市时,首先要明确使用的需求即相对应的业务线,确定数据来源,然后构建数据子集以及细分项,最后还应确定数据集市与更大规模的数据集之间的关联,确定部署逻辑。

3.3 平台层

更为深入的数据分析就需要利用到数据挖掘技术,实现一些高级别的数据分析需求[9],平台层为人力资源数据的分析利用提供了可靠的分析组件,主要包括了融合多种数据挖掘算法的数据模型的创建与可视化显示功能,主要包括分类算法与聚类算法两种,分类算法包括层次聚类算法、分割聚类算法、基于约束的聚类算法、机器学习中的聚类算法以及用于高维数据的聚类算法[10],分类算法主要包括决策树分类算法、Bayes 分类算法、基于关联规则的分类算法、基于数据库的分类算法[11],同时提供了Spark 与MapReduce 两种主要的大数据处理引擎,大数据处理引擎的使用可以从低价值密度的巨量数据中提取重要的价值[12],两种数据处理引擎分别面向不同的数据处理需求,其中Spark 在内存中进行,速度更快,而MapReduce 在磁盘中进行大量数据的处理。如表1 所示,根据人力资源系统各业务需求不同,对于数据分析处理模式以及数据分析组件的要求不同,本文将人力资源业务的数据分析模式主要分为了以下4 种。

表1 计算模型分析比较表

传统计算框架无法支撑TB、PB 级甚至EB 级规模的数据处理,通常的做法是将数据传入专门的数据分析应用程序中,然后再将数据移动到另一个应用中,直到数据分析过程结束。当数据量非常大时,移动数据往往就要花费较长时间。批计算是将大规模数据集分解为多个小规模数据集,然后将相同计算任务分发给每个小集群,实现了移动计算能力而非移动数据,大大降低了每一部分的工作量,并行计算,提升了计算效率。

流计算主要是对流式数据进行实时计算处理,可以对传入的实时数据进行实时的处理和展示。例如网上笔试时,通过对视频流的实时图像分析与处理,可以发现异常行为,保证考试的公平公正。

在线查询既要处理大规模的数据结果集又要提供一些快速计算的能力,如在线检索、条件过滤筛选等能力,能够快速从大量数据集中筛选和检索出信息,并且具有高并发、低延迟的特点。这些能力是批计算和流计算都不具备的。

OLAP 分析是指面对大规模的数据集,对数据进行多维度的交叉分析处理,OLAP 采用的多维数据模型包括维和事实两部分[13],其核心技术是找到维度和事实的映射关系,并进行数据关联,大多聚合型关联,如聚类、计数、求和等,与在线查询不同的是,在线查询通常在系统设计和实施是已知的、设定好的,而即席分析通常是在关系型的数据仓库中实时进行多维建模,实现用户临时产生的数据需求的响应。

3.4 展示层

展示层提供了多种数据可视化工具,《哈佛商业评论》将数据可视化分为四个主要目的:创意生成、创意演示、可视化发现和日常数据分析。信息可视化是可视化技术在非空间数据领域的应用,可以增强数据呈现效果,让用户以直观交互的方式实现对数据的观察和浏览,从而发现数据中隐藏的特征、关系和模式[14]。根据数据类型以及面向业务需求的不同,数据以最佳的方式呈现出来,例如员工花名册、工资明细表等以统计报表的形式呈现,人员流动和离职分析、假勤和工时贡献分析等以仪表盘的方式进行分析指标的展示,对于组织效能,组织发展,人力动能等决策层的分析则采用可以自行设计的自由报表形式进行展示。最后通过PC 端、移动端、数据大屏等多终端,将不同层次的报告根据需要,推送给CEO、HRVP、HRBP、业务负责人等不同层级的管理者。

3.5 流程自动化

人力资源工作往往面临着大量重复的信息登记、数据汇总等工作,以数据为驱动的人力资源系统同时也可以实现数据驱动的工作流程自动化,例如新入职员工在进行个人基本信息的填写时,社保系统可以自动提取办理社保手续所需的相关信息,并自动进行填报申请。

人力资源信息系统的应用可以采用低代码的方式构建,基本无需手工编码就可构建应用程序。低代码平台的图形用户界面和拖放特性使开发过程的某些方面自动化,消除了对传统计算机编程方法的依赖,使非IT人员也能够构建应用程序[15]。人力专员可以通过低代码技术自行进行软件开发,将传统的需要人工处理的繁复流程进行数字化的转型。

未来可以在工作流中引入人工智能技术,利用流程中应用与产生的大量数据进行流程挖掘,发现、验证和改进工作流。通过流程挖掘,可以发现工作中效率提升的瓶颈,并利用数据驱动的方法对流程进行优化,为管理人员在对各个流程节点进行资源分配时提供辅助决策。

4 结论

本文对针对现阶段人力资源信息系统的不足提出了一套数据驱动的新型人力资源信息系统的建设框架,提供了一套从原始数据的获取到统计分析报告的展示的全链路数据处理方案,是一种符合企业数字化转型需求的人力资源信息系统建设方案,可以实现人力资源全场景业务的一体化与数字化,为人力分析提供了优秀的系统基础和数字化底座。

猜你喜欢
数据仓库信息系统人力资源
企业信息系统安全防护
基于数据仓库的数据倾斜解决方案研究
浅析人力资源挖潜增效的途径
建立有效的管理机制奠定坚实的人力资源基础
基于区块链的通航维护信息系统研究
让人力资源会计成为企业的“新名片”
信息系统审计中计算机审计的应用
探析电力系统调度中数据仓库技术的应用
数据仓库系统设计与实现
基于ADC法的指挥信息系统效能评估