梁亚玲,高 铭
(江汉大学 商学院,武汉 430056)
信息技术的发展带来了数据量爆发式的增长,“互联网+”模式逐渐成为主流,如今大数据应用已经渗透到各个行业的各种业务模式之中。中国互联网络信息中心(CNNIC)发布的《中国互联网络发展状况统计报告》显示,截至2020年12月,我国网民规模达9.89亿,较2020 年3 月增长8540 万,互联网普及率达70.4%。
新冠疫情进入常态化以来,大数据技术几乎应用于全球范围内各个领域与各个行业中,进一步扩大了市场对于数字化人才的需求。根据领英人才报告库发布的《全球数字人才发展年度报告(2020)》显示,欧洲有将近一半的数字化人才流向亚太地区,这也间接表明了亚太地区数字经济的发展活力。在“第十四个五年规划”提出之后,政府也陆续出台了相关政策推进大数据行业的发展与传统行业的数字化转型,导致不同领域对数字化人才需求的侧重点与要求出现了非常大的差异。
中国信通院《2021 年中国数字经济就业发展研究报告》指出:产业数字化领域招聘人数占总招聘人数的75.8%。数据经济大力发展的同时,进一步扩大了数字化人才的需求缺口,目前国内大数据产业主要集中在东部沿海地区,与之相比中西部地区的数字化经济发展则相对落后。数字经济发展的不平衡也说明了整个大数据行业缺乏明确的发展方向与规划,而根本原因是已有人才在数量与质量上都不能满足数字化发展的需求,制约了数字经济的发展。
一般认为掌握ICT(信息与通信技术)相关技能并能够运用的人就是数字化人才,但这样的定义是不充分、不全面的。本文认为,2019 年怡安翰威特咨询公司提出的“数字化人才”概念对数字化人才的定义是比较符合企业需求的。该公司认为,仅有优秀ICT技能的技术人员并不足以满足企业的数字化变革需求,在企业中一般要求员工具有真正匹配数字化时代的胜任力——由于职能的不同,未必需要其掌握数字化的技术,但必须具有数字化的思维与特质。怡安翰威特咨询公司发布的数字化胜任力模型指出:数字化人才有三大胜任力,即学习能力、灵活性与好奇心,以及八大辅助胜任力即成功的意愿、数据处理能力,解决问题的策略、商业敏锐度、远程协作、数字化沟通、毅力以及乐于助人的品质,这些,都是数字化人才的“软实力”。
数字化人才不仅需要懂得相关的技能,同时还要掌握统计学、管理学等方面的知识。数字化人才培养过程漫长,同时又会涉及多个学科交叉的过程,而企业的培养模式通常都不够成熟和系统。不少企业员工都是边工作边学习相关的培训课程,而且企业培训的进度安排较为紧凑,没有考虑到员工能否掌握。同时,大数据相关的知识体系非常复杂,对员工开展在职培训也很难收到实质性的效果。
目前大多数高校大数据专业是新设立的,对于使用的教材与教师讲授的内容没有明确的规划。同时在讲授过程中也不够注重实践,课堂上缺乏项目来引导学生的兴趣,学生往往在结课时才能有系统的实验课程来练手,导致许多大数据专业的学生往往对于相关理论概念有印象,但是对于企业中真正的大数据处理与分析的具体流程与相关技能要求一知半解。事实上,学生在缺少实际应用场景的学习模式下,通过书本去学习大数据本身就是一个问题,从而导致高校培养的毕业生往往不能满足企业的用人需求,企业需要进行漫长的二次培养。
本文综合考虑招聘网站的权威性、抓取难度后,以“大数据”为检索关键字从51job 上搜索招聘信息。本文的研究方案主要从以下五个方面进行:第一,对获得的数据进行清洗,去除无效、非结构化数据;第二,再对招聘信息的岗位描述进行文本整合,通过python 进行分词处理,提取出频率最高的关键词;第三,运用数据挖掘技术对相应关键词进行词频统计并以K-means算法对关键词进行聚类分析;第四,运用FineBI 数据可视化工具进行数据可视化;第五,对上述结果进行相应分析。
本文为保证数据量的可靠性,通过自己编写程序抓取了51job 上59 222 条原始数据,通过Excel 对所得信息进行清洗,保留按“月”显示的工资信息;工作地点为具体城市;工作经验为:年、无须经验、在校生/应届生;学历要求为:博士、硕士、本科、大专、高中、初中及以下的数据,最后对重复值进行删除,保留清洗后的44 663 条数据。
对清洗后数据“岗位描述”字段进行文本整合,将整合好的文本内容进行预处理,包括更新词表、分词、词频统计等过程,保留词频大于100 的关键词81 个。
采用K-means 聚类算法进行聚类分析,在使用该算法进行分析之前需要将文本进行向量化处理,所以本文使用TF-IDF(逆文档频率)算法来实现文本信息的向量化,例如,tf 代表词频,对于某一关键词t来说,它的词频计算公式如下:
逆向文本频率idf 如果包含词条t 的文档越少,idf 越大,说明词条具有很好的类别区分能力。其中|D|代表划分的文件总数,|D|代表包含关键词ti 的文件数目,公式如下:
最后计算出t的权重,公式如下:
对于K-means 算法,其中K 的值代表聚类的数量,本文设置为4,分别为:业务能力、技能要求、专业及学历要求、个人素质相关要求。
目前来说,大数据的主要应用领域依旧为计算机软件行业,占比大致为27.16%,但是对比以前,占比已经大幅度下降。电子商务、房地产、网络通信、金融类、教育、零售业等行业对于数字化人才的需求大幅度增加,其中金融类行业占比达到2.37%,对高校商学院毕业生来说也是一个新的就业方向,如图1 所示。
图1 招聘行业分布图
同时,在疫情的影响下,教育、医疗、电子商务、金融等行业对于数字化人才的需求增加。疫情期间,线上办公、学习使得线上作业成为一种常态;疫情后像京东等大型企业也开始进军“互联网+”医疗领域;而电子商务在这次疫情中充分发挥了自身优势,许多新用户开始网上购物,用户数量的激增加速了电子商务数字化的发展;对金融行业来说,由于疫情原因,90%以上的业务都需要通过线上的渠道完成,进一步推动了行业的数字化转型。
数字化岗位在全国的分布不是非常广泛,全国大数据发展中心集中在长三角、珠三角地区,其中人才需求数量最多的8 个城市为:上海、深圳、广州、北京、南京、成都、武汉、杭州。由于国家对受疫情影响企业的扶持以及“十四五”规划的实施,在2020 年,武汉借助国家与湖北省的支持,大力发展新兴行业,提供了大量的数字化就业岗位,同时通过降低毕业生的生活成本与创业成本,使得更多武汉毕业生愿意留汉工作创业。
本文绘制在不同工作经验区间的薪资分布图来分析大数据岗位招聘对于工作经验的偏好,如图2、图3 所示。数字化相关岗位对于应聘者无经验数量占比为31.4%,薪资主要分布在6 000~ 15 000 元/月,良好的薪资待遇一定程度上说明了疫情之后全国范围对于数字化岗位需求的迫切程度。而对于需要经验的岗位,需求主要集中在3~ 4 年工作经验,同时薪资10 000~ 20 000 元/月之间的人数占比超过一半,从用人成本上来说,3~ 4年经验人才也更容易令企业接受。工作经验在5~ 7 年的需求人数大幅度减少,但是相应的薪资也是远远高于其他工作经验区间,其中最高能达到40 000 元/月。总结来说,数字化人才的需求缺口非常之大,导致对于工作经验的要求不是很看重的同时薪资福利非常可观。
图2 数字化人才工作经验与薪资分布图
图3 数字化相关岗位经验分布图
在学历方面,大专和本科的需求数量占据了整个需求的93.9%,其中对大专学历的需求达到32.94%,对互联网行业来说是罕见的,说明企业往往难以招聘到足够的人才。但其对于人才也具有一定的技能性要求和学习能力的偏好;而硕士与博士仅占3.31%,主要集中在涉及算法的岗位,其对于专业技能的掌握程度有更严格的要求。如图4 所示。
图4 数字化相关岗位学历要求占比
总结来说,数字化人才的缺口导致企业对招聘学历的要求不像以前一样严格,企业更加看重人才的综合能力。
3.5.1 数字化人才整体技能要求
本文通过自定义分词的方式对招聘描述文本信息进行分词处理,选取了英文词频数前28 个与中文词频数前53个关键词通过FineBI生成词云图,如图5所示。数字化岗位更加看重人才是否具备经验,包含学习、工作经验,以及生活中的人际交往与团队协作等方面的经验。同时,对于“开发”能力也有一定要求。总的来说,数字化相关的岗位不仅仅只看专业技能,也注重个人综合素质。
图5 数字化相关岗位整体能力要求
3.5.2 数字化岗位高频率的技能需求分析
使用技能分类关键词生成词云,如图6 所示。其中数据库出现的次数最多,说明对于数据处理、分析方面的要求比较高,除了SQL 相关基础技能外,对于hadoop、python、spark、redis 等大数据处理工具也要求掌握。在编程语言方面,对人才的编程能力要求不高,工作中大多使用java 与python,但是对于算法方面会有一定的要求。总结来说,数字化行业进入门槛不高。
图6 数字化相关岗位高频技能
3.5.3 数字化岗位综合素质需求分析
通过对综合能力类的关键词生成词云,如图7 所示。大多数企业更加喜欢招聘具有相关经验的人才来减少企业的用人成本;同时要求应聘者能够通过团队合作沟通来快速完成岗位工作;硬性要求具备相应的分析能力,需要对公司的业务与客户的需求能深度理解,能够通过分析、处理、团队协作来解决相应的问题。
图7 数字化岗位综合素质要求
大多数企业对数字化人才的专业技能掌握程度要求不高,更多聚焦在综合素质方面。在2016 年中国首次设立大数据专业时,仅仅只有3 所高校设立该专业,到目前全国大部分高校都相继设立了大数据专业,足以看出大数据未来的发展趋势。但目前企业招聘的数字化人才中大部分都是计算机类专业的学生,让他们通过短期的岗前培训来填补数字化岗位的缺口。高校培养的人才数量、质量远远达不到预期。
本文研究发现:企业对人才招聘的注重点更偏向于招收具有相关经验的人才,用以减少企业的培养成本;相较于传统互联网行业来说,企业对于专业技能掌握程度的要求并不是很高,更注重人才的综合素质以及工作中的分析、处理问题能力。但目前高校培养人才过于注重理论学习,导致毕业生没有相应的项目经验,而且许多高校的大数据专业往往都是在原有信息管理或计算机相关专业的基础上设立,相关课程的设置不够合理、科学。
高校应当是数字化人才的培养基地,培养的毕业生除了具有基础知识,还要具有一定的实践能力。如果刚毕业就能满足企业中低岗位的从业要求,即有一定的实际应用能力,那么就会具有相当的竞争力。这种实际应用能力可以通过参与具体的大数据开发项目获得。因此本文提出以下建议。
(1)高校需要时刻关注新技术的发展与应用,及时关注企业的需求,适时调整人才培养计划,并同步进行新学科、新专业建设。
(2)在不放松理论基础知识教育的同时,增加应用能力培养。理论基础知识对于人才的综合素养与发展潜力有着重要意义,不能削弱,但如果不具备实际应用能力,进入企业还需要再培训,则毕业生的竞争力有限。应用能力培养可以通过具体的项目实施完成,这样不仅能提高学生对于课程的兴趣,更能提升对专业技能的认识。
(3)大数据的应用十分广泛,在专业建设时可设置多个发展方向,教学方面则对应不同的侧重点,例如,数据的采集与可视化方向、数据的分析与挖掘方向、机器学习与深度算法方向。
(4)高校可加强与企业之间的深度合作,使得地方企业成为高校人才的实践基地,培养学生的实践能力与项目经验。
(5)高校应重视学生职业规划教育,引导学生在实践的过程中积累工作、生活经验,提升自身综合能力,完善职业生涯规划。