路健 刘彩娜 刘梦莹 张晶玉
[摘 要]隨着大数据产业的不断发展,以云计算、大数据、物联网等为代表的新一代信息技术被广泛地应用于各个领域,社会对数据分析人才的需求极大增加。文章采集前程无忧招聘网站中3 969条数据分析岗位招聘信息,利用统计分析、文本挖掘等技术进行多维度的数据分析岗位需求特征研究,描绘“知识—能力—素质—经验”人才需求画像。以招聘信息分析结果为依据,为高校数据分析类人才培养提供参考意见。
[关键词]文本挖掘;数据分析人才;需求特征;人才培养
doi:10.3969/j.issn.1673 - 0194.2023.20.071
[中图分类号]F49;C961[文献标识码]A[文章编号]1673-0194(2023)20-0224-03
0 引 言
随着信息技术的迅猛发展,我国已经进入“大物云移”时代,即大数据、物联网、云计算与移动互联网时代[1]。2021年,工业和信息化部发布的《“十四五”大数据产业发展规划》提出,到2025年,我国大数据产业测算规模突破3万亿元,创新力强、附加值高、自主可控的现代化大数据产业体系基本形成。大数据的发展将引发我国经济发展模式的变革,各行各业对数据分析人才的需求将日益增大。如何培养满足行业需要、贴近岗位需求、聚焦能力生成的数据分析人才,是高等院校亟待解决的问题。
本文利用文本挖掘技术对数据分析岗位招聘信息进行多维度的岗位需求特征分析,依据需求特征明确人才培养要素,提高人才供给与企业需求的契合度,以满足社会新经济、新产业、新业态和新技术大背景下的人才培养新要求[2]。
1 数据收集与处理
1.1 数据来源
本文于2022年11月以“数据分析”为关键词,采集前程无忧网站的招聘数据,通过数据清洗,包括去除重复数据、填充缺失值、删除无效值和处理异常值等操作,保留了3 969条招聘数据。每条招聘数据均包含企业名称、企业类型、企业规模、企业地址、招聘岗位、薪资、工作经验、学历要求、招聘人数、岗位职责、任职要求等。
1.2 数据处理
1.2.1 岗位职责和任职要求分词
招聘信息中的岗位职责和任职要求数据可以反映出企业对数据分析人才各方面的要求。本文通过Python语言调用Jieba方法实现对岗位职责和任职要求数据的中英文分词、去停用词、分词结果降维、词频统计等操作,根据词频信息提取技术能力、素质能力、应用行业等相关的关键词。
1.2.2 薪资单位统一
薪资数据中出现三种单位:千元/月、万元/月、万元/年,利用Python编写程序将所有单位统一为“万元/月”。添加“平均薪资”列,根据薪资范围中最低薪资和最高薪资计算平均工资。如将“0.6~0.8万元/月”转化为平均薪资0.7万元/月。
2 数据分析岗位基本情况分析
2.1 学历及工作经验要求分析
数据分析岗位所需的学历要求中,本科占比88.8%,硕士和博士总占比11.2%,如图1所示。所需经验要求中,3~4年工作经验需求占比最大,如图2所示。说明数据分析岗位对学历和行业经验都有一定的门槛设置,需要从业人员注意经验的积累和技术能力的提升。
2.2 薪资分析
对预处理之后的薪资列进行统计分析,如表1所示。薪资范围主要集中在1~2万元/月,说明数据分析岗位薪资待遇整体良好,且高薪占比也较多。
3 数据分析岗位核心技能分析
3.1 整体任职要求分析
运用文本挖掘技术对3 969条招聘信息的任职要求提取关键词,通过词库优化、分词、分词优化、词频统计等方法获取数据分析岗位人才需求的关键词,以词云图形式展现,如图3和图4所示。
3.2 专业技能需求分析
通过中文分词结果提取与技术相关的专业技能需求信息,按照出现频次排序,主要包括:数据库、统计分析、数据挖掘、数据建模、数据管理、数据仓库、机器学习、需求分析、数据可视化、数据采集、操作系统、编程语言、深度学习、数据报表等。
3.3 软件技能需求分析
软件工具的使用是从事数据分析工作的必备技能。通过英文分词结果提取软件技能关键词,并将软件技能关键词分为数据库、大数据处理、数据分析与挖掘、数据可视化和编程语言5类。依据关键词的词频及占比,计算得出统计结果,如表2所示。
数据库方面,SQL和MySQL使用最为广泛;大数据处理方面,Hive、Hadoop、Spark、ETL均较为重要;数据分析与挖掘中,以Python和Excel的使用为主;数据可视化工具中,Python占比遥遥领先;编程语言的要求主要为Python、Java、R三种语言。
3.4 素质能力需求分析
除了专业和软件上的核心技能外,员工的基本素质也是企业招聘时非常关注的因素。从词频统计中可以看到,责任心、学习能力、团队合作能力、逻辑思维能力、表达能力、抗压能力等关键词出现频率较高,如图5所示。
3.5 应用行业分析
各类行业对于数据分析岗位的需求分布如图6所示。其中,计算机、互联网和软件工程行业对于数据人才需求量最多,市场营销、医学、生物制药、人力资源等行业需求量紧随其后,自动化、财务管理、供应链、电子商务、房地产等行业也需要数据分析人才,半导体、人工智能新兴行业更加需要大数据分析。
综合上述分析,对于数据分析岗位的人才需求,从知识层面看,需要掌握数据库、数据采集、数据挖掘、数据建模以及数据可视化等相关知识;从工具层面看,需要掌握Python和Java编程语言,MySQL数据库,Hive、Hadoop和Spark大数据处理软件、Excel分析软件;从能力要求来看,需要具备很强的学习能力、逻辑思维能力,合作、表达及抗压能力;从应用领域来看,需要将技术和业务结合,应用数据分析辅助解决各领域相关业务问题。
4 数据分析人才培养启示
4.1 构建“供需匹配”的数据分析课程群
高校应以企业岗位需求为导向,设计业务能力与数据能力并重、理论与实践结合的数据分析课程群,完善数据分析课程体系,进而提高人才供给与需求的契合度。根据上述“知识—能力—素质—经验”等人才需求画像,设计覆盖知识、能力要素的数据分析技术链,以技术链为主线设置课程群中的理论课程模块和实践课程模块,破除课程间的壁垒,设置综合实训模块,提升学生运用数据思维解决业务问题的能力。以技术链中的知识点为粒度构建各课程的教学内容,从课程内容的知识关联性出发,合理安排课程学分、学时及学期。
4.2 突出“理论+技术”式教学,注重实践能力培养
基于企业对于相关专业技术和软件工具的要求,高校在培养数据分析人才方面,除了专业理论知识的教学,还应该重视技能工具使用的实践教学,多开设所需各类软件工具的实践应用课程,将理论与技术相结合并应用到实际项目中,解决具体的业务问题,培养学生运用数据软件处理和分析数据的动手能力[3]。
基于企业对于工作经验的偏好,高校应该加强与企业的合作,通过校外实习、校企联合项目等方式,使学生从“学以致用”到“用以促学”,实现良好的循环,获取到宝贵的实践经验,提升实践能力,匹配企业需求。
4.3 强调“知识—能力”转化,提升综合素养
基于企业对素质能力的需求,高校在培养数据分析人才时,除了要求学生掌握牢固的数据分析知识,还要实现“知识—能力”的转化[4],提升学生对知识的灵活运用能力,引导学生建立正确的价值观,培养学生的逻辑思维能力、团队合作能力和自主学习能力等。可以通过指导学生参加数据分析相关比赛,激发学生的创新思维,强化学生的合作意识,提高学生的综合素养,达到知识能力全覆盖的效果,真正实现人才需求和人才供给的契合。
5 结束语
数据智能时代,一系列围绕数据开展的产业链正在形成,高校应紧贴市场走向,挖掘社会需求[5]。本文利用统计分析、文本挖掘等技术对企业数据分析岗位的招聘信息进行多维度的需求特征研究,描绘“知识—能力—素质—经验”人才需求画像,进而为高校数据分析人才培养提供建议,促进学生高质量就业。
主要参考文献
[1]徐晓敏.大数据管理与应用新专业建设探索与实践:以北京信息科技大学为例[J].教育教学论坛,2020(31):229-231.
[2]康鹏,臧洁,曹立华.岗位需求匹配下的本科教学改革与实践:以大数据分析类课程体系构建为例[J].商业经济,2021,(4):194-196.
[3]黄智柯,程贞敏.数据分析人才培养与建议:基于数据挖掘招聘信息[J].软件,2021(4):23-27.
[4]刘紫莹,王秀红,韩光平,等.基于DEMATEL/ ISM 集成模型的大学生知识-能力转化关键影响因素研究[J].科技創新与生产力,2021(3):17-20.
[5]朱思霖,郭丽清.基于前程无忧招聘信息的数据人才需求分析[J].物联网技术,2019(8):112-116.
[收稿日期]2023-04-27
[基金项目]2021—2022年度河北省高等教育教学改革研究与实践课题“面向新经管的数据分析课程群建设研究”(2021GJJG630)。
[作者简介]路健(1986— ),女,河北石家庄人,硕士,副教授,主要研究方向:数据挖掘、智能决策;刘彩娜(1983— ),女,河北邯郸人,硕士,副教授,主要研究方向:数据挖掘、供应链管理(通信作者)。