徐 倩,黄雨薇,符传山,王 含,李顺仕
(1.吉首大学 计算机科学与工程学院;2.吉首大学医学院,湖南 吉首 416000)
随着5G 时代的到来,信息技术、通信技术、大数据技术迅速发展并广泛应用于医疗、金融、教育等不同领域,企业对IT 类人才的需求也随之急剧增长。智联招聘《2021春季中国雇主需求与白领人才供给报告》显示,2021 IT 岗位工资增长显著,但是岗位空缺现象依旧普遍[1]。高校IT类毕业生的数量与质量不能满足日渐增长的企业需求,毕业生能力与企业标准也存在差距,大量中高端岗位空缺,IT类人才供应与市场需求失衡。
从企业招聘数据中挖据人才需求特征,对高校人才培养有较强的指导意义。目前研究方向集中于文本挖掘岗位需求特征,应用的主要算法有术语—频率逆文档算法和AP 聚类算法、主题词提取、文本聚类构建Word2vec 模型和LDA 主题模型。张俊峰等[2]对计算机科学与技术专业各类岗位的技能需求特征进行挖掘;杨静[3]采用描述性统计和TF-DIF 算法对大数据相关岗位要求进行分析。
冰山模型是人力资源管理中最常用的方法之一,研究主要集中在胜任力模型构建上[4]。冰山胜任力模型分为两部分:①漂浮在表层的显性基准素质部分,包含知识和技能;②隐藏在冰山之下的隐性鉴别素质部分,包括价值观、自我认知、品质、态度等,这些隐性素质是区分绩效优秀与平庸的关键因素[5-7]。哈佛大学教授McClelland 认为,胜任力主要包括知识、技能、社会角色、自我概念、特质和动机6 个部分,将胜任力各要素按照观察的难易排列提出了冰山模型。国外职业教育中广泛采用冰山胜任力模型组织教学与培训,逐步形成了能力培养的教学体系(CBE)。宋雪雁等[8]基于胜任力理论分别构建了以冰山模型和洋葱模型为原型的数字时代档案文献编纂人员胜任力模型。邹凯等[9]围绕知识、技能、特质、态度和价值观4 个维度,探索大数据背景下如何构建高校信息管理类人才胜任力冰山素质模型,并提出以多元协同等方式提升人才胜任力。
近年来,高校的一流本科教育成为热议话题。各高校围绕人才能力培养,展开相关研究和教育改革。培养目标、师资结构、教学模式、环境支持度、学生意愿与态度等都是影响人才培养的重要因素[10-12]。知识维度是以师资队伍和教学体系建设为核心,建设一套“多维一体”结构的IT 类专业的综合课程教学体系[11];技能维度是以知识内化能力为核心,借助学科竞赛[13-14]、工作室[15]、项目设计工程教育[16]、教育实践基地[17]等平台和多方参与的协同育人模式[18-19],打造创新教育、协同育人的平台及机制;非智力因素维度是以学术志趣、人际互动、心理素质、自律性、意志力等“内驱动力”[12]为核心,强化创新团队建设和校园活动和环境支撑。成都信息工程学院在教学理念与CDIO工程教育理念进行充分融合的基础上,在依据CDIO 理念、大纲、标准设计知识、能力、素质培养的“三位一体”培养方案过程中建立了自然分层、因材施教的CDIO 个性化人才培养框架[20]。
为提高IT 类人才培养质量并促进其供需平衡,本文基于招聘大数据对企业的真实人才需求进行调研,挖掘企业人才需求特征并据此构建冰山胜任力模型,从而建立IT 类专业人才培养体系。拟解决以下具体问题:一是挖掘IT 类企业的真实人才需求特征;二是构建IT 类专业人才能力培养体系并提出实施路径。
本文对社会及企业的真实人才需求进行调研,利用Python 爬虫从智联招聘采集招聘数据。研究具体包含3 部分:①根据招聘大数据挖掘人才需求特征,利用词频—逆向文件频率算法(TF-IDF)挖掘企业人才需求特征;②构建IT 类专业人才胜任力模型,包括知识、技能、综合素养、意识与态度4 个维度的胜任力模型及指标体系;③依据一流本科视角下IT 类专业人才胜任力培养模式,探讨胜任力培养实施路径与策略。研究整体框架如图1所示。
Fig.1 Overall frame of IT professional talent training from the perspective of first-class undergraduate education图1 一流本科教育视角下IT类专业人才培养整体框架
智联招聘是全国最大的招聘机构之一,拥有2.3 亿职场用户,累计合作企业数达616 万家,数据真实,且体量大,故本文选取智联招聘为主要信息来源。本次数据采集利用爬虫技术获取信息行业中企业所提供IT 相关的7 类岗位招聘资讯,收集了2022 年1 月16 日至2022 年1 月20日全国一线城市IT 类岗位招聘信息,采集的信息包含职位基本信息、企业基本信息、岗位职责和任职要求。首先,针对岗位职责要求,将IT 行业将岗位分为:软件开发、数据分析、信息技术管理、网络与安全、人工智能、云计算、硬件工程师;其次,依据冰山模型,将任职要求分为知识、技能、综合素养、意识与态度4个方面,爬取每个城市的招聘信息。
数据清洗和数据处理借助pandas实现。
(1)数据读取。借助connect 函数与数据库进行连接,从MySQL 中取出数据,与数据库连接成功后,通过调用pandas 读取数据库,数据去重。调用duplicated 方法,删除重复信息。
(2)数据清理。先将IT 类岗位招聘数据存储到DataFrame 里,按照实验设计要求设置特定规则进行数据清理。
(3)数据预处理。调用contains 方法,去除无关数据,删除关键信息中缺失的数据。预处理后的数据如图2所示。
Fig.2 Pre-processed data图2 预处理后的数据
2.3.1 TF-IDF算法
人才需求特征挖掘由分词处理和需求特征挖掘两部分构成。在分词处理中,调用Jieba 库的精确模式,而且添加了自定义词典进行分词,并对数据的特点进行分析,分别添加知识、技能、综合素养和意识与态度4 类词汇,有效提高了文本分词精度,得出了初步分词结果。在需求特征挖掘部分,本文采用TF-IDF 算法挖掘特征。TF-IDF 值计算如下:
其中,nij指词在文本中出现的次数,|D|指语料库中文件总数。根据TF-IDF 算法的关键词提取原理,对采集到的IT 类人才数据中的岗位描述进行分词和词频统计。TF-IDF 算法流程如图3所示。
Fig.3 TF-IDF algorithm design idea图3 TF-IDF算法设计思路
2.3.2 人才需求特征
对招聘数据进行中文分词并基于TF-IDF 算法筛选关键词,得到岗位要求关键词的词云图如图4 所示,关键词的词频统计结果如表1所示。
Table 1 Word frequency statistics of word segmentation results表1 分词结果词频统计
Fig.4 Job requirement keyword cloud map图4 岗位要求关键词词云图
词云图显示,工作经验、数据分析、团队、本科及以上、电子信息、沟通能力等关键词的权重较大,与表格中的相应高频词一致。由此可见,这些词是企业岗位需求的重要特征。
本文利用Python 爬虫从智联招聘采集了13 638 条招聘数据,运用中文分词技术和TF-IDF 算法挖掘人才需求特征。IT 类具体体现在知识、技能、综合素养和意识与态度4个维度上。
(1)知识偏好。对于IT 类岗位,企业要求专业对口性较强,对专业知识要求高,如通信、电子信息、计算机、大数据专业等词出现频率较高;程序语言、数学计算、算法设计、数据分析、数据库、SQL 等这些领域专业知识术语的词频较高。
(2)技能偏好。由于IT 类岗位技术门槛较高,企业招聘对专业技能要求较高,要求有项目或行业经验,对编程能力、分析能力、算法设计能力、工程设计能力及自学能力等要求较高。
(3)综合素养偏好。对于IT 类相关岗位而言,团队合作完成项目很常见,IT 类相关行业看重招聘者团队合作和沟通表达等综合素养。团队合作能够更好地完成工作,帮助企业实现效率提升;沟通表达素养有助于提升工作效率。
(4)意识与态度偏好。由于信息技术迭代较快,IT 类相关行业多数工作量和压力较大。想要开发好产品,必须要求应聘人员有良好的服务意识;同样,产品开发工作量大,必然要求应聘人员富有耐心和责任心。为更好地完成工作,企业也更加偏爱拥自主学习意识和管理思维的人才。
由于分词处理的指标数量较多、维度较广,需作进一步分类。而胜任力冰山模型赋予了整个模型清晰的结构轮廓,呈现出“一显一隐两素质四维度”的结构特征[21],能够很好地对指标进行分类,因此本文选择用冰山模型进行处理。从相关文献中,总结归纳出IT 类人才胜任力指标。指标提取具体步骤如下:在中国知网、万方等学术平台上,通过混合模糊检索“IT 类人才”“冰山”“企业”和“胜任力”等关键词,首先得到关联性较强的参考文献11 篇;考虑到IT 类学科的自身属性,文献内容与主题的相关性、可参考性、适用性等因素,本研究删除不相关文献后共保留有效文献4 篇,并结合素质冰山模型中各胜任力维度的相应内涵从中选取部分指标。经过分析处理,将整个IT 类人才冰山胜任力模型划分为知识、技能、综合素养、意识与态度4个维度,并与企业招聘数据挖掘出的高频词频进行相似度匹配,对冰山模型的指标体系作进一步优化,构建符合企业真实人才需求的人才胜任力培养模型。
本文综合TF-IDF 算法对企业人才需求的词频统计提取关键词,统计了企业招聘广告中人才胜任力的主要要素,如图5所示。
Fig.5 Frequency of competency factors in enterprise recruitment advertisements图5 企业招聘广告中人才胜任力要素频度
经过系统分析,本文从素质冰山模型的知识、技能、综合素养、意识与态度4 个维度进行分析,最终选取IT 类人才胜任力指标,构建人才胜任力模型。人才胜任力指标如表2所示。
Table 2 Competency index of information talents表2 IT类人才胜任力指标
结合实验数据分析和指标选取,将IT 类人才冰山胜任力模型中的知识和技能作为显性维度,将综合素养和意识与态度作为隐形维度,得到IT类人才冰山胜任力模型。
本文根据招聘大数据挖掘企业真实的人才需求特征,据此构建和优化人才胜任力模型,并探索一流本科教育背景下人才培养模式的实施对策与路径。面对企业真实需求特征、胜任力模型构建、人才胜任力培养实施这3 个主要问题,本文通过挖掘企业招聘大数据,借鉴冰山胜任力理论模型,建立人才培养体系以解决问题,如图6所示。
Fig.6 Technical route of problem solving图6 问题解决技术路线
结合企业招聘数据分析结果和人才胜任力模型,在一流本科教育政策背景下,从培养目标、师资结构、教学模式、环境支持度、学生意愿与态度等角度探索高校IT 类人才培养改革与创新,从知识、技能、综合素养、意识与态度4个方面提出人才培养的实施对策与建议。
(1)建设“多维一体”课程教学体系。知识维度是以显性知识为基础、隐性知识内化为重点,建设“多维一体”教学体系。高校师资力量和教学内容为人才知识培养提供智力保障。知识维度的胜任力以专业宽口径知识、应用知识、专业技能知识等显性知识为基础,以师资队伍建设和教学体系建设为重要抓手,建设一套“多维一体”结构的IT类专业的综合教学体系。
(2)打造实践教学、协同育人的平台与机制。技能维度着重培养学生的实践及专业技能,创新实践教学模式,构建校企产学协同育人机制,建立实践基地,为隐性知识内化为技能提供支撑平台。技能培养是借助学科竞赛、工作室、项目设计、工程教育、实践基地等平台,建立健全的学生课外实践教学奖励机制,鼓励学生参加数学建模竞赛、编程比赛、计算机设计竞赛、机器人竞赛等学科竞赛,构建多方参与的协同育人长效机制,为技能培养打造平台和机制。
(3)强化创新团队和实践基地建设。综合素养维度是以提高综合素养为核心,强化创新能力和团队建设。定期举办学术项目和各种交流会,增加学生交流的机会,促使他们锻炼社交沟通能力,拓宽学术视野;加强创业导师团队和实践基地建设,鼓励学生参与创业项目,积累实践经验,提高其问题解决能力、创新能力、管理能力。
(4)开展校园活动,保障环境支撑。意识与态度维度是以“内驱动力”培养为核心,开展校园创新活动,加强校园文化建设。学生意愿、心理素质、自律性、意志力、态度与价值观等非智力因素是能力培养的内驱动因素,对综合素养的形成影响较大。以校园文化建设为核心,提高学生的学习“内驱动力”;以定期开展心理咨询活动和有力的环境保障为支撑,加强对学生的挫折教育和心理教育,提高其抗压能力;以丰富的校园活动为主导,增强学生责任感和自主意识。
本文通过分析企业招聘大数据并构建人才胜任力模型,在一流本科教育政策背景下,从培养目标、教学模式等多个角度探索高校IT 类人才培养改革与创新,从知识、技能、综合素养、意识与态度4 个方面提出人才培养的实施对策与建议。通过完善教学体系,提高师资力量,并拓宽知识维度,建立一套“多维一体”结构的IT 类专业综合教学体系以提升学生对知识获取的广度与深度,而课外的科研活动和学科竞赛能够有效提高学生的综合素质和专业技能,举办多种校园创新活动有助于强化学生的主观能动性,更好地培养学生的责任意识。