张 蕾,贺 琳,刘洪超,杨 艳,滕鑫鑫
(1陕西师范大学 a.学生就业指导服务中心b.校友总会办公室c.新闻与传播学院,陕西 西安 710119;2.深圳市翠园教育集团 翠园实验学校,广东 深圳 518000;3.成都市郫都区郫筒二小,四川 成都 611730)
人工智能与大数据的广泛应用已成为提升高校毕业生就业工作质量的关键措施之一,催生了新的就业模式和职业教育生态,为个性化就业服务提供了精准支持[1]。当前,经济形势与人才需求都面临着前所未有的挑战,人才的竞争与高校人才培养之间的结构性矛盾亟待解决。国内外经济市场和国际形势的复杂性,导致劳动力市场压力重重,举步维艰。高质量就业的前提是大学生需具备专业知识以及职业综合素养[2]。现阶段,大学生获取就业信息渠道多、杂、乱,对招聘信息解读不充分;同时,用人单位也无法充分了解大学生的综合素质、求职意向、职业发展等信息,导致双方无法实现良好的匹配[3]。大数据与人工智能的介入以较低的物质成本、时间成本最大限度地提升大学生的求职成功率和满意度,为大学生的高质量就业提供了可能。从大学生就业需求的角度出发,通过汇集大学生在校学习的电子印记和职业能力测量数据,分析和描绘大学生的综合能力并形成就业画像和预警机制,为其精准推荐职业成长课程资源和就业岗位资源,以提高大学生的就业精准度和成功率。然而,如何利用大数据技术构建大学生的就业画像模型,并依据所构建的就业画像模型实现学生岗位资源的精准推荐以及学生职业成长资源的个性化推荐,是值得深入探讨的问题。
画像技术是依据目标用户的属性数据,构建用户虚拟模型的一种技术手段[4],画像存储了用户的基本情况(如年龄、性别或位置)、知识水平、背景和技能、兴趣偏好等信息。Cao通过网络分析法及模糊数确立画像的指标体系,并结合学生在校数据弥合用户标签,构建学生个体画像,帮助教师和管理人员准确、直观地了解、评价学生,有效解决了以往学业评价只关注考试成绩、评价结果片面、不能反映学生真实能力或潜力等问题[5]。周文静根据校园网络数据,提出加权概念、构建学生兴趣画像,即基于字符串匹配的层次概念进行筛选,根据文本概念和文本关键字计算兴趣权重,结合用户基本属性维度画像构建了最终的用户画像[6]。就业画像的概念衍生于用户画像,被指用来刻画学生特征,是联系学生需求、描述学生职业倾向的重要方法,目的是尽可能多地抽取学生的信息全貌,为个性化推荐服务提供数据支撑[7]31-33。Schellings等人聚焦于45名初任教师,构建了包含班级管理、学生学习、工作量、团队合作和职业认同5个身份主题的教师画像,并认为画像构建是理解初任教师职业认同发展中真正重要的内容并帮助教师深化反思的一种有效方法[8]。总体而言,大部分用户画像的研究集中在画像构建方法以及推送模式等方面,关于大学生就业画像的研究相对较少。
通过对个性化资源推荐以及资源平台建设的相关研究梳理可以发现,目前研究主要集中在个性化资源推荐的机制,即动态数据与静态数据的处理以及动静相结合的方式完成个性化资源的推送。Seng等人通过分析学习用户的特征,得出用户条目的评级矩阵,基于LDA(Latent Dirichlet Allocation)主题模型,设计了教育资源的个性化推荐算法,并根据用户的行为和兴趣,推荐用户可能感兴趣的学习资源;同时提升用户的检索效率,让用户更方便地找到相关资源[9]。Seo和Kim建立基于相似学习者的信息推送模型,即通过数据分析将学习中利益相关的学习者进行相互推送[10]。Liu提出了一种改进的基于聚类的协同过滤推荐算法[11],该算法引入时间衰减函数对用户的评价进行预处理,利用项目属性向量对项目进行描述,利用用户兴趣向量对用户进行描述,利用聚类算法对用户和项目进行统计分析。综合以上研究发现,目前研究主要针对学习者资源推送的算法优化,虽然理论研究得到蓬勃的发展,但缺乏结合大学生就业画像技术,对职业成长资源及就业岗位资源进行个性化推荐的相关研究。
大学生就业画像是对大学生职业特征的直观表达,能够切实描述学生的职业能力的相应状况,就业画像的质量取决于特征数据的准确性和完整性。就业画像技术建立于教育大数据的基础上,由于数据信息多维且交叉融合,为实现资源利用效率,需要克服数据过于冗杂的问题,利用聚类耦合分析、深度挖掘等相关技术完成对学生数据信息的分析与处理[12]。在数据融合方面,就业画像技术需要在多层次获取大学生动态化特征信息的基础上,采用多维度融合技术对学生各方面的信息进行统一性量化,结合客观的数据进行分析甄别,确保各类数据的相互补充,实现多源异构数据的融合,从而保证对大学生在校信息的全面性、整体性进行把握。现阶段高校就业大数据服务平台记录着学生在校期间所有课业成绩、各类活动参与情况、职业能力测评数据以及职业指导类在线课程学习情况。其中,学习者能力包括专业能力和职业能力,通过学业成绩和专项能力测评综合体现。在框架设计方面,学生就业画像的内容包括学生基本信息、网络行为信息、实践活动信息(社会活动、科研活动)、职业数据信息(职业兴趣、职业能力、职业实习)等;在技术实现方面,一般采用自然语言处理(NLP)算法对学生的各类特征进行综合处理,形成全周期型、全过程型的学生就业画像数据。
通常,大学生就业画像数据兼具静态性和动态性。静态性指可直接获取的学生画像属性特征的数据,并在一定的时间段数据保持不变;动态性指学生就业画像随着学生参与的活动、素质的提升以及职业行为的变化而进行相应的变化。在数据处理方面,需要根据静态数据建立初步就业画像,然后通过动态数据的输入不断地对就业画像进行修正。首先,在学生入校时,采集学生的基本信息、相关测评结果,完成对学生画像的初步构建。随后,在学生在校就读期间,不断收集学生的学习及活动的多维度数据,反映学生在学习过程中的具体情况,进一步丰富、完善学生画像的内容。在毕业阶段,根据学生的求职需求、社会需求、个人成长需求进一步完善和分析学生画像的特征数据。在工作阶段,还可以持续采集毕业生的专业发展和个人成长历程等方面的数据,用以建立完善的学生群体就业画像的标准特征,同时依据该标准给予在校大学生职业成长类和就业岗位资源的个性化推荐。
大学生就业画像的基础是学生数据模型,学生数据模型的建立主要包含数据的采集、分析、结果呈现和应用(评估、预测、干预)等重要环节[13]。数据处理是学生数据模型构建的核心,需要综合考虑学生在移动终端、个性化学习环境、学习管理系统等网络环境中进行学习和生活时产生的各类数据及其冗余、异构、缺失等问题,一般需要根据不同的需求进行筛选,最后对有用的信息进行分析与呈现。在这一过程中,需要尽可能多地通过对数据的处理和分析,对学习者的课程学习、社会活动、科研活动、学习和成长情况等进行有效记录。其中,学习行为特征信息的提取一般通过行为标签实现,而标签的建立主要通过三种方法:基于元分析的方法、基于统计的方法以及基于相关性分析的方法。
高校就业大数据服务平台是在大量学生数据的基础上,通过统计分析和数据挖掘技术对集成的各类数据进行分析和预测,从而实现职业成长资源和就业岗位资源推荐。在具体数据挖掘方面,需要把初步整理的数据通过统计推理等方法进行分析,获悉学生的就业岗位和职业发展需求,分析各岗位的职业竞争力和能力要求,同时比较同一专业往届生的求职意向、职业成长道路,对比同一专业个体就业画像与群体标准画像的差异,使用可视化技术把画像结果以图表等形式呈现给个人和管理者。学生就业画像数据主要通过图形化面板呈现学生的综合能力特征,包括学生的专业能力、学习能力、沟通能力、信息素质、人格魅力等方面。学生就业画像面板数据包括学生的基本信息、在校期间的各项行为信息以及参加的实践活动、职业数据信息以及学习水平,并通过对学生的整体刻画实现相应能力的赋值。
实现大学生职业成长资源个性化推荐服务的途径,主要是在学生就业画像模型完善过程中收集学生使用网络交互系统产生的具体行为数据,对比相似学生属性特征,推荐可能需要的职业教育类资源,运用Apriori关联算法,找出频繁项集及关联规则。其中,学校就业平台涵盖了职业教育类资源及在校学生、已就业学生的数据信息,对这些信息进行深度挖掘与分析,能够有效对比学生的职业需求及职业资源需求,进而实现职业成长资源的标签化和单元化处理。同时,系统对比学生特征数据,提取学生就业画像数据,建立学生标签,借此标记学生具体的个体属性。继而,对学生及学生群体感兴趣的职业成长资源进行深度挖掘,把学生与职业成长资源数据集合进行匹配,建立学习者标签系统与教育资源的关联规则,通过不断优化现有学习资源,结合关联规则的协同过滤算法,提升课程资源的推荐精度,帮助学生更好地获取职业成长资源,进而提高学生的学习效率(如图1所示)。目前,在高校就业大数据服务平台嵌入学生校园统一身份认证登录模块,大学生就可以进一步完善自身各类信息、主动进行职业测评,可自己查看自身的发展水平,并对比分析平台集成的职业需要水平,根据系统推荐的个性化课程资源,实现自身职业能力的提升。此外大学生可以根据职业成长资源的个性化推荐结果,主动预约职业发展指导老师实现“一对一”的就业指导。
大学生职业成长资源个性化推荐的整体技术设计依赖于大学生就业画像中的学生就业需求、就业能力等特征信息。由于学生就业画像是学生职业成长资源精准推荐的主要依据,因此在就业画像的建模过程中需要充分获取学生学习、活动的动态信息,分析、识别学生就业的兴趣点,结合其现有的就业能力,科学地为学生做好就业规划以及推荐可能需要的职业成长资源。目前,系统实现学生职业成长资源个性化推荐路径的技术路线主要有:(1)基于资源本身的课程推荐。课程具备完整的体系,包括职业发展课程、面试课程、基本技能课程等,能够为不同学习者推荐不同层次的课程。课程标签的划分尽可能具体化、丰富化,针对不同课程设计不同的进阶体系,进而为不同程度的需求者推荐相匹配的课程。(2)基于学习者相似度的资源推荐。这种资源推荐是建立在已有的学生职业画像的基础上,系统自动匹配已有高年级和毕业生信息,如就读专业信息、就业岗位信息、职业成长等,通过不同层次的匹配,筛选出与新学习者相似度较高的已有学生,并将已有学生的实际需求资源进行推荐,帮助新学生选择课程资源,提高职业成长的精准度。(3)基于学生职业需求的资源推荐。学生就业画像的建模过程是通过挖掘学生职业类在线学习行为信息,包括观看求职类视频、参与创业类课堂互动、参与平台社区研讨以及获得课业成绩等过程性和结果性数据,初步预估学生对相关职业的知识和技能的掌握情况,通过预测模型判断所需要进一步学习的成长类课程资源。在这一过程中,首先,依据学生已掌握的知识,以及知识之间的关系,生成学生就业能力的先验知识集。其次,根据学生职业学习行为中所预测的职业需求,确立学生的就业能力目标知识集,以学生就业先验能力为最小补偿集的下限,以学生目标单元的需求能力为最小补偿集的上限,生成最小补偿集。再次,对职业类课程资源进行编码处理,生成最小的结构单元,建构学生就业类知识地图。最后,应用马尔科夫链模型(Markov chain Model),预测学生的学习路径,进而实现职业类课程资源的个性化推荐[14]。
图1 学生特征数据与标签数据的关联
大学生就业岗位资源个性化推荐的实现依赖于岗位资源系统的丰富性以及大学生就业画像模型的准确性。前期,高校就业大数据服务平台的建设从学生和用人单位二者的角度出发,分别建立大学生就业画像和用人单位岗位资源信息库,用人单位可发布人才需求信息,学生可根据自身的职业需求进行预设;平台将用人单位的详细信息,如企业规模、地域、岗位需求、职业发展、薪资待遇等进行标签化处理,借助机器学习、双向聚类分析等技术,充分考虑岗位—人才的双方需求因素,进行双向匹配,实现就业双向推荐。学生登录平台可以查看自己被推荐的岗位,并决定是否建立双方的联系,实现与企业的沟通。在企业和学生的双向选择阶段,平台可以通过监督学生与企业的沟通过程,保障双方权益,同时收集学生的岗位需求与企业的招聘需求数据,可进一步作为学生职业需求能力提升的依据,同时也作为对企业进行评价和衡量的依据。后期,可通过分析该企业招聘进度、录用学生的数量和画像等信息,评估企业的信用、实力,进而优化企业数据资源,为下一届学生的岗位资源推送工作做准备。
高校就业大数据服务平台集合大量学生的各类数据,从多个维度刻画每个学生的就业画像,并通过学生的主观职业需求及平台记录和分析的各项能力数据,对学生的职业需求和岗位能力进行量化描述,进而与大量用人单位的岗位和能力需求进行匹配,优先实现对学生就业岗位资源的个性化推荐。在实现岗位资源推荐服务的整个过程中,需要对学生感兴趣的岗位信息采取NLP处理技术进行深度挖掘[15],即首先组合相关文本(岗位文本、职业文本),通过n-Gram+CRF+HMM模型对文本进行分词,推算出相应概率,P(S)=Pw1)P(w2|w1)P(w3|w2)···P(wn|wn-1),通过TF-IDF算法提取关键词topN,通过word2vec编码技术对每个词进行编码,并以TF-IDF、成绩、学分加权回归,最终获得岗位向量表达、学生专业向量表达;其次通过对向量进行余弦相似度计算,计算专业—岗位匹配度;根据匹配度进行排序显示,从而实现对岗位资源的个性化推荐(如图2所示)。
在校学生的就业画像越具体,系统所提供的就业信息越准确,同时,可以根据学生动态数据的输入,进一步拟合学生的就业画像,以实现学生就业信息的有效推荐。依据就业画像,系统匹配职业与学生的需求信息,计算岗位与学生能力的匹配值,进而实现岗位信息的推送。其中,高校就业平台推荐系统包含人才及职位的双向匹配,并以系统推荐为主,学校推荐为辅。系统推荐是指通过计算岗位与人才的匹配值,给出学生与岗位的综合匹配度;学校推荐是指在系统推荐的基础上,通过管理人员进行有目的的干预,可以依据岗位需求,定向地推送学生信息。岗位系统推荐的部分数据呈现见表1。
图2 就业岗位资源个性化推荐路径
五 小结
高校就业大数据服务平台的建设以学生成长服务系统为核心,其中,资源管理系统提供强有力的资源支撑,就业大数据分析与控制系统进行宏观的控制以及必要的干预[16]。总体来看,高校就业大数据服务平台从学生的职业成长角度出发,通过学生静态数据的输入、职业发展测试、性格测试等,生成学生就业画像雏形;在校学习期间,大学生的各种动态课程学习和实践活动数据持续输入就业服务平台,进一步丰富大学生的就业画像;在求职阶段,依据就业画像为学生推荐特定的职业成长资源和提升课程,创设个性化的学习路径,最大限度地帮助学生提升自己就业能力以匹配期望职业,最终实现学生职业能力的持续性发展。从学生职业能力成长的角度出发,结合学生的个人专业发展和职业成长需求,设计开发相应的课程资源,运用多种算法,实现职业成长资源的个性化推荐。在智慧就业方面,平台建立人才信息库、岗位资源库,实现人才、岗位的精准推荐,提供较为匹配的职业岗位,学生可线上预 约面试、签署就业协议,并结合学生职业发展的跟踪数据,实现更为精准的就业岗位个性化推荐。
目前,已建成的高校就业大数据服务平台的岗位信息主要由中小学校和企事业单位组成,尚且不能覆盖所有学生的岗位需求,后期为健全岗位数据的权威性、丰富岗位数据的多样性,还需要不断丰富就业大数据平台的岗位资源,拓宽与各高校的就业数据互通,与全国性就业网站互联,完善更新职位模型库。同时,不断优化和完善机器学习模型的算法,提高职业成长动态测评和职业胜任力模型匹配的精准性,在使用过程中迭代升级,最终实现“互联网+教育”的智慧就业新业态。