用户画像在精准就业推荐服务的应用研究

2022-07-23 06:35云南中医药大学信息学院董如福
电子世界 2022年1期
关键词:画像中医药大学毕业生

云南中医药大学信息学院 董如福

云南师范大学教育学部 云南中医药大学信息学院 杨福华

云南中医药大学信息学院 刘红杏

高校毕业生就业工作事关社会和谐稳定,面对面对网络平台上海量的就职信息,学生如何找到适合自己的岗位,企业如何让自己的招聘信息脱颖而出是较为困难的问题,就业市场供需矛盾仍然突出。通过构建基于用户画像的精准就业模型,绘制毕业生用户画像,为毕业生精准推送与自身相符的岗位,实现“人职匹配”,真正实现毕业生就业精化、高质量就业。

2021年,根据教育部发布的数据显示,我国大学毕业生数将达到909万人,再创历史新高,就业形势复杂严峻。为了缓解这种压力,国家行政部门发布了《国务院关于进一步做好新形势下就业创业工作的意见》、《教育部办公厅关于开展全国普通高校毕业生精准就业服务工作的通知》等文件,要求各地各高校要充分利用短信、APP、微信等渠道,建立精准就业服务平台。根据毕业生不同阶段需求和求职意愿,精准推送相应的就业政策、岗位信息、指导服务,实现就业服务个性化、差异化。其次,网络技术的高速发展也为就业服务的精准化提供了技术保障,毕业生在在校期间产生了海量的数据,包括基础数据:毕业生成绩数据、毕业生基本信息数据等、学校管理数据等。通过对这些数据进行分析、挖掘,构建毕业生用户画像。为毕业生精准推送与自身相符的岗位,实现“人职匹配”,为毕业生提供精准化就业服务。

1 用户画像概述

用户画像是由交互设计之父Alan Cooper提出,是指用户信息的标签化,是建立在一系列数据之上的目标用户模型。用户画像根据用户的社会属性、生活习惯和消费行为等信息,抽取处一个或一类用户的标签,对用户信息进行结构化处理。通过对用户信息的分析和挖掘,实现对用户群体特征的准确描述,从而能精准预测用户的实际需求。

用户画像在电子商务、图书情报、社交媒体和医疗健康等领域都有广泛的应用。用户画像通过定性和定量的方法,对用户的各个属性进行分析、概括,全面精确的获取用户的需求,为用户提供个性化、精准的服务或商品打下基础。

目前,将用户画像运用于就业推荐方面取得了丰硕的成果。刘艳提出通过利用大数据能够有效促进校园管理和建设的开展,能够对校园就业情况进行用户画像建设。张东迅通过构建雇主画像的总体框架,进行了雇主画像维度和标签体系的设计,并探索且提出了雇主画像的构建方法和流程。通过已有研究发现,目前基于用户画像的就业推荐研究还不够深入,对毕业生就业情况的用户画像建设仅停留在实践探索层面,研究还不够深入。其次,我国大学生就业质量偏低的情况还没有改变,具体体现在就业稳定性低,岗位匹配度低,就业期望与岗位实际差距大。构建基本的信息化管理平台,建立用户画像,通过有效地抓取和合理地利用毕业生、高校的数据,并对其进行数据分析和挖掘,来提高高校就业服务质量和精准就业服务的水平具有重要的意义。

2 基于用户画像精准就业推荐服务模型建构

2.1 毕业生数据的采集

数据的采集是建立用户画像的基础,T.Laouge、J.LARDY和N.B.ABDALLAH认为用户画像中的用户特征信息主要包含两个方面:一是稳定因素,如用户的人口统计学数据;二是可变因素。另外,代懋等指出大学生就业匹配主要受供给、需求和中介因素的影响。其中,供给因素主要考察大学生人口统计特征和在校实践等对职位匹配的影响,包括性别、受教育程度、户籍、专业类别、学习成绩、在校是否担任学生干部、参加社会实践的情况。其中,需求、中介因素以及供给因素中的受教育程度、专业类别对于同一个学校的毕业生而言是不变因素,在此就不再讨论。按照用户画像中用户特征信息,认为毕业生的用户画像的稳定因素主要是指毕业生人口统计学数据,包括性别、生源地、学习成绩、是否担任学生干部、参加实习情况等。此类信息数据主要是通过采集学校的相关应用系统产生。而可变因素包括毕业生在校期间借阅图书的情况、使用学校就业信息系统产生的数据信息等,则从图书管理系统和学校就业信息系统获取。经过采集和筛选以后,共得到了150名医学信息学毕业生的信息,共计8000条数据。采集的数据维度如表1所示。

表1 采集的数据维度

本次研究的数据主要来源于某中医药大学医学信息工程专业的历届毕业生,通过对采集到的数据,进行有效组织存储,整合成数据集。Guimaraes TP将用户画像的数据来源总结为用户的基本素养、学历层次、社会关系、工作状态、位置情况、时间信息等。按照云南中医药大学医学信息工程人才培养方案,该专业的毕业生就业方向主要分为电子信息类、网络技术类、软件设计开发类、医学信息系统分析和设计类。所以,本文就以此为依据对毕业生进行分类,将用户画像数据进行聚类、分析。

(1)基本信息

基本信息维度主要是对毕业生的画像进行基本绘制,主要包含性别和生源地两个信息。由于基本信息不同,对应的就业需求也不同。在进行毕业生用户画像标签构建过程中,要对用户基本信息数据作标签化处理,为每个用户赋予不同形式与内容的标签。

(2)就业能力

就业能力维度作为毕业生就业画像的核心内容,主要包括主要课程的成绩、实习单位、实习时间和实习成绩。云南中医药大学医学信息工程专业毕业生就业方向和对应课程设置如表2所示。

表2 云南中医药大学医学信息工程专业毕业生就业方向和对应课程设置

通过教务管理系统获取学生的专业课成绩,并以此为依据,对学生的成绩进行预处理,利用数据挖掘的相关方法,对毕业生相关数据进行分析。

(3)就业倾向

就业倾向维度主要是作为毕业生生画像的辅助内容,主要包含了生源地、喜好、发展前景等。比如通过生源地可以给毕业生推荐生源地所在就业单位;通过专业相关、个人喜好、发展前景等属性内容推荐高度匹配就业岗位。

2.2 数据预处理

数据预处理是将数据进行清洗、集成、标准化和转换,并直接用于数据分析、建立模型的技术实现过程。根据采集到的数据,将各个字段进行量化,得到的数据特征如表3所示。

表3 根据采集数据各个字段量化的数据特征

2.3 毕业生用户画像

通过数据分析过程,梳理得出单个学生的特征标签,实现个体的用户画像的构建:

XX,男,云南XX人,电子信息类成绩较好,在XX公司实习从事软件开发工作,实习成绩较好,喜欢借阅关于软件开发类的书籍。

XXX,女,山东XX人,网络信息系统和设计类课程成绩较好,在医院信息科实习,实习成绩较好,喜欢借阅UI设计的书籍。

XXX,男,云南XX,网络技术类课程成绩较好,在某网络集成代理商实习,实习成绩较好,无书籍借阅情况。

本文采用k-means算法进行聚类,通过Elbow Method方法得出当k=4时,聚类效果最佳。由此可得到4类毕业生类别:毕业生群体1为就业能力强,目标明确。该类学生在平时成绩好,通过就业兴趣维度发现其有明确的就业方向;毕业生群体2为就业能力弱,目标明确。该类学生在平时成绩一般,但有明确的就业方向;毕业生群体3为就业能力强,但无明确的就业方向;毕业生群体4为就业能力弱,无明确的就业方向。

3 毕业生就业画像在医学信息工程专业就业实践中的应用

根据毕业生用户画像进行岗位匹配,本文采用贝叶斯算法对某中医药院校医学专业毕业生的就业方向进行预测,为毕业生实现更加充分、更高质量的精准就业提供强有力保障。贝叶斯定理是一种把类的先验知识和从数据中收集新证据相结合的统计原理。

贝叶斯定理的作用是在已知P(A|B)的情况下求得P(B|A)。其中,P(A|B)表示事件B已经发生的前提下事件A发生的概率,P(A)和P(B)为无条件概率。精准就业推荐算法如下:

算法输入:已知2018届至2020届某中医药大学医学信息学专业毕业生的画像信息和就业方向。

算法输出:确定2021届某中医药大学医学信息学专业毕业生就业方向,作为就业推荐方向。

(1)将毕业生的各项属性进行预处理。例如,将课程成绩为80分以上赋值为3,课程成绩70-79赋值为2,课程成绩60-69赋值为1,60分以下赋值为0;

(2)设毕业生用户画像集合为S={a1,a2,a3…am},a1-am表示用户画像的特征属性,即为表中的各属性值;

(3)设医学信息工程专业的就业方向为集合C={y1,y2,y3…yn};

(4)计算P(y1|S),P(y2|S),P(y3|S)…P(yn|S):1)将2018届至2020届某中医药大学医学信息学专业毕业生作为训练样本集;2)得到各就业方向下毕业生用户画像特征属性的条件概率;3)若各个特征属性是条件独立的,则根据贝叶斯定理有如下推导。因为分母对于所有的就业方向为常量,因此取得分子的最大值即可。

(5)取得为最大值,则C。

4 基于用户画像的就业服务平台架构

基于用户画像的就业服务平台主要包括以下几个模块,如图1所示。

图1 用户画像的就业服务平台架构

4.1 数据采集模块

从基本信息、就业能力、就业倾向等维度对毕业生的数据进行采集和分析,平台收集的信息主要来源于平台注册获取相关信息、全国就业信息网和高校应用系统相关信息,通过开发的就业服务平台中的模块实现对相关信息进行采集。之后对就业信息进行清洗和格式整理,并存储在对应的数据库中。

4.2 用户画像建模模块

利用已建立的就业服务信息系统,利用获取到的数据组成的多源数据,进行有效量化,整合成数据集,然后进行深度分析,构建毕业生用户画像,为毕业生提供精准化就业服务。

4.3 就业推荐模块

基于用户特征,对需要推荐的毕业生和已有的毕业生用户画像库进行相似度匹配,为毕业生精准推送相关岗位,实现“人职匹配”。

4.4 反馈更新模块

毕业生可以对推荐结果进行反馈。通过就业服务系统实现对毕业生就业满意度、就业推荐匹配度等多方面的就业质量综合情况进行收集,根据职业的需求与发展需要,得出相应的结果。并以此为依据对用户画像进行更新,为高校的人才培养、就业服务等提供改革依据。

利用大数据技术,构建基本的信息化管理平台,建立用户画像,通过有效地抓取和合理地利用毕业生、高校的数据,并对其进行数据分析和挖掘来提高高校就业服务的效率和精准就业服务的水平具有重要的意义。对毕业生用户就业用户画像进行研究是实现精准化就业的重要途径之一,可以更好地促进实现高等教育培养高素质人才的最终目的,减少教育资源浪费,为国家发展提供更专业的各方面人才,对学校而言可以对实现对人才培养方案的不断优化,对于大学生个人而言也更能更好地促进自我价值的最终实现。

猜你喜欢
画像中医药大学毕业生
山东中医药大学科研创新团队介绍
陕西中医药大学附属医院肾病二科简介
陕西中医药大学附属医院肾病二科简介
威猛的画像
“00后”画像
伤心的毕业生
画像
你根本不知道,这届毕业生有多难
一个没什么才能的北大毕业生
ESL Learners’ Semantic Awareness of English Words,Semantic Transfer and Its Implications for Vocabulary Teaching in a Second Language