晁嘉佑 范哲苑
摘 要:掌握互联网招聘市场的规律对于利用好互联网招聘平台有着重要的意义。本文采用词云、文本挖掘、相关分析等方法对互联网招聘信息大数据进行研究,发现:招聘信息中的“福利待遇”在不同的地域中存在较大差异,一线城市最注重基本福利;二线城市注重发展福利;三线城市最重视生活福利等规律。了解这些规律有利于招聘企业更好地发布招聘信息,吸引优秀人才。
关键词:互联网招聘 词云 数据可视化 数据挖掘
中图分类号:F724.6 文献标识码:A 文章编号:2096-0298(2018)11(a)-017-03
随着全球化和知识经济时代的来临,现代企业之间最大的竞争已经由产品之间的竞争转变为人才之间的竞争。如何科学合理地选拔所需的人才是企业人才队伍建设的第一步,同时也是最重要的一步。
与传统的招聘方式相比,互联网招聘都具有显著的优势。对企业来讲,互联网招聘既能减少企业在时间成本上的投入,也能为企业減少人力物力成本,节省招聘费用,对企业降低招聘成本有着重要意义 [1]。
对应聘者而言,互联网招聘克服了传统招聘方式时间和空间上的限制,应聘者足不出户就能了解企业人才选拔要求以及企业的薪资待遇,福利水平,减少了应聘的盲目性。
然而,企业在实行互联网招聘过程中也面临诸多挑战,由于无法同应聘者进行面对面的交流,企业与应聘者之间缺乏足够的互动,企业难以了解应聘者的需求,往往无法提供给应聘者所关注的信息。因此招聘信息应该包含哪些必要的内容,如何发布有效的招聘信息对企业完成一次成功的互联网招聘至关重要。
“福利待遇”是招聘企业给予员工的间接报酬,是求职者最关注的指标之一。通过对“福利待遇”字段的研究,可以更好地了解招聘企业吸引和激励人才的手段和方法,反映不同地域求职者关注点的差异与特色。然而, 由于“福利待遇”信息一般以文本的形式呈现,这就给研究者带来了困难和挑战。因此,分析好“福利待遇”数据,关键在于对文本数据进行有效的统计和分类。词云分析可以在分析文本数据后快速、形象而有效地呈现统计结果,本文在此基础上,将企业招聘信息中的内容按“基本福利”“发展福利”“生活福利”“薪酬补充”“健康关怀”这5个维度进行分析和比较。
1 数据来源与研究方法
本文使用的数据来自发布在北京大学开放研究数据平台的“互联网招聘网站数据”。该数据采集的是2014年4月—2017年10月由58同城、智联网站发布的企业招聘数据[2]。
1.1 数据处理系统
找到两个在招聘信息结构上类似的A、B网站,分别爬取信息。将B网站的数据作为目标分析数据,将A网站的数据作为参照数据。
1.2 数据预处理模块
使用Python对爬取到的JSON文件进行解析和数据提取分析。
在城市分类的提取中,注意到有些公司的登记地址以“xx区”作为开头,即地址中本身不包含“市”一级的信息。针对这个问题,使用已有的库函数chinese_province_city_area_mapper中的transform方法,将地址转换为一个DataFrame。
例如,针对“历下区和平路xx号xx”可以直接输入后得到输出“山东省 济南市历下区”,读取到地址映射到的城市信息——济南市,提高了分析结果的可信度,如图1所示。
1.3 词频统计模块1(简称“词频1”)
网站A的数据经过前面的数据预处理得到“五险一金包住带薪年假”(节选),如何有效地进行分词和词频统计呢?
经过观察,发现福利大多以二字词、四字词构成,同时词与词之间会出现重复字,例如常见的“休”“假”等,建立三个list,存储所有单字、相邻2字、相邻4字,并分别进行循环计数得到每个元素相对应的出现频次。
1.4 SVM(支持向量机)处理模块
SVM模块是词频统计系统的关键,在词频1中只计算出单字、相邻2字、相邻4字出现的频率,根据这些信息可以初步判断出相邻2字是否能组成两字词语。
其中,P(A,B)是A和B联合出现的概率,P(A)和P(B)为字符串A和字符串B出现的概率。此时,若I(A,B)≥0,即P(A,B)≥P(A)P(B),则可以认为汉字A和汉字B之间是正相关的。
1.5 词典生成模块
获取到纠正的词频统计DataFrame(分割完成的词汇集合),需要生成需要的福利词典。通过设计高通滤波器,提取其中的高频分量即高频词条,存入list导出。
1.6 词频统计模块2(简称“词频2”)
词频1不同在于,词频2依据的是已经生成的基于A网站数据的词典List,使用pandas对数据B统计List中词语出现的频次,如图2所示。
2 基于词云的福利待遇分析
基于地域的分类分析。对地域进行适当分类有利于更好地体现出地域的特色和差异,因此本文首先利用“工作地址”字段中的城市数据进行关键词匹配,从而将数据划分为一线城市、二线城市和三线城市三种类别。
2.1 基本福利待遇
基本福利,是指“人们在特定的社会生活环境中,维持和从事正常的生命活动,并基本上能够发展自身的体能与智能,所形成的对物质生活资料、精神生活资料以及必要的社会活动的需要 ”[3]。从一、二、三线城市的词频统计结果中可以看出,人们对福利待遇的首要关注的内容基本是一致的,不同城市间人们对于各种基本福利待遇的关注程度存在高度相关性。
然而,相同的背后也仍表现出巨大的地域性差异。以相关分析为例,如图3所示,一线城市关于二线城市的回归系数只为1.3,而关于三线城市的回归系数则高达2.7,侧面反映了一线城市的求职者更为注重基本福利待遇的保障,这可能是由于一线城市的工作节奏更快,生活成本更大,因此基本福利待遇的保障对这部分群体而言有更为重要的意义。
2.2 发展福利
发展福利指对职工未来职业发展有帮助的福利,其中“培训”是企业给予求职者的一项重要福利待遇,包括“免费培训”“带薪培训”等。此外,很多企业也把晋升空间大、晋升机制的公平性等内容作为企业福利待遇的一种。本文发现,三类城市对发展福利的要求基本相似,就地域差异而言,二线城市对培训相关的福利待遇关注度最高,三线城市对“晋升”的关注度最高,而一线城市在这两者都属于关注程度最低的。一线城市晋升空间较大,大多数都有完善的企业培训制度,因此一线城市的求职者对与发展性福利关注度比较低。与之相反,二、三线城市在企业晋升机制和培训制度上相对不够完善,对于谋求长远发展的求职者而言对于发展性福利无疑更为关注和重视。
2.3 生活福利
生活福利指提高职工生活质量的福利,主要包括“旅游”相关和“休假”相关的福利,很多企业或者推出“定期旅游”“国外旅游”等手段吸引求职者,或者给予额外有保障的假期,来吸引求职者。通过分类分析可以看到,如图4所示,三线城市的求职者对“旅游”的关注度最高,对“休假”的关注度最低,与之恰好相反的是,一线城市对“旅游”的关注度最低,对“休假”的关注度最高。这可能是因为生活在一线城市的群体由于生活成本高、竞争压力大等原因,在空闲时间更愿意在家休息;相比之下,三线城市的工作群体对旅游表现出更强烈的兴趣。吕晃的研究《赢得 下一个十亿亚洲游客—起航中 国》[4]也认为二、三线城市的旅游力量正在爆发,并且认为八成以上的中产阶级和有能力的消费群体聚集在二、三线城市。其数据分析还预测了2030年中國将有29个二线、三线城市拥有300万以上的中产阶级和极具消费潜力的人群。
2.4 薪酬补充
薪酬补充中,企业常常用“奖金”或给予“年底双薪”的手段来吸引和激励公司员工。可以看到,如图5所示,给予年底双薪的企业已接近一半,可见年底双薪已逐渐成为像“基本福利”一样的“标配”。具体而言,一线城市和二线城市的情况十分相似,并无明差异。与之不同的是,三线城市给予年底双薪的仅为32.3%,比一、二线城市均少了超过15个百分点,可见更多的企业倾向给予员工奖金来作为薪酬补充。
此外,部分企业通过给予员工公司“期权”来作为补充和奖励,然而在三类城市中采用这种方法的都只有0.3%,可见给予期权奖励在现互联网招聘市场中尚不流行。
2.5 健康关怀
健康关怀类福利待遇主要指企业给“五险”之外的商业保险或给予员工“定期体检”。从统计结果中可以看到,给予健康关怀类福利待遇在互联网招聘中并不流行,占比基本在3%以下。这一方面与人们对于自身健康状况的关注不够有关,求职者普遍缺少定期体检、关注自身健康的观念;另一方面,通过互联网方式参与招聘的群体以年轻人为主,发生健康疾病的风险相对较小。还应考虑到传统的五险一金中的工伤保险和医疗保险已经基本能够对职工可能发生的人身意外伤害和健康问题给予保障,客观上使得额外商业保险的吸引力变小。
3 给招聘企业的结论与建议
对于一线城市的招聘企业而言,给予员工“基本福利待遇”的保障无疑是重要的,考虑到一线城市有生活成本高的特点,部分求职者是从外地来的务工人员,因而基本福利待遇对他们而言就显得有特别的意义。由于很多员工是外来务工人员,年底回家过年时都有经济上的压力,因而一线城市的求职者对于“年底双薪”的保障最为重视,应当得到招聘企业的注意。对于三线城市的招聘企业而言,三线城市求职者对于晋升的条件更为重视。因此,三线城市的企业想要吸引求职者应当注重宣传企业内部晋升的空间、公平性等问题,以吸引到优秀的员工。三线城市的娱乐生活相对单调,适当组织旅游活动对促进求职者对企业的关注有很大的帮助。二线城市的求职者对于于福利待遇的关注大都介于一线城市和三线城市之间。然而,二线城市的求职者是最“好学”的,企业在条件允许的情况下,适当给予员工一些专业培训,既能够使员工获得更好地薪资和职位,也利于企业提高员工的整体素质,可以说是双赢的措施。
一、二、三线城市对福利待遇对关注点有明显的区别,企业如能根据自身情况和所处位置有针对性地发布信息,可以有效提高招聘信息的质量。
参考文献
[1] 陈晓霞.网络招聘与传统招聘方式之比较[J].人力资源管理(学术版),2009(3).
[2] 国家信息中心.“互联网招聘网站数据”[EB/OL].http:// dx.doi.org/10.18170/DVN/TWEHQO,北京大学开放研究数据平台,2017,V1.
[3] 王裕国,赵吉林.将保障公民基本福利确立为我国现阶段的重要国策[J].消费经济,2006(5).
[4] 吕晃.赢得下一个十亿亚洲游客-起航中国[J].销售与管理, 2014(5).
①基 金项目:山东大学校级科技创新基金立项(2018075)。
作者简介:晁嘉佑(1997-),男,汉族,江苏省徐州市人,本科在读,主要从事数理统计方面的研究。