黄玉洁
本报告由世界经济论坛新经济与社会中心与Burning Glass Technologies、领英(LinkedIn)和Coursera合作,重点阐释第四次工业革命中最具竞争力的技能之一——数据科学,并揭示当今劳动力市场中数据科学人才的成长和分布情况。
本报告将介绍3种方法,帮助领导者了解新经济中数据科学技能的市场:一是通过Burning Glass Technologies的招聘广告,分析各行业对数据科学技能的需求;二是基于Coursera对学习者技能的见解,了解数据科学人才在各行业和各地区的分布和质量情况;三是借助领英的用户简历,分析数据科学技能在特定职业核心技能中的重要性。最后,本文总结了未来各行业对数据科学技能的需求,并通过世界经济论坛所做的就业前景调查,吸收了全球大型企业高管们的见解。
1、虽然数据科学岗位和技能目前在劳动力中所占比例相对较小,但呈现出成为需求最高职业的趋势。
2、对数据科学技能的需求不仅限于信息技术行业,媒体与娱乐、金融服务和专业服务等很多其他行业也越来越重视数据。
3、数据科学技能对于一些新兴职业尤为重要,如美国的机器学习工程师和数据科学专家,而传统职业只象征性地要求具备数据科学技能,但这些传统职业所需技能也正面临重大转变。
4、数据分析的新机遇和技术进步,总是重新定义数据科学家需要的特定技能,因此数据科学技能时刻处于快速演变之中。
5、数据科学学习者的成就差距表明,不同行业和经济体的数据科学人才水平各异:从行业看,信息通信技术(ICT)、媒体和娱乐、金融服务和专业服务行业,在招聘数据科学人才和在线学习者的成就方面处于领先;从经济体看,对于大多数行业,欧洲对数据科学技能熟练程度的要求排在首位,第二和第三分别是北美地区和新兴经济体;但与此趋势不同的是,对于信息通信技术等行业,亚太地区、中东和非洲的学习者表现优于平均水平。
6、到2022年,数据科学技能可能更加抢手,像人工智能和机器学习或数据科学等将成为大多数行业中最受欢迎的职业。
总体而言,数据科学岗位和技能的快速发展和演变,要求相关人员制定适当经营战略和教育及培训政策,以满足各行业对数据科学技能数量和质量需求。
更确切地说,本报告提出的观点具有以下内涵:
一是在第四次工业革命中,所有行业都要进行根本性转变,以充分吸收数据经济带来的红利,为此,需要适当投资以获得数据科学技能人才。
二是有些行业已吸纳了大量具有更传统的数据科学技能人才,如统计或数据管理的高技能人才,而要想发挥创新潜力,这些行业还要对数据可视化或统计编程能力等新技能进行投资。
三是数据科学行业发展迅速,要想时刻掌握最新技能,需具备动态的技能提升系统,以响应迅速变化的技术和相关技能需求。
四是在线学习者的成就差异,表明不同行业和地区数据科学技能之间的潜在差距。这种差距如得不到弥补,创新潜力和竞争潜力可能会落后,为此,应考虑加大对数据科学技能的投资。
Burning Glass Technologies公司根据招聘广告中在线市场技能和数据技能被提及的次数占所有被提及技能的比例,计算出不同行业对数据科学技能的需求情况。
1、指标数据
Burning Glass Technologies的技能指标反映的是新技术面世后,各行业对相关新技能的需求情况。新职位在网上发布后,算法会提取如岗位类型和岗位所需技能等相关数据,然后计算分析招聘广告中提及技能所占比例的变化情况,以得出对专业人才需求的变化趋势。企业对专业人员的需求变化,也可反应企业对技术的投资情况。
这些指标为人们了解各行业的技能需求提供了新见解。招聘广告中涉及的技能是重要的、新的或不寻常的必要技能,也是劳动力市场中的岗位所要求的基本技能。
当劳动力市场处于转型时,通过新招聘职位涉及的技能要求,可看出应用新技术和相关流程变化的早期趋势。这些技能要求体现了商业领袖的意图,即将对新技术的投资与人力资本相匹配。
2、主要观点
通过各行业对用户和实体大数据分析相关技能的需求变化,将各行业对这种技能的需求与对应用和网络市场相关技能的需求进行了对比。在《2018年就业前景报告》中,2022年之前,在线市场技能和数据技能是最有可能得到应用的两种技术,其中应用和网络市场(即在线市场)技能主要包括:社交媒体、付费搜索、电子商务和移动应用程序设计;用户和实体大数据分析技能(即数据技能)主要包括:Apache Hadoop(一种软件框架)、Hives、大数据、Oracle大数据和AWS Elastic MapReduce。
2013-2018年期间,不同行业对上述两种技能的需求有共同之处。值得注意的是,投资较多的行业是媒体和娱乐(ME)、专业服务(PS)、信息通信技术和金融服务(FS)行业。
与此同时,通过比较数据显示,对两种技能的需求也具有明显差异:与在线市场技能需求相比,数据技能需求仍然相对较小,但数据技能的需求正在快速增长。具体而言,2013年至2015年间,信息通信技术、媒体和娱乐、专业服务及金融服务行业对数据技能的需求分别增长了59%、50%、69%和88%,而同一时期上述行业对在线市场技能的需求僅分别增长了18%、14%、7%和44%。
进一步研究在线市场技能的需求趋势,会发现一些行业在特定年份对该技能的需求处于高峰期,比如,非营利性行业及政府和公共部门行业对该种技能的需求,分别在2014年和2017年达到了最高水平。对于这些需求出现高峰可做如下解释,即随着新技术的应用,企业开始急需专业人力资本,随后新技术逐渐成熟,对相关技能的需求也随之放缓。
通过Burning Glass Technologies的指标数据,人们能够及时细致地了解整个劳动力市场对专业人才需求的变化情况。这些数据使决策者能够跟踪各行业和地区的技能需求和技术应用情况,并了解劳动力市场对特定技能的需求规模及提高员工技能的工资激励措施。
3、对决策者的影响
这些数据的价值在于能够使个人、企业和政策制定者了解各行业对新技能的需求变化,以便随时应对技能短缺或不匹配问题。这些数据还有助于领导者对行业内外的专业人力资本进行投资。
Burning Glass Technologies编制的数据集基于网上招聘信息,具体而言,该公司首先从求职网站和雇主网站等在线资源中“获取”职位详细数据,然后分析每个招聘广告并提取关键信息,其中具体包括岗位介绍和所需技能。
之后,该公司通过聚类算法等进一步细分职位和技能等信息类别,以获得由一致的职业和技能分类法(如O*NET职业分类)组织的数据点。就目前分析而言,Burning Glass Technologies的技能分类进一步与世界经济论坛所发布《2018年就业前景报告》定义的新技术相对应。
由上述程序产生的技能需求度数据,表示某年某组特定技能在招聘广告中的提及次数占所有被提及技能的百分比,这些百分比可解释为对技能的需求程度。在各行业中,鲜少提及技能需求的招聘广告超过10%。在统计的技能和职业组合中,约95%列出了重要性低于10%的技能,应重点关注各行业的百分比和随时间推移的增长趋势。
表1 各行业的数据科学技能(按技能分组)熟练程度。来源:Coursera
1、指标数据
Coursera的全球技能指数旨在评估各经济体和行业的学习者,并提供方法以评估学习者对关键技能的熟练程度。对每个国家、地区或行业的学习者都要进行比较评估,评估结果分为四种,即:前沿(0.76-1.00分)、有竞争力(0.51-0.75分)、新兴(0.26-0.50分)和滞后(0.00-0.25分)。
学习者在Coursera在线学习平台上学习的课程和相关评估,为评估各行业和经济体的技能水平提供了宝贵见解,并为评估各行业和地区人才的技能熟练程度提供了衡量依据。
在第四次工业革命期间,做上述评估尤其重要,因为各地区和行业需要了解、培养和开发专业人才,以确保在长期内具有人才和经济竞争力。
2、主要观点
表1中显示的是数据科学技能在线学习者相关能力的差异,反映了各行业和地区的个人技能投资情况,以及学习者通过在线学习的成果。
近年来,在数学、统计、统计编程、机器学习、数据管理和数据可视化6种数据科学技能中,统计编程、数据可视化和机器学习实现了重大创新。
总体而言,无论从总体层面还是在技能集合看,处于第四次工业革命最前沿的技术行业拥有最具竞争力的数据科学技能人才,紧随其后的两个行业分别是专业服务行业和通信行业。
在统计或数据管理等较传统的数据技能方面表现良好的行业,如希望发挥创新潜力,还需要投资数据可视化或统计编程等更具创新性的数据技能,金融行业就属于这类行业。从历史上看,金融行业在数量分析技能,尤其是统计技能方面拥有强大的人才储备。学习者的学习成就表明,尽管技术行业对人才的竞争日益激烈,但该行业在传统专业领域仍然具有竞争力。然而,金融行业学习者的成就表明,该行业人员在较具创新性的技能方面表现较差,如在统计编程和机器学习方面分别排名第5和第6。
学习者的技能熟练程度也因地区而异。例如,在金融行业中,欧洲的学习者被评估为“最前沿”人才,而拉丁美洲的学习者被认为是“新兴”人才。平均而言,欧洲在线学习者的数据科学技能熟练程度高于北美,其次是新兴地区。例如,在亚太、中东和非洲地区,通信行业和技术行业的学习者具有较高的技能熟练程度。同样,在中东和非洲,汽车行业的学習者掌握了最前沿的数据科学技能。
在比较不同行业和地区学习者技能学习成就时,有些结果是高度两极化的。例如,在医疗保健行业,欧洲的学习者在数据管理技能方面取得了“最前沿”的成果,而北美的学习者处于滞后水平,媒体和娱乐行业的数据可视化技能学习者也符合上述模式。但对于数学技能而言,结果却正好相反:在消费品行业,北美的学习者优于欧洲学习者。
评估学习者的差异可能反映供应和需求方面的因素,例如教育系统的质量或工作场所对技能的需求。从长远来看,不同地区和行业的数据科学技能差距可能会加剧创新和竞争力的分化,并阻碍特定国家、地区和行业的发展。
数据资产日益重要,劳动力市场对数据科学技能的需求也日益增强。因此,政策制定者和企业领导者必须考虑为新的劳动力市场更好地培养和部署有竞争力的人才。这里提出的衡量标准可以扩展,以进一步评估产出衡量标准间的关系,比如基于学习者不同学习成就的股市指数和行业生产力数据。
3、对决策者的影响
详细分析各行业和地区的在线学习者技能熟练程度,有助于各行业和地区确定未来专业化人才的优先级,并发现技能提升和再培训机会,从而确保在新的全球经济中保持长期竞争力。
要与第四次工业革命中的市场变革保持同步,不仅是个人,世界各地的企业和政府都应在技能培训方面进行适当投资。
Coursera的全球技能指数基于技能与在线课程内容的一一对应,对学习者的表现进行了评估。该指数利用了技能标签训练的机器学习模型,这些技能训练标签众包来自Coursera平台上的数千万名学习者和几千名教师。
基于学习者在所有测试评估中的表现,Coursera会为每位学习者建立技能档案,以便调整学习难度。在本报告中,某地区某行业的技能熟练度值,是该地区该行业所有学习者技能水平的平均值,计算时,要对每个学习者的技能水平值进行加权,即乘以其技能档案的确定性系数。如果某地区某行业至少有100名学员在Coursera平台上进行了相关评估,则该地区该行业的技能熟练程度排名就视为有效。技能熟练度值根据相应技能指数得分进行排名,当某地区某行业的学习者在某一技能评估中表现更好,该地区该行业的技能熟练度值排名会更靠前。
对每个地区拥有足够数量学习者的行业,Coursera都计算了相应的技能熟练程度百分比,并进行了排名,以得出各地区各行业技能熟练程度排名,然后将这些百分比分为四类,即滞后、新兴、有竞争力和前沿。基于某地区某行业在某一技能方面的表现,可将该地区该行业划入相应类别,作为对该地区该行业人力资本能力的整体评估。
基于为每个学习者编制的技能档案,Coursera能够计算60个国家的技能指数得分。本报告会评估2000名左右符合条件的学习者,以得出某地区某行业对某项技能的熟练程度。有一些列为“缺失”的数据点,表示Coursera无法准确计算该地区该行业在该项技能上的熟练程度。
图1 特定新兴职业所需技能重要性排名变化。来源:领英
1、指标数据
根据领英会员在职业简介中展示的技能信息,人们可了解各种职业的技能要求。当领英用户在个人资料中修改职业时,该用户就与该职位相关联。这种转变的历史趋势可解释为雇佣模式。通过这些数据,可追踪用户在不同时间点从事的不同工作,以分析趋势并进行比较。通过分析2014-2018年间,1.77亿名领英美国会员的招聘趋势,得出图1中所列的一系列新兴职业。
通过会员在领英职场社交平台上对自身技能的介绍,人们能够获得很多新见解,涵盖了新兴职业和全球经济中劳动者不断发展的技能。每个职业都需要一套独特技能,而这些技能会随着新技术和经营模式的应用而变化。在第四次工业革命期间,劳动力市场有两个变化:一是职业的重要性正在发生改变,即一些职业的重要性下降,而另一些职业,且大多是“新兴”职业的重要性日益增加。二是随着技术对工作内容的改变,同一职业所需不同技能的重要性也会发生变化。
领英技能评估的是在劳动力市场各个领域都很重视的独特技能。劳动力市场可按特定的地理位置(如城市或自治市)、行业、工作类型(如数据科学家)或人口(如职业女性)划分为不同领域。
2、主要观点
图1反映了2015-2018年间美国劳动力市场中,机器学习工程师和数据科学专家所需技能的变化情况,这两种新兴职业都需要数据科学技能。本报告还将上述两种职业的变化与传统上不需要数据科学技能的两个新兴职业,即销售开发代表和关系顾问所需技能的变化情况进行了比较。
这使得人们可以更细致地分析当今劳动力市场中出现的两类职业:一类是有助于开发、运行和维护新技术的职业,包括一系列技术职业,如区块链开发人员、机器学习工程师、机器学习专家和数据科学专家;另一类是开发客户并销售产品和服务的职业,如应用销售主管、关系顾问、销售开发代表和业务支持顾问。
2015年,机器学习工程师通常表示,他们使用的技能包括编程语言、Apache Spark、数据科学、深度学习、算法、分布式计算和大数据;数据科学专家所使用的技能与之相似,但数据科学专家更重视其他技能,如R、统计和结构化查询语言(SQL)。到2018年,这两种职业的技能需求都发生了重大变化,总的来说,两者都开始重视自然语言处理技能,而编程语言Python的重要性在两种职业中都有所下降,尤其是对机器学习工程师而言更是如此。两者的不同变化在于,数据科学专家更加重视数据可视化和结构化查询语言技能,而机器学习工程师更倾向于使用专为机器学习而设计的新编程工具,如张量流图、Keras和计算机视觉。
与上述两种职业相比,销售开发代表需要不同的技能,掌握Salesforce.com等技术技能至关重要,但該职业的基本技能还包括客户关系管理和业务开发,这些技能被认为是以人为中心的“软”技能。此外,这种职业受技术变革的影响似乎较小,销售开发代表所需技能与机器学习工程师或数据科学专家相比更具稳定性,但开发潜在客户技能的重要性正在明显下降,这一变化表明销售开发代表开发潜在客户的方式发生了转变。销售开发这项日益重要的技能,更重视销售代表与潜在客户之间的互动,而不是让企业与客户进行例行公事的沟通。
关系顾问所需技能的变化表明,为适应新技术的应用,这一职业需要重新定位。金融机构的代表通常是关系顾问,对这一职业而言,由于技术进步,金融服务和信用评级评估取代了人力,两大技能的重要性日益降低,而银行业务、金融、借贷和财务技能等行业专门知识和技能正在重新引起重视。
劳动力市场分析往往侧重于就业岗位的总体增减情况。不断变化的职业技能需求是当今工作人员面临的另一挑战:职业正在发生重大转变,对劳动者的要求也随之发生了变化。分析工作所需的技能,比仅仅分析工作岗位更能准确地了解劳动力市场的需求。为分析当今劳动力市场中最重要的变化,应将技能视为新的分析因素。除上述功能外,领英的技能可提供职业、行业、城市和地区的技能组成。基于此,可比较技能变化的历史趋势,从而有助于相关人员确定各行业应优先掌握和提高的技能;该技能分析有助于使新兴工作与具备合适技能的人群(如移民或妇女)相匹配,以填补岗位空缺;此外,还有助于新进入劳动力市场的劳动者了解相应职业和行业当前和过去的情况。
3、对决策制定者的影响
将技能作为分析劳动力市场的关键因素,为政策制定者提供了工具,以积极准备应对未来工作的颠覆性变化。为深入、细致且动态地洞察劳动力市场中正在发生的变化,相关人员不应仅仅关注工作岗位和劳动者年轻时获得的教育资格。
政策制定者和企业领导人可利用这些精细的动态数据发现技能差距,因为这些技能差距會进一步导致性别、种族和民族间的社会经济不平等。此外,这些技能对比可用于发现需要类似技能的领域,这些领域具有协同效应,比如不同职业之间的相似性能够决定劳动者的未来职业道路和前景黯淡的职业。最后,这些数据可帮助教育和培训提供者,使他们能以更灵活的方式使劳动者的职业能力与劳动力市场的技能需求保持一致。
用于开发领英技能的数据来自领英平台上专业人员的会员资料。具体而言,这些数据来自于会员简介中列出的技能、职位和工作地点。上述技能使用词频-逆文档频率(TF-IDF)模型进行计算。
为分析技能,领英根据技能在特定领域中的重要性(例如特定地理位置、行业或职业),计算每项技能的权重,并进行比较。例如,在一定时期内,与其他职业相比,某一职业最重视的技能。首先,所有在这一时期内从事该职业的人员都应纳入分析中。然后,统计会员在领英个人资料“技能”部分列出的技能,并计算每项技能出现的频率。注意,只有个人在担任职位期间专门添加的技能,才能包含在相应分析中。反之,为减少“无效”数据,由10个或10个以内会员在未担任职务期间添加的技能将被删除。这样可以确保只统计与职业相匹配的技能,并且可在一段时间内分析技能的变化情况。最后,对每项技能进行加权,在多种职业中出现的通用技能的权重较小。通过上述计算,将得到最能代表该职业的技能。
2018年的就业前景调查,要求首席人力资源官和其他商业领袖确定其企业需要的技术,以及他们认为重要的新兴职业,得到的答案都与数据科学工作和技能相关。在接受调查的商业领袖中,85%的人表示他们计划在2022年之前整合用户实体和大数据分析技术,使其成为所有行业中最重要的因素。
此外,商业领袖们还确定了一系列新的重要职业,预计这些职业到2022年也会变得更加重要。数据分析师和科学家,以及人工智能和机器学习专家在各行业中的排名很重要。大多数行业的商业领袖计划将在用户和实体大数据分析技术方面投资,与创建新的数据科学相关岗位相匹配。更确切地说,在接受调查的12个行业中,有7个行业的商业领袖认为在2022年之前最热捧的新职业是数据分析师和科学家。为满足这一需求,政策制定者和企业领导者应共同努力,以提高当今数据科学人才的能力。本报告中的数据表明,除基本的数据科学技能教育外,还应开展动态的、响应性的技能提升项目。这种投资将为个人、企业和经济体带来快速回报,包括更高的工资、创新力、竞争力和社会经济流动性。
译自:Data Science in the New Economy: A new race for talent in the Fourth Industrial Revolution, July 2019 by World Economic Forum