编译 方陵生
将信息数据称为全球经济的“新油”是一种普遍说法,数据科学家是能够在全球经济中提取、精炼和配置这种具有战略价值能源的人才。
人类历史上三次工业革命催生了大量新技术,导致了经济、社会和产业各个领域的重大变革。蒸汽机的发明开始了人类从农业社会迈向工业化大生产的重要转变;化石燃料用于发动机及装配线等创新工业生产的模式迅速扩大了生产的规模;数字化革命更是显示了计算和信息技术的强大力量。每一次工业革命都给人们的生活和工作方式、经济价值的创造方式以及对高价值技能的需求带来重大变化。
随着第四次工业革命的展开,在数据科学和人工智能等技术的带动下,劳动力市场再次发生了根本性的变化。业界领袖普遍认为,到2022年,人力和自动化流程将平均分担目前的工作量,而随着数字化创新在各行业和地区的普及,有可能同时出现一系列新职位,特别是在许多大型先进市场和新兴市场,信息技术、可再生能源、教育和医疗保健等行业将占据大部分新的职位,数据科学、医疗保健和人力资源等行业预计也都将出现增长。
新的劳动力市场正在迅速发生变化,新兴数据源也正以前所未有的深度和活力产生影响。在线平台和具有专业洞察力的公司正在探索与传统行业互补的新方法,以了解特定的技能、任务和职位在不同行业和地区之间的变化。这些探索有助于提高企业、决策者和员工对劳动力市场的现状和未来的分析能力,并采取更明智、更协调的商业战略和政策。
世界经济论坛(WEF)发布了《新经济下的数据科学——第四次工业革命中的数据科学人才竞争》(Data Science in the New Economy:A new race for talent in the Fourth Industrial Revolution)报告,旨在为政策制定者制定数据科学人才政策提供参考。报告认为,数据科学在未来将是人工智能、机器学习、信息通信、媒体娱乐、金融和服务等行业的基础技能,对经济增长尤其重要。因此,政策制定者应跟踪把握数据科学及相关技术的发展态势,注重区域平衡,加大行业投入和人才培养力度,为第四次工业革命提供足够的数据科学人才。
报告结合Burning Glass Technologies公司、在线课程Coursera公司和领英公司的实践,分析了新经济下的数据科学技能市场以及数据科学人才在当今劳动力市场上的成长和分布:一是通过Burning Glass Technologies的招聘广告分析数据科学技能需求;二是基于Coursera对学员技能的分析,了解数据科学人才跨行业和跨地区的分布和人员素质情况;三是通过领英的用户简历,分析数据科学技能在特定职位核心组成中日益加强的重要性。
将信息数据称为全球经济的“新油”(new oil)是一种普遍说法,数据科学家是能够在全球经济中提取、精炼和配置这种具有战略价值能源的人才。本报告重点关注数据科学人才,他们是第四次工业革命中最具竞争力的技能型人才。
在第一波数字化浪潮中,数据被视为纯粹是数字应用、操作系统和数字平台等的副产品。现如今数据越来越被认为是一项重要资产,是人工智能等领域内进一步创新的极大助力,如通过提高处理流程效率推动服务改进,为客户提供最佳服务。新的数据源和处理方法带来的好处不只限于私营部门,公共部门越来越多地利用数据改善政府服务,学术界应用新方法加强研究。
然而,对数据科学技能员工需求的迅速上升,导致数据科学技能人才供不应求,工业界、学术界和公共部门之间为争夺此类人才的激烈竞争,降低了企业、行业和整个经济体充分利用创新红利的能力。各行业对这类人才的需求如何,数据科学技能如何成为核心职位构成的一部分,员工如何通过跨行业和地区的学习拓展其数据科学技能集,我们对未来数据科学需求增长的了解有多少,这些都是我们要探索的问题。
虽然数据科学岗位和技能在目前劳动力中所占比例相对较小,但最近的趋势表明,数据科学人才在劳动力市场上的需求将日益增大。数据科学技能的需求不只限于信息技术部门,数据的重要性在许多行业中都在不断提高,包括媒体和娱乐、金融业和服务业。
数据科学技能对于新产生的一些职位尤为重要,如美国的机器学习工程师和数据科学专家。而在一些传统职业中,如公共关系顾问,对数据科学技能的要求只是象征性的,但这些职位所需的技能也正面临重大变化。数据科学技能也并非固定不变,随着数据分析的技术进步,数据科学技能职位的具体构成也将重新定义。
数据科学学习者的成就差异表明,各行业和各区域的数据科学人才的水平也各不相同:信息和通信技术、媒体和娱乐、金融和服务行业在招聘数据科学人才以及跨行业技能方面均处于领先地位;在大多数行业中,欧洲的在线学习者在数据科学技能方面的熟练程度高于北美,其次是一些新兴地区;与此趋势不同的是,在信息通信等领域内,亚太地区的学习者、中东和非洲的学习者成绩均优于平均水平。
预测到2022年,人工智能与机器学习专家、数据分析师和科学家等将成为大多数行业中最需要的人才,对数据科学技能的需求也将急剧增加。
总体而言,数据科学职位和技能的快速发展和演变,提出了制定适当战略和教育培训政策的要求,以满足对人才数量和质量的需求。不能了解和应对这些变化的行业和国家将可能面临增长放缓甚至下跌的风险。上述提到的趋势对决策者提出了新的要求:
在第四次工业革命中,所有部门都需要进行根本性变革,以充分利用数据经济的潜在红利,这种转变需要伴随着对数据科学技能人才的适当投资。
数据管理或统计行业已吸纳了大量传统数据科学技能人才,但这些行业不能沾沾自喜,自我满足,要想发挥其创新潜力,这些行业需要对数据可视化或统计编程等新技能进行新的投资。
鉴于数据科学专业的快速变化,一次性技能升级投资是不够的。要想跟上最新技能的发展,需要有一个动态的技能升级系统以及时响应快速变化的技术和相关技能的需求。
不同行业和不同区域在线学习者的成就差异显示了掌握数据科学技能能力之间的潜在差距,这个问题如果不加以解决,可能会降低一些企业、行业和区域的创新能力和竞争力潜力,这些区域的公共和私营部门需要考虑加大对数据科学的投资。鉴于对这些技能需求的不断增加,这方面的投资很可能为个人和公司带来巨大回报,并有助于为社会经济流动开拓新的途径。
2013年至2018年期间,不同行业对在线技能和数据技能这两种技能的需求表现出一些共同特点,如投资较多的行业是媒体和娱乐行业、服务业、信息和通信技术行业以及金融行业。同时,数据也显示这两种技能需求有明显差异:与在线技能相比,对数据技能的需求仍然相对较小;不过,对数据技能的需求正在迅速增长。准确地说,2013年至2015年期间,信息和通信技术、媒体和娱乐、服务业、金融业对数据技能的需求分别增长59%、50%、69%和88%。相比之下,同一时期同一行业对在线相关技能的需求分别增长18%、14%、7%和44%。
对在线市场发展趋势的进一步调研可以发现,一些行业在特定年份经历了需求高峰。例如,2014年非营利性行业和2017年政府和公共部门都出现了这种需求高峰。这些高峰可以解释为随着新技术的应用对专业人力资本的迫切需求,但随着这些技术开始成熟,对相关技能的需求也将相对放缓。
这些数据的价值在于,让个人、企业和决策者了解各行业对新技能需求正在激增这一趋势,可动态地解决技能短缺或不匹配的问题。同时,支持领导者对行业内和跨行业人力资本的未来投资目标进行定位。
不同行业和地区的学习者在数学、统计、统计编程、机器学习、数据管理和数据可视化这六个技能集里的数据科学技能各有其相对优势和劣势。这六个技能集可进一步细分为一些具体的技能,例如:数学中的微积分;统计学中的线性回归;统计编程中的编程语言,如R语言;机器学习中的神经网络;数据管理中的大数据分析;数据可视化中的图表绘制。这六个技能集中的三个近年来有重大创新,分别是统计编程、机器学习和数据可视化。
在传统的数据技能方面表现良好的行业,如统计和数据管理,如果希望发挥其创新潜力,就不能固步自封,需要对统计编程或数据可视化等更具创新性的数据技能进行新的投资。例如,金融业就属于这一类。从历史上看,金融业在人才和技能上一直保持着数量优势,特别是在统计学方面拥有强大的人才基础。尽管技术行业的人才竞争日益激烈,但金融业在这些传统专业技能领域仍具有竞争优势。然而,金融行业学习者在统计编程和机器学习等其他技能方面表现较差,技能熟练度排名较低。
学习者的技能熟练程度因地区而异。例如,在金融行业,欧洲的学习者被认为是“最前沿”的人才,而拉丁美洲的学习者是“新兴”人才。总体而言,欧洲的在线学习学员在数据科学技能方面的熟练程度高于北美,其次是新兴地区。通信领域的学员在亚太、中东和非洲地区表现出较强的技能熟练程度。同样,在汽车行业,中东和非洲的学员在掌握数据科学技能方面表现良好。
随着数据成为越来越重要的资产,劳动力市场需要更多掌握数据科学技能的人才,决策者和企业领导人必须考虑为新的劳动力市场更好地开发和部署有竞争力的人才。按行业和地区对在线学习学员的技能熟练程度进行分析,有助于确定未来人才需求的优先项,瞄准跨地区的技能再学习和技能提升机会,保证地区和产业的长期竞争力。要跟上第四次工业革命中已经开始的市场转变步伐,需要个人、世界各地公司和政府在技能开发投资上的协同努力。
当今劳动力市场上出现的两种类型的职位需要认真考察:一种是建立、操作和维护新技术的职位,如区块链开发人员、机器学习工程师、机器学习专家和数据科学专家;另一种是吸引客户并销售产品和服务的职位,包括应用程序销售主管、公共关系顾问、销售开发代表和业务支持顾问。
不同的职位关注的重点不同。数据科学专家更重视数据可视化和SQL(结构化查询语言)技能;机器学习专家更倾向于强调使用专门为机器学习设计的新编程工具(如TensorFlow和Keras)的技能,以及对计算机视觉的理解。与这些职位不同的销售开发代表需要不同的技能集,如销售技能、客户关系管理和业务发展技能,即重点是“软”技能和以人为中心的一些技能。
劳动力市场分析通常侧重于就业机会的总体上升和下降趋势,但职位技能组合的不断变化提出了更高的要求,即跟踪职位的技能要求比只跟踪职位更能准确地洞察劳动力市场的需求。此外,领英的技能组合分析还可以跟踪职位、行业、城市和地区的技能构成,以便对历史趋势进行比较。为跟踪当今劳动力市场最重要的变化,技能必然成为劳动力市场调查的新的分析单位。
各行业对数据科学技能职位需求的优先级排名
将技能作为劳动力市场分析的关键单元,为确定技能再学习和技能升级提供了评估分析工具,为决策者提供了为未来劳动力市场可能出现断层做好积极准备的评估分析工具。深入、细致和动态地了解劳动力市场正在发生的变化,要求我们的分析不只基于和局限于年轻一代的职业资历和学历。这些数据也可以给予教育和培训提供者支持,使其与劳动力市场上新的技能要求更加灵活地结合起来。
在未来就业前景调查中,首席人力资源官和企业领导人预测了未来企业需要的技术以及可能出现的重要新职业。在接受调查的商界领袖中,85%的人表示,在2022年之前,他们计划对“用户”和“大数据分析”进行整合,使其成为最优先考虑的方面;他们还计划将用户和大数据分析方面的投资与新的数据科学相关职位进行匹配。此外,领导人还预测同一时期将变得更加突出的一系列新的重要职位。下表列出了各行业对人工智能和机器学习专家、数据分析师和科学家需求的优先级排名。
准确地说,在12个被调查的行业中,7个行业的数据分析师和科学家是排名第一的职位,是企业领导人计划在2022年之前聘用新员工的工作职位。
为满足这一需求,决策者和商界领袖需要共同努力,拓展当今数据科学人才队伍。本报告中的数据揭示,除了数据科学技能基础教育外,还需要制定动态、响应性的技能再学习和技能提升计划。这方面的投资将以更高的工资水平,更多的创新、更强的竞争力和社会经济变动形式,给个人、公司和经济体带来快速的回报。