“老许,市里新成立的大数据局正面向全社会招聘各种急需岗位呢!其中最特别的岗位是数据分析师,据说待遇是最高的……”。
还真设置了这个岗位?某委办局信息中心的许主任虽然没有竞聘上大数据局主管的岗位,但是在竞聘环节就遇到过数据分析与数据挖掘方面人才如何培养的议题,自己当时也是准备不充分,只是泛泛谈了谈自己的理解,现在看来也许就是对这个问题的重要性认识不足,导致了最终竞聘失利,早知当初,应该多做些功课,毕竟自己本科学的可是数学呀!
随着消费互联网持续向产业互联网演进,基于大数据基础上的客户消费行为分析,借助数字化转型的旗号,正从互联网行业开始向各行业渗透,对数据分析与数据挖掘人才的争夺也越演越烈,数据分析师俨然已成为职场中的香饽饽。那么,这到底是个什么职业呢?且让我们揭开它神秘的面纱。
这里所称的数据分析师,是指不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。
需要指出的是,这不是个新职业,在没有形成大数据技术热点的时候就已经出现了,只不过因为相对小众,又属于辅助工种,因此并没有引起社会的广泛关注。比如,传统公共部门的统计员、传统企业的BI(商业智能)分析与应用人员,传统的会计/审计咨询师都属于这个范畴和类型。
相对于传统的数据统计与分析人员,大数据时代的数据分析师更强调想像力和创造性,以及对业务的驱动作用,这就赋于他们更高的关注度,如果用时下流行的说法,他们应该是数据领域的KOL(注:关键意见领袖),应该能够引领和影响相关行业的发展方向。
既然这个岗位这么重要,那一定应该能够创造可观的商业价值。这就涉及到这个信息时代对知识工作者最重要的评价标准,那就是知识工作者(注:数据分析师是典型的知识工作者)的产出(注:思想、概念、信息等)必须要带来外部商业价值,也就是说对数据富有想像力的解释一定有助于接受者具备产生更大、更多财富的能力。
从这个衡量标准来看,数据分析师至少要能做好如下几个事:一是对业务的梳理。即通过所掌握的管理咨询方法论,深入理解业务及需求;二是对数据的甄别。即通过熟悉的ETL(数据清洗)工具及对业务的理解,有针对性地选择多维度的数据来源,以及足够统计量的数据集(注:依据信息熵的原理,不确定性越多需要的信息量越大,自然所需分析的数据样本量也可能更多);三是建模及对模型的解释。即通过各类算法的有机组合,构建出适宜的模型,并给出富有说服务力的解释。
一是要具备五个能力:先说对业务洞察的理解力。如果不能很好地了解业务,再精妙的算法和模型也派不上用场;再谈对管理理论的实践力。如果只会纸上谈兵,很难获得客户的认可;还有对算法模型的统筹力。在纷繁复杂的算法中,科学选取是做好这项工作的基本功;再加上对分析工具的应用力。针对各类数据建模与分析工具,要非常清楚各自的适用领域和局限性,有机地组合运用;最后是对展示设计的表现力。数据分析的交付成果一定要图文并茂,不能光靠嘴说,这是检验交付成果说服力指数极为重要的评判标准之一。
二是要有三心:先是对科学技术的“虔诚之心”,要相信数学、相信概率统计学科的既有成果一定可以帮助我们深入理解业务的规律;再是对领域跨界的“学习之心”,要用谦卑的心态对待所研究的业务领域,才能获取业务人员的信任和配合;还有对探索未知事物的“敬畏之心”,要充分认识到人类认知的局限性,大胆想像,但要小心求证,持续迭代。
三是要有职业成长规划:同任何职业一样,做为一个数据从业者,自然也要有个人的职业规划,按照技能水平从低到高来划分,可以有这样的进阶路径,既从数据分析员起步,经过数据分析师的历练,向数据科学家迈进。不同的阶段,对技能的要求、所提供的服务、创造的价值也有很大的区别,比如数据分析员要会读数据,而数据分析师要会建模型,到数据科学家层面就要能研究基础算法,这有点类似于大学(要会读书)、硕士(要会选题)、博士(要能研究未知的领域)的区别。
IT 语录:数据分析师是发现数据之美的人!
“爸爸,有好几个公司都给我发了offer,虽然我学的是数学,可是我想去这个IT公司,因为他们提供的是数据分析师的岗位,挺有前景的……”
下期预告:这是现实版的“真假美猴王”吗?