自己从事数据工作多年,干过大多的数据岗位,成为管理者后,也带过很多的人,关于各类数据岗位人才的关键素质,自己也形成了一套看法。
正如智商是多基因作用的结果一样,要成为某类数据岗位的人才,肯定也是多因素决定的结果。
但每类数据岗位还是有其特定要求,而能适配这些特点的人更能在这些岗位脱颖而出,我这里就结合自己的实践,谈谈五类岗位最关键的要求和各自工作内容的区分。
图片来源于leecode
1、数据分析师数据分析师最关键的素质,是要有“下立地,上顶天”的气质。
“下立地“就是要接地气,要有足够的取数实践,具备较强的业务和数据敏感性。
很多合作伙伴的大牛深谙数据分析的讨论,方法论牛逼,PPT写得很好,但一般实操还是不行,主要的制约因素就是数据能力,数据分析工作一般不会外包,主要在于外包人员很难长期的“接地气”。
数据理解能力不是说你知道有这个表和这个字段就可以了,也不是看看数据字典就可以了,而是要能知其所以然,要能追根溯源数据是怎么来的,要能知道这个数据是否真实的反映了业务的实际状况。
同样一个业务口径,往往可以采取多种数据口径,而要辨析清楚这个差别,选择到最适合的,一定要有足够的取数实践。
“上顶天”就是胆子要大,脸皮要厚,能说会写,敢于跟上级去沟通互动。
“下立地”在迫使你成为一个内向的人,“上顶天”则迫使你成为一个外向的人,数据分析师一定是能够达到很好平衡的人。
在跟上级的互动中,数据分析师会始终处于学习期,不断接受上级的指示,然后消化吸收,然后反馈,然后再接受指示,如此迭代......,这才是数据分析师真正的成长之路。
所有的数据分析技巧和方法论,都可以在跟上级的互动中学到,这些才是真功夫,不用刻意去学习什么金字塔理论,老板的言传身教就是最好的方法论。
这种能达到“下立地,上顶天”的数据分析师,最后大多突破了数据分析师这个岗位本身,成为一名优秀的管理者,我数了下自己欣赏的很多数据分析师,后来大多成为了主管,即使是到了其他部门也是晋升迅速。
数据分析其实是数字化时代每个人都要具备的能力,拥有数据分析的技能不仅是为了满足领导的决策需要,更要能直接指导生产。
我总是建议数据分析师有机会一定要到各个实际业务岗位磨练一下,因为现实世界并不是靠系统上存储的那些数据所能完全反映的,如果你始终囿于一只数据团队内部,只喜欢跟数据打交道,那只能做一颗螺丝钉。
所谓成也数据分析师,败也数据分析师。
2、数据挖掘师
数据挖掘师最关键的素质,不是模型能力,而是要有产品思维。
企业中真正有价值的数据挖掘师往往不是技术最强的那个。自己曾经管理过很多的数据挖掘工程师,每当需要评定每个数据挖掘师的业绩时,技术能力最强的常常排在后面,而评价最高的往往是有想法,愿配合的那个人,那个人甚至不会R或Python,只会点EXCEL的技能。
当前大多企业的数字化水平一般,数据挖掘工程师面临的环境并不友好,大多企业数据挖掘师面临的最大挑战,其实是要能够找到数据模型在企业生产流程的真正应用场景,规模化这些场景,创造出真正的价值。
现实中的数据挖掘师一定是能理解业务,熟悉流程,懂得系统,会做分析,还会运营,不要只会对着电脑猛干,围绕着AUC,ROC,F1这些指标闭门造车。
数据挖掘师要能把模型当成一个产品去运营,具备产品的思维和方法,能设定目标并找出实现的道路,能正确的识别问题、并找出最合适的解决方案(不仅限于技术方案),带领团队把大问题化解为小问题,最终完成项目。
也就是说,其能在整个产品的生命周期从头到尾将一个模型产品负责到底,在笔者做成功的几个数据挖掘项目中,无一例外遵循了以上的原则,凡是不遵循的,全部失败了。
3、数仓模型工程师
数仓模型工程师最关键的素质,是要有工匠精神。
数仓模型的好坏直接决定了应用的效能,其也是数据中台的核心内容,但对于数仓模型工程师的挑战也特别大,这是由数仓模型的生态位决定的。
数仓模型夹在基础数据和上层应用之间,承上启下的价值巨大,但也是最容易被忽略和替代的。
因为上层应用完全可以绕过数仓模型,直接基于基础数据完成应用模型的建设,虽然应用要花点代价做自己的个性模型,但架不住快和灵活啊,对于单个应用来讲,其没有驱动力去配合数仓模型工程师完成中台模型的构建,即使这种行为从长期来讲损害企业利益。
正是由于这个背景,数仓模型工程师前期没啥成就感,很难被理解,做的工作非常枯燥。
一:要对企业的数据资产要有全局的理解,这个不下苦功夫不行。
二:要对垃圾的原始数据做清洗,这个没点执着的精神不行。
三:要基于对业务和数据的充分理解进行领域、概念、逻辑和物理建模,并且要在没有业务推动的情况下去沉淀优化。
四:要厚着脸皮去推销自己的成果,可能还要建章立制。
最后,技术也没啥好研究的,维度和关系建模都是几十年前的东东了。
数仓模型是在做长远的正确的事情,没有足够的耐心很容易放弃。笔者带过的很多数仓模型师,要么去做报表取数了,要么去做应用去了,即使做维护也好啊。
数据仓库领域的怪现象就是,数仓项目一旦完成,数仓模型就基本停滞发展了,5年都没有什么改变,因为人都跑完了。
但数仓模型一旦做好了,价值也非常大,因为底层模型做好了,其效能可以辐射到所有的应用,否则就不会有数据中台了。
这让我想起孔子对得意门生颜回的评价:“吾与回言终日,不违,如愚。退儿省其私,亦足以发,回也不愚。”
孔子的意思是:“我和颜回谈论一整天,他从不提反对意见和疑问,就像一个愚笨的人。可是,我注意观察他课后的情况、却发现他很能发挥我所讲的内容,颜回并不愚笨啊。“
数仓模型工程师无需显山露水,更不能卖弄聪明走捷径,好的模型都是自己一步一个脚印运营出来的,但正是这些模型构成了数据中台真正的底蕴,所谓大智若愚。
4、数据产品经理
数据产品经理最关键的素质,是要对于数据有深刻的理解。
数据产品经理是产品经理的一个子集,但到底是与数据相关的素质重要,还是与产品经理相关的素质重要呢?
这里我从客户的视角出发给出两个看法。
第一个是有关数据产品主要内涵的,我觉得客户对于数据产品有两大诉求,一种是以信息展示为主,解决信息快速获取的问题,比如报表和指标,另一种是以信息加工为主,解决精准度的问题,比如洞察、营销或风控,而以流程为核心的大多数产品,即使有一些数据的内容,也不属于数据产品的范畴。
第二个是有关数据产品核心能力的,在我们运营的所有数据产品中,虽然前期客户会