2019年,数据科学行业求职有哪些特点?
“数据科学家”一词早在2008年已经出现,据传是由杰夫·哈默贝切(JeffHammerbacher)和DJ·帕蒂尔(DJ Patil)提出的。
自此之后,数据科学家连续四年居于美国高端工作岗位之首(数据来源于《哈佛商业评论》和Glassdoor网站报道等权威渠道)。
去年,我们对1,001份 LinkedIn个人资料进行研究,描绘出“典型”的数据科学家形象。在某种程度上,研究结果不仅证实了其他相关研究和民意调查,也揭示了数据科学家之所以能成为数据科学家的其他方面。
这项研究的不同之处在于,虽然数据由科学家自行提供,但我们已从求职者处收集了他们向雇主展示自己的方式。
我们调查了1,001位数据科学家在职业社交网站领英(LinkedIn)上发布的个人资料。与其他数据收集方法(如招聘广告)不同,我们认为专业人员自己发布的数据可以更好地反映实际简历。
样本比例必须与去年保持一致,这点至关重要。因此,在我们所获得的个人资料中,40%来自财富500强企业,剩下的60%来自其他企业。不同国家的抽样比例也保持相同,40%来自美国,30%来自英国,15%来自印度,另有15%来自其他国家。由于数据访问有限制,本研究采取了任意抽样法。
那么,今年的“典型”数据科学家与上一年相比有何不同呢?
乍一看,似乎并无太大不同。该领域仍由男性主导,比去年仅下降1%(2019年为69%,2018年为70%);样本中四分之三的数据科学家拥有硕士或博士学位(同样略有减少,可忽略不计); 该岗位的平均工作经验从2年增至2.3年。
但有一普遍变化值得注意:去年,数据科学家的平均工作年限为4.5年,而目前这一数值变为8年。这意味着,更多人选择在年龄较大时改变职业,或者更有可能的是,统计学家、数据挖掘者、计量经济学家以及其他职业的从事者已进化为(也有可能获得新技能)并接受了新的职业名称:数据科学家。
当然,这并非我们唯一的发现。在进一步细分数据后,有了关于2019年数据科学家的有趣发现。
综合技能
可以说,数据科学家最重要的一个方面就是所掌握的技能。
在调查了每位数据科学家最重视的三样工具后,我们发现,同去年一样,数据科学家工具箱中最常见的工具就是编程语言(而非像Tableau或SAS这样的软件)。
R语言和Python仍然是科学家最重视的工具。2018年,支持这两种技能的数据科学家均为53%。而今年,Python的发展势头令R语言望尘莫及(或如Gregory Piatetsky-Shapiro所说,Python会继续蚕食掉R语言的用户领域)。在样本中,认为Python是顶级技能之一的数据科学家占54%,而在R语言中,这一比例只有45%。
数据科学家们最重视工具的第三名仍是SQL(本次调查中SQL的支持率为36%,仅比去年下降4%)。与2018年相比,排名前6位的最后3种编程语言次序无变化。MATLAB和Java用户比例甚至与去年相同(分别为19%和18%),但我们观察到C / C++程序员数量下降显著,达到10%(从18%降至8%)。
最后,在去年研究了行业技能,今年再次重复该研究分析是十分有意义的。我们发现,整个行业的编程语言分布与2018年的趋势非常接近。最重要的是,仅这一项研究结果基本上反映了我们所认为的整体趋势,即Python正主导着所有行业。
行业就业
数据科学家的最大雇主仍然是技术/ IT行业,其在该行业的就业率自去年以来增长了1%(2019年为43%,2018年为42%)。科技行业数据科学家人数仍然最多,工业部门的数据科学家人数也由37%上升到39%。金融部门保持16%不变,而医疗保健行业则从5%变为2%(值得注意的是,与其他行业相比,医疗保健行业中数据科学家的占比微不足道,但这一减少可能是由抽取样本的局限性导致的)。
在数据科学家的就业领域,每年的调查结果并未特别显示出巨大变化,但如果按国家划分这些行业,会有什么新发现呢?
与去年一样,除英国外,大多数国家的结果与总体相似。与其他国家相比,英国更偏好金融业。尽管伦敦作为欧洲金融中心的前景尚不明朗,但英国的一些金融机构似乎早已在数据科学领域投入大量资金。
然而,最为突出的变化发生在印度。印度科技行业的数据科学家占比从较高比例63%减少至47%,更接近平均水平。部分数据科学家从科技行业进入工业部门,该部门数据科学家占印度数据科学家总数的30%,而去年占比为21.4%。印度金融业的数据科学家占比增加了13%(2018年为8.3%,2019年为21%),这似乎表明印度有意效仿英国。众所周知,印度通过承接外包服确立了其在科技领域的地位,数据科学领域也在齐头并进。我们十分期待并将继续关注印度在该领域的发展。
结论
本研究重申了成为数据科学家的必需条件。数据科学家所需的编程语言比以往更为明确,对Python和R语言之间的偏好差距继续扩大。本研究是对有志成为数据科学家的自我检查,帮助他们明智地选择所要关注的技能,当然具体技能还要取决于所处的国家和行业。
本研究得出的2018年到2019年的变化,可能不像研究人员所想的那样具有革命性,但这些变化确实证明了目前的发展趋势。由于数据科学比以往更加强大,我们期望从这些数据科学家的档案中,获取更多的确定性。虽然数据科学尚未成熟,但其仍在不断发展,与时俱进同以往一样重要。