KDnuggets:未来4至10年内对数据科学家的需求将开始减少
大数据文摘作品
编译:Shan LIU、笪洁琼、亭八
根据近1200份投票的统计结果显示,KDnuggets的读者认为对数据科学家/机器学习专家的需求将在未来4至10年内开始减少。最常见的一种回答是4-6年,中值是8-9年。
KDnuggets问卷:对数据科学家/机器学习专家的需求何时会开始衰减?
这是一张很重要也很有意思的图表,看完之后我的想法如下……
注意:需求下降的起始点紧随着需求高峰,所以我们需要交换着使用这两个术语。
在2012年被誉为“21世纪最性感的工作”之后,市场对于数据科学家的需求开始迅速增长。这一需求的填补体现在两个方面:
教育:很多大学及其他教育平台(例如Coursera,、edX和Udemy)开始增加提供数据科学与机器语言的教育。
自动化:如同DataRobot这样的公司提供“自动化数据科学/机器学习”的平台一样,这些平台可以让商业用户自己去建模,或者在某一商业流程中嵌入模型来完全自动化数据科学(比如自动化的广告竞价)。
但目前的需求下面却潜藏着一个巨大的泡沫,这个泡沫很可能在未来的某一个时间点破裂,随后需求开始迅速下降。而且如同其它的泡沫一样,这个泡沫同样难以预测。所以需求高峰期(需求开始下降的点)出现在未来4-9年,是一个很合理的假设。但是,这并不意味着数据科学家会失业,这只是让这种工作变得常规化,使薪资水平变得平稳下来,如同互联网发展初期,网页开发者是一个炙手可热的工作,现在却成了一个稀疏平常的工作了。
问卷也调查了受访者在数据科学和机器学习方面的相关经验,以及他们所属的社会群体(产业界/学生/科研/政府/其他)。
问卷受访者在数据科学/机器学习方面的经历及其所属社会群体
从图中我们可以看到:60%的受访者有2年以内的相关经历,62%的被调查者来自产业界,19.5%是学生,9.2%是科研人员,4.5%来自政府及公益组织。
在检验高峰需求的预测与受访者经验、所属社会群体的关系时,我得到了惊人的相似曲线。一个高峰期是在未来4-6年和7-10年,另一个小一些的高峰出现在25年及以后。为了简单理解这个图表,我将曲线分组为“小于1年经验”,“1-2年的经验”和“2-4年的经验”,无论哪种情况,这些曲线看起来都非常相似。
对数据科学家/机器学习的高峰需求vs.受访者在数据科学/机器学习领域的相关经验
让我们把那些“预测对数据科学家的需求在25年后开始衰减”的人称为乐观主义者,而将另一部分人归类为悲观主义者吧!
我们发现,经验最多的(16年以上)这一群体占据了乐观主义者的绝大多数,而且这一群体有超过35%的人认为需求在25年之后才会逐渐减缓。
接下来,让我们看看预测高峰需求曲线与受访者所属社会群体的关系。
数据科学家/机器学习专家的高峰需求预测vs社会群体
再一次,我们出乎意料地发现:这些曲线都很相似。
其中,学生是所有群体里最乐观的,政府工作人员是最悲观的,产业界人士居于其中。
最后,我们看一下不同区域的分布。各地区参与者包括:
US/Canada, 40%
Europe, 33%
Asia, 16%
other, 11%
美国/加拿大 40%
欧洲 33%
亚洲 16%
其他 11%
对数据科学家/机器学习专家的高峰需求vs地域
这一次,我们又双叒叕发现曲线依然十分相似。而一个显著的差异是:美国/加拿大的受访者相比其他区域的受访者更乐观,他们最多的选择是认为需求将在未来7-10年内饱和,而其他区域则认为是4-6年。在所有区域里面,认为25年甚至更久的受访者百分比为(18.3%-19.8%),这也是让人难以置信的相似。
如何解释这样及其相似的分布?
有一种假设是,乐观主义或者悲观主义是天生的,这会影响到他们做预测的结果。所以当我们想对“社会趋势”做预测的时候,由于这种主题的问题不能通过物理事实测量,更多的只是取决于人们的想法和直觉。所以问卷设计应该以某种方法来检测乐观主义或者悲观主义特质。
如果这个结论是真的,那么我们可以认为:乐观主义的百分比在各个不同的区域、社会群体的群组里面是相似的,而且这个相似不会随着经验发生变化。