机器学习工程师与数据科学家的大斗法

本文转载自公众号“读芯术”(ID:AI_Discovery)

随着人工智能的发展,市场上出现了一些新的工作岗位。但对于这些新兴领域的新兴职业,我们很多人难以分辨其间的不同之处,尤其是机器学习工程师和数据科学家的作用有何区别,这很令人困惑。

机器学习工程师与数据科学家的大斗法

阅读了不同的文章、博客并观看了一些视频之后,笔者想通过对比二者之间的差异来更清晰地介绍它们。

先类比一下。作家和教授之间有什么区别?可以说这两者都知道一种语言的“规则和语法”,其中一个是讲故事的人,另一个是“规则”的严格实践者。

数据科学家对原始数据进行处理分析,连接点并使用其他可视化工具讲述故事。他们通常具有较广泛的技能,深入了解的知识不超过一两个。他们更多偏向是在创意方面,像一个艺术家。

机器学习工程师则将数据视为必须接收并能以某种适当的形式高效输出的东西。他们的技能需要与实施细节相关的高效。

两者之间可能有很多重叠之处,但数据科学家可以是机器学习工程师,反之则不然。也许随着他们获得更多经验,机器学习工程师就是数据科学家,这样的说法会实现。

机器学习工程师与数据科学家的大斗法

机器学习与数据科学的维恩图

就洞察力或学习等方面而言,数据科学需要具有一定商业头脑的人才,而机器学习则需要关于系统预测的人才。例如:

  • 数据科学:“在城镇的这一部分,每2英里约有一个加油站”
  • 机器学习:“自从看到加油站以来,我们走了两英里,所以现在就要开始寻找另一个加油站”

接着再来看看Netflix的例子。

我们都知道Netflix会根据之前的选择来智能地推荐电影。该推荐系统可与机器学习算法配合使用,从而使用推荐系统提供合适的电影选择。

当谈论Netflix中的数据科学时,我们所要研究的模式包括在特定时间观看的评论者数量、其年龄和性别组成以及许多其他情况。这些决策用于改善业务前景。当企业需要借助数据来回答问题或解决问题时,数据科学家的工作就是从原始数据和非结构化数据中提供有用的见解。

数据科学家需要的技能:

  • 统计
  • 数据挖掘和清理
  • 数据可视化
  • 非结构化数据管理技术
  • 编程语言,例如R和Python
  • 了解SQL数据库
  • 使用Hadoop、Hive和Pig等大数据工具

机器学习工程师需要的技能:

  • 计算机科学基础
  • 统计建模
  • 数据评估和建模
  • 了解和应用算法
  • 自然语言处理
  • 数据架构设计
  • 文本表示技术

相关推荐