聚焦机器学习和数据科学大佬工作的一天

点击上方关注,All in AI中国

聚焦机器学习和数据科学大佬工作的一天

作为一个相对较新的职位,机器学习工程师或数据科学家的日子仍然有些不稳定。你可以从Airbnb、SurveyMonkey和Instagram的员工那里了解他们的情况。

这个工作怎么样?

Chirag Mahapatra是Airbnb的机器学习工程师,Shubhankar Jain是Survey Monkey的机器学习工程师,Mansha Mahtani是Instagram的数据科学家。Springboard和他们每个人坐下来讨论工作,这样你就能更好地了解每天的工作内容。

Airbnb的Chirag告诉我们,该公司传统的软件工程角色是为了保持产品的活力。以Airbnb为例,软件工程师专注于构建客户可以看到的新功能,然后确保平台有足够的后端基础设施来保持站点的活力。SurveyMonkey的Shubhankar也认同这种观点:前端和后端工程师都在开发UX/UI,并构建负责逻辑和业务逻辑的系统。

另一方面,机器学习工程师关注的是机器学习基础设施和机器学习模型。大多数机器学习工程师工作在三个主要组件上:推理时的基础设施、用于训练的基础设施和用于注释与标记的基础设施。在Airbnb工作的一年半时间里,Chirag没有推出任何消费者可以直接看得到的东西。相反,他的工作重点是建立模型,以一种不同的方式来塑造他们的体验。

Chirag表示,要想在Airbnb找到一份机器学习的工作,你必须证明自己有好奇心,并且愿意学习。尤其是如果你是新来的,那么你的执行能力对公司来说很重要,他们希望了解一些机器学习的背景知识,比如在生产环境中构建机器学习系统(而不仅仅是建模)。了解不同的实验框架也有很长的路要走。

聚焦机器学习和数据科学大佬工作的一天

来自SurveyMonkey的Shubhankar分享了一些关于机器学习职位面试的一般技巧。根据他和其他业内人士的说法,列出你过去做过的项目清单很重要。很多人都遇到过Netflix挑战和泰坦尼克号的项目,它们都是最常见的项目之一,但是你有没有做过一些不常见的事情呢?

他建议做你感兴趣领域的项目。如果你对体育感兴趣,为什么不做一些分析、收集公开可用的数据仓库,然后建立一个有趣的项目?这会让你在简历上脱颖而出。在面试中保持稳定发挥的原因是你在讲述你所热爱的项目时的那种自信以及整个过程所带来的价值。

Shubhankar和Chirag都强调,不仅要了解机器学习的技术方面,而且要了解模型如何适应组织,了解行业趋势,并对其未来进行投资。他们说,业界最酷的趋势之一是人们和组织共享他们的工作、工具和知识。优步首先分享了"Michelangelo"他们的机器学习平台,然后发布了Ludwig,这是一个工具箱,可以在不编写代码的情况下训练和测试机器学习模型。Airbnb发表了一篇关于将深度学习应用于搜索的论文。这表明,该行业的趋势是共享知识,从而帮助每个人变得更好。

聚焦机器学习和数据科学大佬工作的一天

在Airbnb的一个典型例子里,Chirag与产品和运营团队进行了大量的互动,找出其中缺失的部分和有待解决的问题。他还致力于确定新的更改可能会如何影响最终用户。在SurveyMonkey, Shubhankar的一天被分成三个任务。

  • 第一个是开发支持组织内ML的基础设施(自动化ML模型的再训练,自动化数据科学家创建新模型的方式,等等)
  • 第二个是维护当前生产中的现有模型(确保模型按照预期执行,并且它们的质量不会降低)。
  • 第三种是将新模型投入生产(与软件工程、产品、数据科学和数据工程团队合作来实现)。

Springboard还讨论了Instagram上Mansha的数据科学家角色。她说,数据科学是通过聚合来自许多不同来源的数据来指导业务决策,并证明这些决策是数据驱动的。她对这个职业特别感兴趣,因为她可以参与并影响公司的发展方向。

Mansha说她的一天通常分为三个部分。收集数据是第一部分。第二个是讲故事,是要弄清楚如何讲述一个关于数据的激动人心的故事。第三是与团队沟通,传播她的想法,这是最重要的部分。数据科学家的价值是与她所宣传的决策是否得到实施有关。讲故事和交流对于在产品中实现应该做的所有事情的想法是至关重要的。

她还补充道:"鉴于这两种职业都相对较新,在如何定义什么是机器学习工程师和什么是数据科学家的问题上,往往存在一定的流动性。我的经验是,机器学习工程师倾向于编写生产级代码。例如,如果你是一个机器学习工程师,创建一个产品来为用户提供建议,那么你实际上是在编写最终到达用户的实时代码。数据科学家可能是这个过程的一部分,可能帮助机器学习工程师确定该模型包含哪些特性,但通常数据科学家在驱动业务决策时更倾向于临时性,而不是编写生产级代码。"

相关推荐