不学好数学的ML工程师不是好数据科学家

即将开播:4月29日,民生银行郭庆谈商业银行金融科技赋能的探索与实践

数学是一切学科的基础,学习数学是永无止境的。如果你从事商业领域,或者你所处的行业都是工程、数据、物理以及其他精密科学方面的专业人才,那么学习数学就更有必要了。

在接触数据科学和机器学习时,我已经10年没有碰过数学和数据之类的东西,也正因如此,最开始我进行得非常困难。我花了好几个小时看视频,想了解日常工业生产中使用的工具是如何运转的。

不学好数学的ML工程师不是好数据科学家

然而,我发现对于Jupyter笔记本中的“import” 和 “fit”,理解它们背后的机制很有必要,所以我决定要重拾那些久未触碰的数学知识。

确实,仅是数据科学方面就还有很多需要学习的知识。但你想过吗?技术和语言来来去去,但其背后的数学知识却是永恒不变的。

好好利用这次不幸疫情赐给我们的闲暇时光吧,毕竟接下来一段时间你只能待在家里了,不如一起来听网课。

1. 机器学习的必备数学知识:Python

课程来源:edX

课程提供机构:微软

课程时长:50小时

课程学习前的要求:掌握Python以及一些基本数学知识

课程简介:

想要学习机器学习或者人工智能,但却担心不具备相应的数学知识吗?“代数”以及“微积分”这样的词汇会让你觉得可怕吗?是不是在学校学习数学的日子已经过去太久,以至于你已经忘得差不多了?

别担心,很多人都是这样。机器学习和人工智能都是基于一些数学原理,比如微积分,线性代数,概率以及最优化。许多即将踏入人工智能领域的从业者都会对这些知识感到惧怕。

不学好数学的ML工程师不是好数据科学家

图源:unsplash

这门课程并不会助你成为一名数学家,只会教给你一些基础概念以及相应的表示符号。这门课程也将传授给你如何处理数据,并运用你学到的技能。

涉及到的主题:

  • 等式、函数、图表
  • 统计和概率
  • 微分和最优化
  • 矢量和矩阵

小贴士:这门课程有开课日期,但你可以在这之前选择一个日期,并从那里开始免费观看所有内容。

2. 在数据科学中使用Python会遇到的概率和统计

课程来源:edX

课程提供机构:加州大学圣地亚哥分校

课程时长:100-120小时

课程学习前的要求:掌握多元微积分和线性代数

课程简介:

不学好数学的ML工程师不是好数据科学家

图源:pexels

不确定性推理是噪声数据分析中固有的。概率与统计为这种推理提供了数学基础。

在这门课程中,你会学到概率和统计的基础知识,不仅能掌握数学理论,还能学会如何在Jupyter笔记本中对实际数据运用这些理论。

涉及到的主题:

  • 机器学习的数学基础
  • 统计素养:理解如“99%的置信水平”这类表达的含义

小贴士:这门课程有起始日期,但你可以选择一个之前的起始日期,并从那里开始免费观看所有内容。

3. 机器学习中的数学

课程来源:Coursera

课程提供机构:伦敦帝国理工学院

课程时长:104小时(实际上的课时至少要多出50%)

课程学习前的要求:无

不学好数学的ML工程师不是好数据科学家

图源:pexels

课程简介:

在很多高阶的机器学习及数据科学课程中,你会发现自己需要更新一些基础的数学知识。也许这些知识在学校已经学过了,但这门课程会从其他方面,或者是从不那么直观的方面来解读。而你也很难将这些知识应用到数据科学中去。

这一专业课程旨在弥补上述鸿沟,帮助你更好地学习并直观理解一些潜在的数学知识,并将其运用于机器学习和数据科学。

涉及到的主题:

  • 主成分分析
  • 线性代数
  • 多元微积分

小贴士:Coursera上的课程及专业课都可以旁听。即使你没有相应的文凭也可以接触到大量的课程资源,上面的课程简直太丰富了。注册以后,你只需选择旁听的选项即可。

4. 贝叶斯统计:从概念到数据分析

课程来源:Coursera

课程提供机构:位于圣克鲁兹的加州大学

课程时长:22小时(实际上不少于30小时)

课程学习前的要求:掌握有关概率的一些基础知识

课程简介:

这门课程会介绍贝叶斯统计的相关方法,从概率的概念拓展到数据分析,将讲授贝叶斯的相关理论和方法,以及如何将其运用于常见的数据类型,也会将贝叶斯理论和频率主义学派进行对比,后者则更常出现于课程当中。

通过这样的对比,将向你展示贝叶斯理论的优势所在。