不学好数学的ML工程师不是好数据科学家
即将开播:4月29日,民生银行郭庆谈商业银行金融科技赋能的探索与实践
数学是一切学科的基础,学习数学是永无止境的。如果你从事商业领域,或者你所处的行业都是工程、数据、物理以及其他精密科学方面的专业人才,那么学习数学就更有必要了。
在接触数据科学和机器学习时,我已经10年没有碰过数学和数据之类的东西,也正因如此,最开始我进行得非常困难。我花了好几个小时看视频,想了解日常工业生产中使用的工具是如何运转的。
然而,我发现对于Jupyter笔记本中的“import” 和 “fit”,理解它们背后的机制很有必要,所以我决定要重拾那些久未触碰的数学知识。
确实,仅是数据科学方面就还有很多需要学习的知识。但你想过吗?技术和语言来来去去,但其背后的数学知识却是永恒不变的。
好好利用这次不幸疫情赐给我们的闲暇时光吧,毕竟接下来一段时间你只能待在家里了,不如一起来听网课。
1. 机器学习的必备数学知识:Python
课程来源:edX
课程提供机构:微软
课程时长:50小时
课程学习前的要求:掌握Python以及一些基本数学知识
课程简介:
想要学习机器学习或者人工智能,但却担心不具备相应的数学知识吗?“代数”以及“微积分”这样的词汇会让你觉得可怕吗?是不是在学校学习数学的日子已经过去太久,以至于你已经忘得差不多了?
别担心,很多人都是这样。机器学习和人工智能都是基于一些数学原理,比如微积分,线性代数,概率以及最优化。许多即将踏入人工智能领域的从业者都会对这些知识感到惧怕。
图源:unsplash
这门课程并不会助你成为一名数学家,只会教给你一些基础概念以及相应的表示符号。这门课程也将传授给你如何处理数据,并运用你学到的技能。
涉及到的主题:
- 等式、函数、图表
- 统计和概率
- 微分和最优化
- 矢量和矩阵
小贴士:这门课程有开课日期,但你可以在这之前选择一个日期,并从那里开始免费观看所有内容。
2. 在数据科学中使用Python会遇到的概率和统计
课程来源:edX
课程提供机构:加州大学圣地亚哥分校
课程时长:100-120小时
课程学习前的要求:掌握多元微积分和线性代数
课程简介:
图源:pexels
不确定性推理是噪声数据分析中固有的。概率与统计为这种推理提供了数学基础。
在这门课程中,你会学到概率和统计的基础知识,不仅能掌握数学理论,还能学会如何在Jupyter笔记本中对实际数据运用这些理论。
涉及到的主题:
- 机器学习的数学基础
- 统计素养:理解如“99%的置信水平”这类表达的含义
小贴士:这门课程有起始日期,但你可以选择一个之前的起始日期,并从那里开始免费观看所有内容。
3. 机器学习中的数学
课程来源:Coursera
课程提供机构:伦敦帝国理工学院
课程时长:104小时(实际上的课时至少要多出50%)
课程学习前的要求:无
图源:pexels
课程简介:
在很多高阶的机器学习及数据科学课程中,你会发现自己需要更新一些基础的数学知识。也许这些知识在学校已经学过了,但这门课程会从其他方面,或者是从不那么直观的方面来解读。而你也很难将这些知识应用到数据科学中去。
这一专业课程旨在弥补上述鸿沟,帮助你更好地学习并直观理解一些潜在的数学知识,并将其运用于机器学习和数据科学。
涉及到的主题:
- 主成分分析
- 线性代数
- 多元微积分
小贴士:Coursera上的课程及专业课都可以旁听。即使你没有相应的文凭也可以接触到大量的课程资源,上面的课程简直太丰富了。注册以后,你只需选择旁听的选项即可。
4. 贝叶斯统计:从概念到数据分析
课程来源:Coursera
课程提供机构:位于圣克鲁兹的加州大学
课程时长:22小时(实际上不少于30小时)
课程学习前的要求:掌握有关概率的一些基础知识
课程简介:
这门课程会介绍贝叶斯统计的相关方法,从概率的概念拓展到数据分析,将讲授贝叶斯的相关理论和方法,以及如何将其运用于常见的数据类型,也会将贝叶斯理论和频率主义学派进行对比,后者则更常出现于课程当中。
通过这样的对比,将向你展示贝叶斯理论的优势所在。