如何在学习机器学习时学习数学？

dustinsea

2018-08-14

摘要：机器学习到底需要怎么样的数学基础？高段位机器学习如何练成？来瞧瞧。

到目前为止，我们都还不完全清楚开始机器学习需要什么样的数学水平，特别是那些没有在学校学习数学或统计学的人。

在这篇文章中，我的目标是提出建立产品或进行机器学习学术研究所需的数学背景。这些建议源于与机器学习工程师、研究人员和教育工作者的对话以及我在机器学习研究和行业角色方面的经验。

首先，我会提出不同的思维模式和策略，以便在传统课堂之外接近真正的数学教育。然后，我将概述不同类型的机器学习工作所需的具体背景，这些学科的范围涉及到高中统计和微积分到概率图形模型（PGM）。

关于数学焦虑的一个解释

事实证明，很多人包括工程师都害怕数学。首先，我想谈谈“善于数学”的神话。

事实是，擅长数学的人有很多练习数学的习惯。并不是他们先天就是擅长数学，你可能在看他们做数学时发现他们得心应手。要清楚，要达到这种舒适状态需要时间和精力，但这肯定不是你生就有的。本文的其余部分将帮助你确定所需的数学基础水平，并概述构建它的策略。

入门

作为先决条件，我们假设你有线性代数/矩阵运算以及概率计算的基本知识点。我还希望你有一些基本的编程能力，这将支持作为在上下文中学习数学的工具。之后，你可以根据你感兴趣的工作类型调整你的主要方向。

如何在校外学习数学？这个问题几乎困扰我们很多人。我相信专心学习数学的最佳方式是在学生的时代。在这种环境之外，你可能不会拥有学术课堂中的氛围、同伴和可用资源。

在校外学习数学，我建议组成学习小组，并学会及时分享各自的资源。相互激励在这里发挥着重要作用，这种“额外”的研究应该受到鼓励和激励，这样在学习上就会很有动力。

数学和代码

数学和代码在机器学习工作流程中是高度交织在一起的。代码通常是由数学模型构建，它甚至共享了数学符号。实际上，现代数据科学框架（例如NumPy）使得将数学运算（例如矩阵/矢量积）转换为可读代码变得直观和有效。

我鼓励你将写代码作为巩固学习的一种方式，数学和代码都是基于理性思考，写代码的过程其实就是理解数学公式的过程。例如，损失函数或优化算法的手动实现可以是真正理解基础概念的好方法。

通过代码学习数学的一个例子：在神经网络中实现ReLU激活的反向传播。作为简要的入门读物，反向传播是一种依赖于微积分链规则来有效计算梯度的技术。

首先，我们可视化ReLU激活，定义如下：

如何在学习机器学习时学习数学？

要计算梯度（直观地说，斜率），你可以想象一个分段函数，由指标函数表示如下：

如何在学习机器学习时学习数学？

NumPy为我们提供了有用、直观的语法，我们的激活函数（蓝色曲线）可以在代码中解释，其中x是我们的输入，relu是我们的输出：

relu = np.maximum(x, 0)

接下来是渐变（红色曲线），其中grad描述了upstream渐变：

grad[x < 0] = 0

在没有首先自己推导出梯度的情况下，这行代码你可能看的不是很明白。在我们的代码行中，(grad)对于满足条件的所有元素，将upstream梯度中的所有值设置为0 [h<0]。在数学上，这实际上相当于ReLU梯度的分段表示，当乘以upstream梯度时，它会将小于0的所有值压缩为0！

正如我们在这里看到的那样，通过我们对微积分的基本理解，我们可以清楚地思考代码。可以在此处找到此神经网络实现的完整示例。

为构建机器学习产品的数学

为了写这部分，我与机器学习工程师进行了交谈，以确定数学在调试系统时最有帮助的地方。以下是工程师自己回答的数学在机器学习中的问题。希望你能从中发现一些有价值的问题。

问：我应该使用什么样的聚类方法来可视化高维客户数据？

方法：PCA与tSNE

问：我应该如何校准“阻止”欺诈性用户交易的阈值？

方法：概率校准

通常，统计和线性代数可以以某种方式用于这些问题中的每一个。但是，要获得满意的答案通常需要针对特定领域的方法。如果是这样的话，你如何缩小你需要学习的数学类型？

定义你的系统

市场上有很多资源（例如，数据分析的scikit-learn，深度学习的keras）它们将帮助你跳转编写代码来为你的系统建模。在你打算这样做的时候，尝试回答以下有关你需要构建管道的问题：

1.你系统的输入/输出是什么？

2.你应该如何准备数据以适合你的系统？

3.如何构建特征或策划数据以帮助你的模型进行概括？

4.你如何为你的问题定义合理的目标？

你可能会感到惊讶，定义一个系统竟然需要处理那么多问题！之后，管道建设所需的工程也是非常重要的。换句话说，构建机器学习产品需要大量繁重的工作，不需要深入的数学背景。

资源

• Google的研究科学家Martin Zinkevich 为ML工程提供的最佳实践

需要什么数学知识就需要什么！

当你的头脑中完全进入到机器学习工作流程时，你可能会发现有一些步骤会被卡住，特别是在调试时。当你被困住时，你知道要查找什么吗？你的权重是否合理？为什么你的模型不能与特定的损失定义融合？衡量成功的正确方法是什么？此时，对数据进行假设，以不同方式约束优化或尝试不同的算法可能会有所帮助。

通常，你会发现建模/调试过程中存在数学直觉（例如，选择损失函数或评估指标），这些直觉可能有助于做出明智的工程决策。这些都是你学习的机会！来自Fast.ai的 Rachel Thomas 是这种“按需”学习方法的支持者。

资源：

•课程：计算线性代数 by fast.ai ；

•YouTube：3blue1brown：线性代数和微积分的本质；

•教科书：线性代数，Axler；

•教科书：Tibshirani等人的统计学习元素；

•课程：斯坦福大学的CS229（机器学习）课程笔记。

数学用于机器学习研究

我现在想要描述对于机器学习中以研究为导向的工作有用的数学思维方式。机器学习研究的观点指向即插即用系统，在这些系统中，模型会投入更多计算以训练出更高的性能。在某些圈子里，研究人员仍然怀疑缺乏数学严谨性的方法可以将我们带入人类智慧的圣杯。

值得关注的是，研究人员需要提供原始资源，例如新的基础构建模块，可用于获取全新的洞察力和实地目标的方法。这可能意味着重新思考用于图像分类的卷积神经网络等基础模块，正如Geoff Hinton在他最近的Capsule Networks 论文中所做的那样。

为了实现机器学习的下一步，我们需要提出基本问题。这需要深度数学成熟，因为整个过程涉及数千小时的“卡住”，提出问题，并在追求新问题时翻转问题观点。“有趣的探索”使科学家们能够提出深刻，富有洞察力的问题，而不仅仅是简单的想法/架构的结合。

ML研究是一个非常丰富的研究领域，在公平性、可解释性和可访问性方面都存在紧迫问题。越来越多的研究者希望从数学的角度来解决这些问题，而非辩证性的去看待问题。

以上为译文。

本文由阿里云云栖社区组织翻译。

文章原标题《learning-math-for-machine-learning》，

作者：Vincent Chen 译者：虎说八道，审校：。

机器学习数学

dustinsea

0 关注 0 粉丝 0 动态

相关推荐

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 2020-11-19

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 5评论 2020-11-19

机器学习新风暴：如何用ML模型预测房价？

从驾驶汽车到识别语音+翻译，机器学习通过软件预测变幻莫测的现实世界，正在人工智能领域掀起一场风暴。机器学习是教计算机系统使用反馈的旧数据进行预测的过程，基本上是训练计算机根据过去的数据预测未来的数据。机器学习大致分为两大类：监督学习和无监督学习。对此可以使

81510295 2020-11-17

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 5评论 2020-11-17

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 12评论 2020-11-16

LinkedIn开源Dagli，发布Java机器学习函数库

近年来，越来越多的优秀的机器学习工具不断涌现，如 TensorFlow、 PyTorch、 Caffee 和 CNTK、用于大规模数据的 Spark 和 Kubeflow，以及用于各种通用模型的 scikit-learn、 ML.NET 和最近的 Trip

lgblove 2020-11-16

关于机器学习算法的16个技巧

您可能听说过瑞士军刀。如果没有，请看下面的图片。它包含许多刀片和工具。每个人都专门从事一项特定的任务。在某些情况下，不同的刀片可以完成相同的任务，但性能不同。我将机器学习算法视为瑞士军刀。性能可能会根据任务和数据的特征而变化。例如，对数损失是与所有分类算法

Pokemogo 8评论 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 12评论 2020-11-16

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 12评论 2020-11-13

需要知识的后深度学习时代，如何高效自动构建知识图谱

前沿的知识图谱自动构建技术有哪些？这篇文章将逐一解答这些问题。二者展示的信息量是差不多的，但右边这种看起来更加直观。而且，随着文本篇幅的增长，这种优势会体现得更加明显。其中，图的节点代表现实世界中存在的“实体”，图的边则代表实体之间的“关系”。基于知识图谱

lizhengjava 12评论 2020-11-13

10个丰富自我的机器学习项目

机器学习项目有很大的发展潜力，最近大火的韩剧也出现了这个词语并且用很浪漫的说法解释了它。毕竟招聘者一般通过你拥有的技能来判断你的潜力。此外，确保所有数据集都呈现开放状态允许自由访问。很多机器学习课程将这个数据运用于教学目的，它可以预测人类的活动类别，这是一

ohbxiaoxin 6评论 2020-11-13

机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。金融科技初创厂商是智能手机、大数据、机器学习、区块链等新技术的早期采用者，被认为是被更传统的银行和金融机构所效仿的潮流引领者。机器学习和深度学习的最新进展确实推动了计算机视觉和自然语言处理的界限。Sta

Icevivian 8评论 2020-11-13

24个提高知识和技能极限的机器学习项目

数据科学项目为你提供了一种有前途的方式来启动你在该领域的职业。你不仅可以通过应用它来学习数据科学，还可以在自己的简历上展示一些项目！这是大多数人挣扎和错过的地方。另外，我们确保所有数据集都是开放的并且可以自由访问。它由中型和大型数据集组成，需要一些认真的模

EchoYY 12评论 2020-11-12

IT自动化和人工智能将在2021年走向何方？

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

CSDN人工智能头条 5评论 2020-11-11

无监督机器学习的重要指南

人们如今正处在数字化转型时代，只有一个不变的因素——进化。而组织采用的高科技解决方案正在引入数字化转型。因此，毫不奇怪的是，技术进步已完全取代了平凡的业务。因此，人们需要了解无监督机器学习在各行业中的广泛应用。如果用户标记了可以作为示例的训练数据，人们将其

mogigo00 5评论 2020-11-11

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

在数据领域，很多人都在说机器学习，但是只有很少的人能说清楚怎么回事。网上关于机器学习的文章，大多都是充斥各种定理的厚重学术三部曲，或是关于人工智能、数据科学魔法以及未来工作的天花乱坠的故事。尽管数据分析实际工作中用到机器学习的机会真的不多，但我觉得它仍是数

jaybeat 8评论 2020-11-10

理解AI：为什么要在人工智能系统中寻求可解释性呢？

本文转载自公众号“读芯术”。或许这是你第一次听到人工智能前面加“可解释的”这个形容词，但其实它的涵义你一定能理解。可解释的人工智能是指构建AI应用程序的技术和方法，人们借此以理解它们做出特定决策的原因。换句话说，如果我们可以从AI系统获得有关其内部逻辑的解

白飞飞Alan 2020-11-11

机器学习的未来就在这里：高斯过程和神经网络是等价的

高斯进程已经存在了一段时间，但它只是在过去5-10年，有一个大的复苏，其兴趣。部分原因是求解的计算复杂：由于他们的模型需要矩阵反转，复杂性是 O，很难更快地获得。高斯过程最酷的特征之一是它们非常非常相似的神经网络。中央极限定理可以统一明显复杂的现象，在这

lemonade 12评论 2020-11-10

Python 用5行代码学机器学习—线性回归

我准备使用scikit-learn给大家介绍一些模型的基础知识，今天就来讲讲线性回归模型。开始之前，你要确保Python和pip已经成功安装在电脑上噢，如果没有，请访问这篇文章：超详细Python安装指南进行安装。如果你用Python的目的是数据分析，

机器学习之家 2020-11-10

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 15评论 2020-11-09

dustinsea

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号