机器学习（一）—监督学习（Supervised learning）

yangzzguang

2019-09-08

原文：http://cs229.stanford.edu/not...
让我们从几个有监督的学习问题的例子开始。假设我们有一个数据集，显示来自俄勒冈州波特兰的47个住宅的起居面积和价格：

Living area(feet^2)    Price(1000s)
2014                    400
1600                    330
2400                    369
1416                    232
3000                    540
...                     ...

我们可以绘制这些数据：

机器学习（一）—监督学习（Supervised learning）

鉴于这样的数据，我们怎样针对他们居住面积的大小来预测波特兰其他房屋的价格？

$$ 在这里我们先规定一下符号和定义，它们在将来还会用到。我们将使用x^{(i)} 来表示输入input变量$$

$$（在这个例子中就是房屋的面积），这也被称作输入的特征（feature）。使用y^{(i)}来表示输出output或者$$

$$目标变量，即我们想要去预测的值（这个例子中是指价格）。我们用来学习的数据集是含有m个训练样本$$

$$\left \{ \left ( x^{(i)},y^{(i)};i=1,\cdots ,m \right ) \right \}的列表——被称作是训练集（training set）。注意上标(i)在符号表示中只是$$

$$训练集的索引（index）记号，与数学中的求幂无关。另外我们使用X来表示输入值的空间，使用Y来表示输出值$$

$$的空间。在这个例子中，输入和输出空间都是实数域，即X=Y=R。$$

$$接下来对监督学习问题给出一个更加正式的描述：我们的目标是，给定一个训练集，通过训练得到一个函数$$

$$h:X\rightarrow Y，使得h(x)对于y的真实值而言是一个好的预测结果。由于历史的原因，函数h被称为假设$$

$$（hypothesis）。如下图所示，整个过程是是这样的：$$

机器学习（一）—监督学习（Supervised learning）

当我们试图预测的目标变量是连续（continuous）的，就像我们的房屋面积-价格的例子一样，这样的学习问题被称为回归（regression）问题。当 y 只能取一小部分离散（discrete）值时（比如给定房屋面积，我们要来确定这个房子是一个住宅还是公寓），这样的学习问题被称为分类（classification）问题。

机器学习监督学习

安科网

机器学习（一）—监督学习（Supervised learning）

yangzzguang

yangzzguang

相关推荐

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

如何通过7个步骤构建机器学习模型

机器学习新风暴：如何用ML模型预测房价？

关于机器学习管道需要了解什么?

为什么所有的机器学习模型有90％从没有投入生产

LinkedIn开源Dagli，发布Java机器学习函数库

关于机器学习算法的16个技巧

全面解读谷歌云人工智能如何为机器学习提供帮助

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

需要知识的后深度学习时代，如何高效自动构建知识图谱

10个丰富自我的机器学习项目

机器学习如何颠覆金融行业

24个提高知识和技能极限的机器学习项目

IT自动化和人工智能将在2021年走向何方？

无监督机器学习的重要指南

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

理解AI：为什么要在人工智能系统中寻求可解释性呢？

机器学习的未来就在这里：高斯过程和神经网络是等价的

Python 用5行代码学机器学习—线性回归

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

yangzzguang