监督学习与非监督学习

1、监督学习

是有特征和标签的,即便是没有标签的,机器也是可以通过特征和标签之间的关系,判断出标签。监督学习是通过训练让机器自己找到特征和标签之间的联系,在以后面对只有特征而没有标签的数据时可以自己判别出标签。相当于给定数据,预测标签。
常见的有监督学习算法:回归分析和统计分类。


2、非监督学习

由于训练数据中只有特征没有标签,所以就需要自己对数据进行聚类分析,然后就可以通过聚类的方式从数据中提取一个特殊的结构。输入的数据没有标记,也没有确定的结果,只有特征,没有标签。
无监督学习的方法分为两大类:
(1)    一类为基于概率密度函数估计的直接方法:指设法找到各类别在特征空间的分布参数,再进行分类。
(2)    另一类是称为基于样本间相似性度量的简洁聚类方法:其原理是设法定出不同类别的核心或初始内核,然后依据样本与核心之间的相似性度量将样本聚集成不同的类别。


3、区别

两者的根本区别是训练数据中是否有标签,监督学习的数据既有特征又有标签,而非监督学习的数据中只有特征而没有标签。

相关推荐