1.2：无监督学习导学

playoffs

2020-02-02

无监督学习的目标：

利用无标签的数据学习数据的分部或数据与数据之间的关系被称作无监督学习。

无监督学习最常应用的场景是聚类和降维。

聚类（sklearn.cluster模块）

定义

聚类(clustering)，就是根据数据的“相似性”将数据分为多类的过程。
评估两个不同样本之间的“相似性” ，通常使用的方法就是计算两个样本之间的“距离”。使用不同的方法计算样本间的距离会关系到聚类结果的好坏。
什么样的数据是相似的，如何定义相似性，是很多机器学习任务的基本问题。

常用距离计算方法

1.2：无监督学习导学 ?

1.2：无监督学习导学 ?

1.2：无监督学习导学

s:协方差矩阵

马氏距离：红黑>绿黑

欧氏距离：红黑<绿

1.2：无监督学习导学

sklearn.cluster模块输入数据形式

标准数据输入格式:[样本个数，特征个数]定义的矩阵形式。

相似性矩阵输入格式：即由[样本数目，样本数目]定义的矩阵形式，矩阵中

的每一个元素为两个样本的相似度，如DBSCAN， AffinityPropagation(近邻传

播算法)接受这种输入。如果以余弦相似度为例，则对角线元素全为1. 矩阵中每

个元素的取值范围为[0,1]

1.2：无监督学习导学

降维（sklearn.decomposition模块）

定义

降维，就是在保证数据所具有的代表性特性或者分布的情况下，将高维数据转化为低维数据的过程。

目的：

数据的可视化
精简数据（提高其它机器学习算法效率）

聚类 vs.降维

聚类和降维都是无监督学习的典型任务，任务之间存在关联，比如某些高维数据的聚类可以通过降维处理更好的获得，另外学界研究也表明代表性的聚类算法如k-means与降维算法如NMF之间存在等价性。

sklearn vs.降维

降维是机器学习领域的一个重要研究内容，有很多被工业界和学术界接受的典型算法，截止到目前sklearn库提供7种降维算法。
降维过程也可以被理解为对数据集的组成成份进行分解（decomposition）的过程，因此sklearn为降维模块命名为decomposition, 在对降维算法调用需要使用sklearn.decomposition模块

1.2：无监督学习导学

无监督学习矩阵机器学习

playoffs

0 关注 0 粉丝 0 动态

相关推荐

无监督机器学习的重要指南

人们如今正处在数字化转型时代，只有一个不变的因素——进化。而组织采用的高科技解决方案正在引入数字化转型。因此，毫不奇怪的是，技术进步已完全取代了平凡的业务。因此，人们需要了解无监督机器学习在各行业中的广泛应用。如果用户标记了可以作为示例的训练数据，人们将其

mogigo00 2020-11-11

73岁Hinton老爷子构思下一代神经网络：属于无监督对比学习

在近期举行的第 43 届国际信息检索年会上，Geoffrey Hinton 做了主题为《The Next Generation of Neural Networks》的报告。Geoffrey Hinton 是谷歌副总裁、工程研究员，也是 Vector

白飞飞Alan 2020-07-29

有了K均值聚类，为什么还需要DBSCAN聚类算法？

聚类本文转载自公众号“读芯术”分析是一种无监督学习法，它将数据点分离成若干个特定的群或组，使得在某种意义上同一组中的数据点具有相似的性质，不同组中的数据点具有不同的性质。聚类分析包括基于不同距离度量的多种不同方法。2014年，DBSCAN算法在领先的数据挖

只能做防骑 2020-05-13

无监督、弱监督、半监督、强化、多示例学习是什么

什么是监督学习、无监督学习、强化学习、弱监督学习、半监督学习、多示例学习？随着机器学习问题不断深入人心，人们也将现实中遇到不同的问题分为不同的学习方式，其中，最基础的应属监督学习，无监督学习和强化学习了。

83153251 2020-02-14

【机器学习】机器学习入门08 - 聚类与聚类算法K-Means

时间过得很快，这篇文章已经是机器学习入门系列的最后一篇了。短短八周的时间里，虽然对机器学习并没有太多应用和熟悉的机会，但对于机器学习一些基本概念已经差不多有了一个提纲挈领的了解，如分类和回归，损失函数，以及一些简单的算法——kNN算法、决策树算法等。那么，

清溪算法 2019-12-23

无监督学习和监督学习的区别

监督学习的训练集不仅要有输入还要有输出，即目标特征和目标结果，特征就是训练集中数据特有的，结果是人为标记的。

kingzone 2019-12-14

使用高斯混合模型，让聚类更好更精确（附数据&代码&学习资源）

本文约3500字，建议阅读10+分钟。本文简单介绍聚类的基础知识，包括快速回顾K-means算法，然后深入研究高斯混合模型的概念，并用Python实现。无监督学习中最流行的技术之一是聚类，这通常我们在早期学习机器学习时学习的概念，而且很容易掌握。我相信你已

moshlwx 2019-11-15

要隐私还是要智能？无监督学习能带来二者的统一吗？

获取用户数据的方式即将被改变，数据“多即是好”的时代终将过去，用尽可能少的数据构建性能更好的模型才是大势所趋。如果没有无监督学习，机器学习模型会逐个分析用户数据以预测其行为，这不仅过多地暴露了个体用户信息而且会到导致学习任务极其繁重。金融从业人员立即意识到

dingyanming 2019-11-15

干货 | 全面理解无监督学习基础知识

无监督学习的特点是，模型学习的数据没有标签，因此无监督学习的目标是通过对这些无标签样本的学习来揭示数据的内在特性及规律，其代表就是聚类。与监督学习相比，监督学习是按照给定的标准进行学习，而无监督学习则是按照数据的相对标准进行学习。但如果小时候没人教你区别猫

junjie0000 2019-03-29

GAN用于无监督表征学习，效果依然惊人……

无所不能的 GAN 又攻占了一个山头。近年来，GAN 在图像合成领域取得了惊人的成果，例如先前 DeepMind 提出的 BigGAN。近日，DeepMind 提出全新的 BigBiGAN，引起了社区极大的关注。该论文提出的方法建立在 SOTA 模型 Bi

duyue0 2019-07-09

GAN用于无监督表征学习，效果依然惊人……

无所不能的 GAN 又攻占了一个山头。近年来，GAN 在图像合成领域取得了惊人的成果，例如先前 DeepMind 提出的 BigGAN。近日，DeepMind 提出全新的 BigBiGAN，引起了社区极大的关注。该论文提出的方法建立在 SOTA 模型 B

人家 2019-07-10

BigBiGAN问世，“GAN父”都说酷的无监督表示学习模型有多优秀？

尽管基于GAN的无监督学习方法取得了初步成果，但很快被自监督学习方法所取代。DeepMind近日发布了一篇论文《Large Scale Adversarial Representation Learning》，提出了无监督表示学习新模型BigBiGAN。作

guangmang 2019-07-09

1.ML笔记——定义、监督学习和无监督学习的定义

Arther Samuel:Machine Learning:Field fo study that gives computers the ability to learn without being explicitly programmed.Tom

五小郎的学习笔记 2019-06-30

Python数据挖掘与机器学习，快速掌握聚类算法和关联分析

聚类方法应在怎样的场景下使用？如何使用关联分析算法解决个性化推荐问题？本文就为大家揭晓答案。本次直播视频精彩回顾，戳这里！以下内容根据演讲嘉宾视频分享以及PPT整理而成。

ZweixunSJTU 2019-06-27

来一波回忆杀，用精灵宝可梦教你弄懂无监督学习

算法是如何学习《精灵宝可梦》，哪些不值得获得你的高级球在我写了一篇关于《权力的游戏》的文章之后发给我母亲，但是她看不懂，问我是否可以写一篇关于精灵宝可梦的文章不？于是，在本周在我项目训练的最后一周决定开始研究什么内容，于是，我开始搜索关于它的数据集。由此，

自然语言处理技术 2019-06-19

拥有解耦表征无监督学习是不可能的！硬核ICML 2019最佳论文出炉

机器学习顶级会议ICML 2019已于6月9日在美国加州开幕。本届大会共收到3424篇论文投稿，其中774篇被接收。今日，大会放出了最佳论文。今年有两支团队收获了最佳论文的奖项，来自剑桥大学、科技公司 PROWLER.io 的《Rates of Conve

Sigh 2019-06-12

一个完整的K-means聚类算法指南！

假设您想根据内容和主题对数百（或数千）个文档进行分类，或者您希望出于某种原因将不同的图像组合在一起。目标是获得尽可能相似的同一组中的数据点，并使不同组中的数据点尽可能不相似。K-means非常适合探索性分析，非常适合了解您的数据并提供几乎所有数据类型的见解

风吹夏天 2019-05-21

机器学习系列 1：监督学习和无监督学习

机器学习就是通过一大堆数据集训练一个电脑程序让他能够去更加准确地预测出下一次的结果。机器学习算法分为两大类，监督学习和无监督学习。监督学习又分为两类，「回归问题」和「分类问题」。判断一封邮件是否为垃圾邮件的过程就是解决「分类问题」的过程。「回归问题」与「分

weijinqian0 2019-05-15

语义表征的无监督对比学习：一个新理论框架

诸如图像、文本、视频等复杂数据类型的语义表征已成为机器学习的核心问题，并在机器翻译、语言模型、GAN、域迁移等领域中出现。这些都会涉及学习表征函数，即每个数据点的表征信息都是“高级别” 和“紧凑“ (低维)。衡量语义表征好坏的一个标准是，它能够通过少

FZUrxd 2019-03-29

李航《统计学习方法》第二版：6年耕耘增加无监督学习

本书从监督学习和无监督学习两大块出发，带你一步步掌握传统机器学习概念。[ 导读 ]统计学习即机器学习，是计算机及其应用领域的一门重要学科。此前，李航老师完成的《统计学习方法》是了解机器学习最好的教材之一，该书从 2005 年开始写作一直到 2012 年完成

小白将 2019-05-13

playoffs

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号