比较：Tensorflow中实现稀疏编码的不同方法

ghjk0

2018-08-14

关注关注

点击上方关注，All in AI中国

作者：Jae Duk Seo

比较：Tensorflow中实现稀疏编码的不同方法

我一直在研究稀疏编码和实现它的不同方法，在这篇文章中，我会比较它们，以下是详细的情况。

案例a：纯自动编码
案例b：具有L2正则化的自动编码器
案例c：吴恩达课程中的稀疏自动编码器
案例d：用于稀疏编码的简单、高效和神经算法
案例e：k-Sparse 自编码器

比较：Tensorflow中实现稀疏编码的不同方法

论文地址：https://arxiv.org/pdf/1503.00778.pdf

比较：Tensorflow中实现稀疏编码的不同方法

论文地址：https://arxiv.org/pdf/1312.5663.pdf

简介、数据集和一般理念

本文已经假设读者对神经网络和自编码器有一定的了解，所以我不会详细介绍。另外，我将仅介绍使用自动编码器进行稀疏编码的方法。请记住，超参数设置相同，但并不能保证它在每种情况下都是最佳的！最后，我使用的所有数据都来自MNIST数据集。

比较：Tensorflow中实现稀疏编码的不同方法

橙色框→矢量形式的原始数据

红盒→压缩数据

蓝盒→重建数据

自编码器的一般思想非常简单，即在压缩后重建原始数据。我们在今天的帖子中要看到的是学习权重（橙色框和红框之间的权重），因为这些权重代表我们捕获的数据（或特征）。

案例a：纯自编码器的结果

比较：Tensorflow中实现稀疏编码的不同方法

500 epoch学习权重的进展

从上面的进展中，我们可以注意到一些事情，学到的权重（或特征）并不特定于某些数字。这是因为由于网络可以使用学习字典中的所有原子来重建原始数据，因此不需要为给定数据学习专门的过滤器。

比较：Tensorflow中实现稀疏编码的不同方法

上图→原始数据

下图→重构数据

重构数据有点模糊，但通常它包含数字的正确形状。

比较：Tensorflow中实现稀疏编码的不同方法

上图→具有对比度归一化的学习权重

中间图像→没有对比度的学习权重归一化

正确的图像→训练期间的成本

当我们再次查看学习的权重时，我们可以再次观察到过滤器不是特定于某些数字。

案例b的结果：具有L2正则化的自编码器

比较：Tensorflow中实现稀疏编码的不同方法

当我们将L2正则化添加到原始自动编码器时，我们看不到学习权重之间的极端差异。这很自然，因为在重建原始数据时，网络仍然可以完全访问字典中的所有原子。

比较：Tensorflow中实现稀疏编码的不同方法

上图→原始数据

下图→重构数据

同样，与纯自编码器类似，重构数据模糊但仍保留一般的形状。

比较：Tensorflow中实现稀疏编码的不同方法

上图→具有对比度归一化的学习权重

中间图像→没有对比度的学习权重归一化

正确的图像→训练期间的成本

我们仍然看不到特定于某些数字的过滤器。

案例c的结果：来自吴恩达课程的稀疏自动编码器

比较：Tensorflow中实现稀疏编码的不同方法

当我们在隐藏层中引入稀疏性概念时，并非字典中的所有原子都可以使用。我们可以清楚地观察到，所学习的滤波器对某些数字变得更加具体，并且在最后epoch之后，滤波器代表了一个数字的笔划。

比较：Tensorflow中实现稀疏编码的不同方法

上图→原始数据

下图→重构数据

我个人认为，重构的数据比其他两个（上图）更模糊，但它们清晰可辨。

比较：Tensorflow中实现稀疏编码的不同方法

上图→具有对比度归一化的学习权重

中间图像→没有对比度的学习权重归一化

正确的图像→训练期间的成本

当我们可视化学习的权重时，我们可以看到网络正在尝试从给定数据中提取不同的笔画。

案例d的结果：用于稀疏编码的简单、高效和神经算法

比较：Tensorflow中实现稀疏编码的不同方法

如果没有重构损失函数进行优化，我们可以观察到收敛需要更长的时间。然而，我们可以观察到，如果要使用字典中的某个原子，它会产生类似于我们有稀疏概念时的过滤。（案例c）

比较：Tensorflow中实现稀疏编码的不同方法

上图→原始数据

下图→重建数据

这种方法的一个缺点是没有重建损失，虽然它产生了更清洁的滤波器，但它不能重构原始数据以及其他方法。

比较：Tensorflow中实现稀疏编码的不同方法

上图→具有对比度归一化的学习权重

中间图像→没有对比度的学习权重归一化

正确的图像→训练期间的成本

当我们可视化学习的权重时，我们可以看到这种方法的优点，即它可以生成更清晰的过滤器。

案例e的结果：k-Sparse 自编码

比较：Tensorflow中实现稀疏编码的不同方法

对于给定的数据，顶级K稀疏自编码器在汇聚到最优点时要快得多。我们可以观察到，学习的权重是干净的，同时捕捉到笔划的特征。

比较：Tensorflow中实现稀疏编码的不同方法

上图→原始数据

下图→重构数据

由于存在重建误差，与情况d相比，重构数据更清晰，但是，我们可以清楚地观察到它在这里和那里缺乏对比度的事实。

比较：Tensorflow中实现稀疏编码的不同方法

上图→具有对比度归一化的学习权重

中间图像→没有对比度的学习权重归一化

正确的图像→训练期间的成本

同样，学习过滤器在捕获笔画类型功能时更加清晰。

互动代码

比较：Tensorflow中实现稀疏编码的不同方法

如欲取得案例a的代码，请点击。

（https://colab.research.google.com/drive/15vST8Gma0uyQa1DOwO5weUWQ-I55FQoG）

请按此进入案例b的代码。

（https://colab.research.google.com/drive/1m2IfnKFdXN5KMOvDMfFSj4vc94kcch73）

请按此进入案例c的代码。

（https://colab.research.google.com/drive/1-OHYBSYxsQ0dYRvq5wzzBhzlQRs2p169）

请按此进入案例d的代码。

（https://colab.research.google.com/drive/1HtXdq6hcX2rbywjl8I1BnLmelXy7P2sZ）

如欲取得个案e的代码，请按此。

（https://colab.research.google.com/drive/1J6cTgJnUXi64ndOx7X_1eoiStGzpt4fU）

比较：Tensorflow中实现稀疏编码的不同方法

tensorflow 稀疏编码

ghjk0

0 关注 0 粉丝 0 动态

关注关注

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 2020-11-19

如何在PyTorch和TensorFlow中训练图像分类模型

图像分类是计算机视觉的最重要应用之一。它的应用范围包括从自动驾驶汽车中的物体分类到医疗行业中的血细胞识别，从制造业中的缺陷物品识别到建立可以对戴口罩与否的人进行分类的系统。他们是如何做到的呢？你必须已阅读很多有关不同深度学习框架之间差异的信息。Tensor

xjtukuixing 2020-10-27

对比PyTorch和TensorFlow的自动差异和动态模型

使用自定义模型类从头开始训练线性回归，比较PyTorch 1.x和TensorFlow 2.x之间的自动差异和动态模型子类化方法，这篇简短的文章重点介绍如何在PyTorch 1.x和TensorFlow 2.x中分别使用带有模块/模型API的动态子类化模型

lybbb 2020-10-15

现在知道还不算晚，输入示例自动生成代码，谷歌开源这项神器要火

操作张量并非易事，因为它需要很多先决条件，例如跟踪多个维度，Dtype兼容性，数学正确性和张量形状等。当然最大的挑战还是从数百种可用选项中确定正确的TensorFlow操作。如果会的话，谷歌的TensorFlow Coder可以帮你实现这一点。然后，它会运

lybbb 2020-09-29

TensorFlow推出新接口，简化 ML移动端开发流程

在移动设备上使用 TensorFlow Lite 模型运行推理不仅仅是与模型交互，还需要额外的代码来处理复杂的逻辑，如数据转换、预处理/后处理、加载关联文件等。今天，我们将为大家介绍TensorFlow Lite Task Library，这是一组功能强大

ghjk0 2020-09-24

如何在浏览器中使用TensorFlow？

TensorFlow 2.0引入的创新之一是JavaScript实现：TensorFlow.js。我没料到这会加快训练或推理速度，但确实如此，它通过WebGL API支持所有的GPU。TensorFlow.js是一个库，用于使用JavaScript开发

yamaxifeng 2020-09-09

2020年深度学习框架对比速读

TensorFlow于2015年11月面世，基于Apache License 2.0协议发布，由Google Brain团队研发。到目前为止也是github上热度最高、使用人数最多的深度学习框架，业界很多招聘要求中也提到了它。2019年3月推出Tenso

GDGYZL 2020-08-28

输入示例，自动生成代码：TensorFlow官方工具TF-Coder已开源

如何使编程更加便捷？最近，谷歌 TensorFlow 开源了一个帮助开发者写 TensorFlow 代码的程序合成工具 TF-Coder。用过 TensorFlow 框架的应该都知道，在操纵张量时，需要跟踪多个维度、张量形状和数据类型兼容性，当然还需要考虑

lybbb 2020-08-28

TensorFlow Lattice：灵活、可控、可解释的机器学习

本文转自雷锋网，如需转载请至雷锋网官网申请授权。大多数的机器学习实践者都曾遇到过训练数据和实际运行时用以评估模型的样本差别很大的情况。因此，相对灵活的机器学习解决方案，如DNN和随机森林等，仅依赖于训练数据的模型，在训练数据集和验证数据集没有覆盖的输入空间

Icevivian 2020-08-25

TensorFlow 2入门指南，初学者必备！

TensorFlow是谷歌推出的深度学习框架，于2019年发布了第二版。它是世界上最著名的深度学习框架之一，被行业专家和研究人员广泛使用。Tensorflow v1难以使用和理解，因为它的Pythonic较少，但是随着Keras发行的v2现在与Tenso

comwayLi 2020-08-16

使用tensorflow进行音乐类型的分类

音乐流媒体服务的兴起使得音乐无处不在。我们在上下班的时候听音乐，锻炼身体，工作或者只是放松一下。这些数据可能来自出版歌曲的人手工标注。但这并不是一个很好的划分，因为可能是一些艺人想利用一个特定流派的流行趋势。在描述了所使用的数据源之后，我对我们使用的方法及

carbon0 2020-08-16

【tensorflow】常量和变量的定义

data1 = tf.constant # 声明常量。data2 = tf.Variable # 声明变量。print # 打印数据的

源式羽语 2020-08-09

如何在tensorflow中判断tensor(张量)的值

众所周知，在tensorflow程序中，tensor只是占位符，在会话层没有run出tensor的值之前，我们是无法获知tensor的值的。也就是说，下面的逻辑是无法实现的：。#a is a 1-D tensor, b is a 1-D tensor to

sherry颖 2020-08-01

TensorFlow会话常用的两种方式

需要注意的是我们可以使用两种方法来创建并使用session. 我们计算WX+b，其中W，X和b是从随机正态分布中抽取的。我们开始定义一个shape=（3,1）的常量X：。实现一个线性功能：。初始化X，类型为tensor的随机变量，维度为(3,1). res

songbinxu 2020-07-19

Ｍnist手写数字识别 Tensorflow

MNIST 数据集来自美国国家标准与技术研究所, National Institute of Standards and Technology . 训练集由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局的

sherry颖 2020-07-18

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

每个在自定义层中使用Keras函数式API的用户都要注意了！使用用Keras的Functional API创建的权重，可能会丢失。这一话题在Reddit机器学习板块上被热议，引起不少TensorFlow用户共鸣。也就是说，原本需要训练的权重现在被冻结了。让

Niteowl 2020-07-15

TensorFlow中超大的30个机器学习数据集

由谷歌Brain的研究人员创建的TensorFlow是机器学习和数据科学领域最大的开源数据库之一。它是一个端到端的平台，适用于初学者和有经验的数据科学家。TensorFlow库包括工具、预训练模型、机器学习指南，以及开放数据集的语料库。为了帮助你找到所需的

Kindle君 2020-07-15

解决import tensorflow报错：ImportError: DLL load failed: 找不到指定的模块

将visual c++ 升级到2019版本。安装完之后，即可解决该问题。

源式羽语 2020-07-04

Yolo v3 Introduction to object detection with TensorFlow 2

https://medium.com/analytics-vidhya/yolo-v3-introduction-to-object-detection-with-tensorflow-2-ce75749b1c47

源式羽语 2020-06-28

Sklearn 与 TensorFlow 机器学习实用指南第二版

十六、使用 RNN 和注意力机制进行自然语言处理

卖小孩的咖啡 2020-06-28

安科网

比较：Tensorflow中实现稀疏编码的不同方法

ghjk0

ghjk0

相关推荐

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

如何在PyTorch和TensorFlow中训练图像分类模型

对比PyTorch和TensorFlow的自动差异和动态模型

现在知道还不算晚，输入示例自动生成代码，谷歌开源这项神器要火

TensorFlow推出新接口，简化 ML移动端开发流程

如何在浏览器中使用TensorFlow？

2020年深度学习框架对比速读

输入示例，自动生成代码：TensorFlow官方工具TF-Coder已开源

TensorFlow Lattice：灵活、可控、可解释的机器学习

TensorFlow 2入门指南，初学者必备！

使用tensorflow进行音乐类型的分类

【tensorflow】常量和变量的定义

如何在tensorflow中判断tensor(张量)的值

TensorFlow会话常用的两种方式

Ｍnist手写数字识别 Tensorflow

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

TensorFlow中超大的30个机器学习数据集

解决import tensorflow报错：ImportError: DLL load failed: 找不到指定的模块

Yolo v3 Introduction to object detection with TensorFlow 2

Sklearn 与 TensorFlow 机器学习实用指南第二版

ghjk0