带你读论文：基于深度学习的图像分类中数据增强的有效性

ynsshzwxhzyx

2018-05-23

摘要

带你读论文：基于深度学习的图像分类中数据增强的有效性

本文旨在研究数据扩充的有效性。它将通过使用传统数据扩充技术(比如裁剪、旋转)或者现代意义上讲的GAN(CycleGAN)。

导言

带你读论文：基于深度学习的图像分类中数据增强的有效性

在这一部分，作者指出神经网络可以从数据中获益。他还举了一个例子，用来说明谷歌语料库的发布如何基于文本的模型受益。作者并以此提出了一个有趣的观点，大量的非结构化数据出现的任务就是寻找一个模式。当然，我们可以采取另一种方法，就是我们对一组小的结构化数据进行数据扩充。最后，作者介绍了他们将要进行的实验数据集。如MNIST、和小图象网数据。

相关工作

带你读论文：基于深度学习的图像分类中数据增强的有效性

在这一节中，作者回顾了一些常用的防止过度拟合的方法。介绍了增加正则化项、退出、批量归一化和迁移学习等方法。此外，作者给出了数据增强技术的简单描述，如几何或色彩增强。(主要是仿射变换)。以及如何训练GAN的基本描述。

方法

带你读论文：基于深度学习的图像分类中数据增强的有效性

这是它非常有趣的地方，作者将采取两种不同的方法。

a)在训练分类器之前进行数据扩充(使用GAN或仿射变换)

b)在分类器网络中使用预先的神经网络来实时扩充数据。

带你读论文：基于深度学习的图像分类中数据增强的有效性

带你读论文：基于深度学习的图像分类中数据增强的有效性

作者将使用传统的扩充技术或CycleGAN(样式传输)来执行数据扩充。（见下文）

最后，对于增强网络的需求，他们创建了一个小型的5 CNN网络，n并使用各种损失函数来训练网络。1，内容损失2，风格缺失3 ，无损失。

数据集与特征

带你读论文：基于深度学习的图像分类中数据增强的有效性

作者对三个数据集进行了实验研究。（其中两个数据集来自小图像网络，第三个数据集来自MNIST数据集。）第一个数据集由狗/猫的图像组成，第二个数据集由狗/金鱼的图像组成。

实验

带你读论文：基于深度学习的图像分类中数据增强的有效性

本实验使用了两种网络，分别是分类网络(SmallNet)和增强网络(Augmentation Network)。这两个网络的网络架构如下所示。

带你读论文：基于深度学习的图像分类中数据增强的有效性

增强网络是通过是在同一个类连接两个图像(在它们的通道维度中)来创建额外的图像。(这是数据增强部分)。增强网络只在训练期间使用，而不是在测试期间使用，整个过程如下所示。

带你读论文：基于深度学习的图像分类中数据增强的有效性

最后要考虑的是损失函数，在图像增强后，作者引入了三种损失函数。(实际上是两个，因为最后的损失函数根本不是损失函数。)

带你读论文：基于深度学习的图像分类中数据增强的有效性

第一个损失是增强图像和目标图像之间的损失，其项D为增强图像和目标图像的长度。

带你读论文：基于深度学习的图像分类中数据增强的有效性

第二个损失是格拉姆矩阵在增强图像和目标图像之间的损失。如上所述，第三个损失函数是无损失函数的。

结果

带你读论文：基于深度学习的图像分类中数据增强的有效性

对于所有的数据集，他们执行不同类型的增强，并得到以下结果。

带你读论文：基于深度学习的图像分类中数据增强的有效性

我们可以假设在神经增强的情况下无损失函数，(控制方法是将相同的图像输入到增强网络中。)可以得到从增强网络生成的一些图像。

带你读论文：基于深度学习的图像分类中数据增强的有效性

作者指出，增强网络似乎从两幅图像中提取了一些关键特征，同时优化了背景像素。

带你读论文：基于深度学习的图像分类中数据增强的有效性

结论与发展潜力

作者指出，使用更复杂的网络进行分类和增强是值得的。并指出与传统的图像增强方法相比，GAN或神经增强具有较好的增强效果，且耗时较短。

论文地址：https://drive.google.com/viewerng/viewer?url=https://arxiv.org/pdf/1712.04621.pdf

机器学习深度学习图像深度

ynsshzwxhzyx

0 关注 0 粉丝 0 动态

相关推荐

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 2020-11-09

自动驾驶汽车深度学习如何应对挑战?

在自动驾驶汽车中使用深度学习可以帮助克服各种挑战，例如了解行人的行为，找到最短的路线以及对人和物体进行准确检测。根据一份报告，2018年约有80%的道路交通事故是由于人为错误造成的。因此，将自动驾驶汽车纳入主流的主要目标之一是消除对人类驾驶员的需求并减少道

86377811 2020-11-06

不要上手就学深度学习！超详细的人工智能专家路线图，GitHub数天获2.1k星

反过头来看，这些方法可能作用并不是很大，却消耗了大量的时间和金钱。如果你想成为数据科学家、机器学习或者 AI 专家，而又苦于找不到合适的学习方法，本文将提供一组思路清晰、简单易懂的人工智能专家路线图。这是一家德国软件公司 AMAI GmbH 近期发布的 G

Niteowl 2020-11-05

DJL 如何正确打开 [ 深度学习 ]

本文转载自微信公众号「小明菜市场」，作者小明菜市场。很长时间，Java都是一个相当受欢迎的企业编程语言，其框架丰富，生态完善。为了减少Java开发者学习深度学习的成本，AWS构建了一个Deep Java Library，一个为Java开发者定制的开源深度

ohbxiaoxin 2020-11-04

揭开AI、机器学习和深度学习的神秘面纱

深度学习、机器学习、人工智能——这些流行词皆代表了分析学的未来。在这篇文章中，我们将通过一些真实世界的案例来解释什么是机器学习和深度学习。这样做的目的不是要把你变成一个数据科学家，而是让你更好地理解你可以用机器学习做什么。开发人员能越来越容易地使用机器学习

bigquant 2020-11-03

用 Java 训练深度学习模型，原来可以这么简单！

HelloGitHub 推出的《讲解开源项目》系列。这一期是由亚马逊工程师：Keerthan Vasist，为我们讲解 DJL系列的第 4 篇。很长时间以来，Java 都是一个很受企业欢迎的编程语言。得益于丰富的生态以及完善维护的包和框架，Java 拥有着

PandaJiong 2020-11-02

面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。MLP使用一种称为反向传播的监督式学习技术进行训练。反向传播有助于调整神经元权重，以获得更接

fengzhimohan 2020-11-02

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 2020-11-19

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 2020-11-19

机器学习新风暴：如何用ML模型预测房价？

从驾驶汽车到识别语音+翻译，机器学习通过软件预测变幻莫测的现实世界，正在人工智能领域掀起一场风暴。机器学习是教计算机系统使用反馈的旧数据进行预测的过程，基本上是训练计算机根据过去的数据预测未来的数据。机器学习大致分为两大类：监督学习和无监督学习。对此可以使

81510295 2020-11-17

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 2020-11-17

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 2020-11-16

LinkedIn开源Dagli，发布Java机器学习函数库

近年来，越来越多的优秀的机器学习工具不断涌现，如 TensorFlow、 PyTorch、 Caffee 和 CNTK、用于大规模数据的 Spark 和 Kubeflow，以及用于各种通用模型的 scikit-learn、 ML.NET 和最近的 Trip

lgblove 2020-11-16

关于机器学习算法的16个技巧

您可能听说过瑞士军刀。如果没有，请看下面的图片。它包含许多刀片和工具。每个人都专门从事一项特定的任务。在某些情况下，不同的刀片可以完成相同的任务，但性能不同。我将机器学习算法视为瑞士军刀。性能可能会根据任务和数据的特征而变化。例如，对数损失是与所有分类算法

Pokemogo 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 2020-11-16

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 2020-11-13

需要知识的后深度学习时代，如何高效自动构建知识图谱

前沿的知识图谱自动构建技术有哪些？这篇文章将逐一解答这些问题。二者展示的信息量是差不多的，但右边这种看起来更加直观。而且，随着文本篇幅的增长，这种优势会体现得更加明显。其中，图的节点代表现实世界中存在的“实体”，图的边则代表实体之间的“关系”。基于知识图谱

lizhengjava 2020-11-13

10个丰富自我的机器学习项目

机器学习项目有很大的发展潜力，最近大火的韩剧也出现了这个词语并且用很浪漫的说法解释了它。毕竟招聘者一般通过你拥有的技能来判断你的潜力。此外，确保所有数据集都呈现开放状态允许自由访问。很多机器学习课程将这个数据运用于教学目的，它可以预测人类的活动类别，这是一

ohbxiaoxin 2020-11-13

机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。金融科技初创厂商是智能手机、大数据、机器学习、区块链等新技术的早期采用者，被认为是被更传统的银行和金融机构所效仿的潮流引领者。机器学习和深度学习的最新进展确实推动了计算机视觉和自然语言处理的界限。Sta

Icevivian 2020-11-13

24个提高知识和技能极限的机器学习项目

数据科学项目为你提供了一种有前途的方式来启动你在该领域的职业。你不仅可以通过应用它来学习数据科学，还可以在自己的简历上展示一些项目！这是大多数人挣扎和错过的地方。另外，我们确保所有数据集都是开放的并且可以自由访问。它由中型和大型数据集组成，需要一些认真的模

EchoYY 2020-11-12

ynsshzwxhzyx

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号