Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

navixin

2017-07-14

更多深度文章，请关注云计算频道：https://yq.aliyun.com/cloud

NIPS全称为神经信息处理系统大会，是关于机器学习领域的顶级会议，也是令众多学者振奋的学术盛会。该会议固定在每年的12月举行,由NIPS基金会主办。但今年年底举办的NIPS将新增一个议程，NIPS 2017Competition Track，从23个候选提案中选择了五个数据驱动的比赛项目。近日谷歌大脑研究员Ian Goodfellow在社媒平台中强烈推荐了由他组织的AdversarialAttacks and Defences(对抗攻击防御)比赛。为什么组织这样一个比赛呢，这是因为当前图像分类器非常容易被精心设计的对抗图像所欺骗，这些图像给原始图像及正确分类图像添加了微小变化，这些图像几乎不容易被人眼察觉，但会导致图像分类器错误地对错误的分类充满自信。

这项比赛是在kaggle平台上进行，关于kaggle竞赛的介绍与相关竞赛技巧可以参考博主的以下几篇博客：

Kaggle老手领你入门梯度提升——梯度提升两三事

干货|大神教你如何参加kaggle比赛——根据CT扫描图预测肺癌

Kaggle官网上有三个相关的对抗学习挑战，如图1所示

下面具体来说下这三个相关比赛的侧重点：

1、Non Targeted Adversarial Attack，竞赛者所提交的系统需要对任何类别的图像进行处理，使得某个通用机器学习分类器无法识别。
2、Targeted Adversarial Attack，竞赛者所提交的系统需要对给定的图像进行处理，使得某个通用机器学习分类器无法识别。
3、Defense Against Adversarial Attack，竞赛者需要构建一个机器学习分类器，拥有足够的鲁棒性使之能正确鉴别对抗性的图像。

根据前两个挑战的对抗性攻击，防御挑战的得分取决于分类器的好坏，另外前两个挑战的得分是基于在第三个挑战中对抗性攻击的伎俩有多好。

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

下面，我们将通过一些代码示例来生成非目标和目标的对抗图像，然后看看Inception V3模型是如何对它们进行分类。关于googleNet Inception V3介绍大家可以上网找找相关教程或博客，这里就不一一讲述。

注：下面许多的代码是基于Alex例子，基于tensorflow实现。

开始时，我们导入一些必要的库并定义一些参数/有用的函数

import os

接下来，我们将在元数据中加载一批图像。

categories = pd.read_csv("../input/nips-2017-adversarial-learning-development-set/categories.csv")image_classes = pd.read_csv("../input/nips-2017-adversarial-learning-development-set/images.csv")image_iterator = load_images(input_dir, batch_shape)# get first batch of imagesfilenames, images = next(image_iterator)image_metadata = pd.DataFrame({"ImageId": [f[:-4] for f in filenames]}).merge(image_classes,

下面是开发集中的一个图像示例，熊猫是不是很可爱？

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

生成无标签对抗图像

以下代码在tensorflow上运行并生成非目标对抗图像，这些非目标图像是为了欺骗原始分类器而设计的，但这些图像没有固定的类别。

tf.logging.set_verbosity(tf.logging.INFO)with tf.Graph().as_default():

INFO:tensorflow:Restoring parameters from ../input/inception-v3/inception_v3.ckpt

左边是原始图像，右边是非目标对抗图像。它们看起来很相似，很明显都是一条小船。

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

生成有标签对抗图像

以下代码在tensorflow上运行并生成目标对抗图像，在每种情况下，都有一个特定的目标类别，这些类别是试图欺骗图像分类器输出的。

注意：该代码目前不工作，它只是产生对抗图像，并且这些图片而没有正确的目标。

all_images_target_class = {image_metadata["ImageId"][i]+".png": image_metadata["TargetClass"][i]

INFO:tensorflow:Restoring parameters from ../input/inception-v3/inception_v3.ckpt

左边是原始图像，右边是目标对抗图像。同样可以发现它们看起来很相似，很明显都是蝴蝶。

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

分类对抗图像

接下来，我们将看到，当把这些生成的对抗图像送入原始分类器运行时会发生些什么呢，答案是目标对抗图像与原始图像的类别判定完全不同。

with tf.Graph().as_default():

INFO:tensorflow:Restoring parameters from ../input/inception-v3/inception_v3.ckpt

下面我们将展示这个批次中的所有图像以及它们的分类的类别。每个集合中的左图是原始图像，中间图是非目标对抗形象，右图是目标对抗图像。

for i in range(len(images)):

原图（左图）

预测类别：大熊猫

真实类别：大熊猫

非目标对抗图片（中间图）

预测类别：萨摩耶犬类

目标对抗图片（右图）

预测类别：土狗

真实类别：肉饼

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：小船

真实类别：小船

非目标对抗图片（中间图）

预测类别：堤坝

目标对抗图片（右图）

预测类别：堤坝

真实类别：翅膀

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：灰蝶

真实类别：灰蝶

非目标对抗图片（中间图）

预测类别：小环蝴蝶

目标对抗图片（右图）

预测类别：小环蝴蝶

真实类别：西班牙可卡犬

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：灰蝶

真实类别：灰蝶

非目标对抗图片（中间图）

预测类别：河马

目标对抗图片（右图）

预测类别：河马

真实类别：啄木鸟

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：美洲黑鸭

真实类别：美洲黑鸭

非目标对抗图片（中间图）

预测类别：短尾鹦鹉

目标对抗图片（右图）

预测类别：短尾鹦鹉

真实类别：泉水

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：短尾鹦鹉

真实类别：短尾鹦鹉

非目标对抗图片（中间图）

预测类别：篮球

目标对抗图片（右图）

预测类别：篮球

真实类别：单峰骆驼

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：球员

真实类别：球员

非目标对抗图片（中间图）

预测类别：鸵鸟

目标对抗图片（右图）

预测类别：鸵鸟

真实类别：金库

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：鸵鸟

真实类别：鸵鸟

非目标对抗图片（中间图）

预测类别：日晷

目标对抗图片（右图）

预测类别：日晷

真实类别：海上钻井平台

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：加农炮

真实类别：加农炮

非目标对抗图片（中间图）

预测类别：虎甲虫

目标对抗图片（右图）

预测类别：虎甲虫

真实类别：特浓咖啡机

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：长角天牛

真实类别：长角天牛

非目标对抗图片（中间图）

预测类别：特浓咖啡

目标对抗图片（右图）

预测类别：特浓咖啡

真实类别：髓内钉

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：特浓咖啡

真实类别：特浓咖啡

非目标对抗图片（中间图）

预测类别：淋浴帽

目标对抗图片（右图）

预测类别：淋浴帽

真实类别：滤盆

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：雪橇

真实类别：雪橇

非目标对抗图片（中间图）

预测类别：玫瑰果

目标对抗图片（右图）

预测类别：蜜蜂

真实类别：面包店

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：大钢琴

真实类别：大钢琴

非目标对抗图片（中间图）

预测类别：书桌

目标对抗图片（右图）

预测类别：餐桌

真实类别：信箱

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：间歇喷泉

真实类别：间歇喷泉

非目标对抗图片（中间图）

预测类别：沉船

目标对抗图片（右图）

预测类别：海狸

真实类别：哈巴狗

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：图书馆

真实类别：图书馆

非目标对抗图片（中间图）

预测类别：书店

目标对抗图片（右图）

预测类别：书店

真实类别：安全别针

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

原图（左图）

预测类别：松鸭

真实类别：松鸭

非目标对抗图片（中间图）

预测类别：松鸭

目标对抗图片（右图）

预测类别：黄雀

真实类别：针鼹

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

作者信息

Ben Hamner：Kaggle联合创始人与首席技术官。

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

Linkedin：http://www.linkedin.com/in/ben-hamner-98759712/

Github: https://github.com/benhamner

本文由北邮@爱可可-爱生活老师推荐，阿里云云栖社区组织翻译。

机器学习 nips kaggle 分类器

安科网

Kaggle首席技术官发布——(Kaggle)NIPS 2017对抗学习挑战赛起步指南

navixin

navixin

相关推荐

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

如何通过7个步骤构建机器学习模型

机器学习新风暴：如何用ML模型预测房价？

关于机器学习管道需要了解什么?

为什么所有的机器学习模型有90％从没有投入生产

LinkedIn开源Dagli，发布Java机器学习函数库

关于机器学习算法的16个技巧

全面解读谷歌云人工智能如何为机器学习提供帮助

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

需要知识的后深度学习时代，如何高效自动构建知识图谱

10个丰富自我的机器学习项目

机器学习如何颠覆金融行业

24个提高知识和技能极限的机器学习项目

IT自动化和人工智能将在2021年走向何方？

无监督机器学习的重要指南

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

理解AI：为什么要在人工智能系统中寻求可解释性呢？

机器学习的未来就在这里：高斯过程和神经网络是等价的

Python 用5行代码学机器学习—线性回归

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

navixin