AI 安全在阿里业务中的实践，你了解吗？

硕鼠

2019-03-12

AI 安全在阿里业务中的实践，你了解吗？

我们知道，AI 技术将在很长一段时间占据互联网技术时代的风口。但是，有代码的地方就有缺陷，提到技术很难不讲安全，那么AI会不会碰到安全问题呢？

AI安全

试想一下，未来的某个早晨，当你像往常一样打开无人驾驶的汽车车门，报出目的地，然后坐在后座上舒舒服服地浏览推送给你的各种新闻，汽车突然失控，在本该停止的红灯前飞驰而过撞向了正在过马路的行人，那将是怎样一场灾难。

人工智能技术给生活带来便利的同时，其自身的安全问题（AI安全）也不容忽视，AI安全问题可以归纳为内外2方面原因：

自身缺陷导致的模型出错：例如，模型结构本身存在缺陷、或者训练数据和真实场景数据之间的偏差，都可能导致模型预测错误。
外部攻击导致的模型风险：例如，来自外部的对抗样本攻击可诱使算法识别出现误判漏判，输出错误结果。

本文，我们会针对第2点的对抗样本技术结合其在阿里巴巴安全领域中的实际应用给大家做展开介绍。

对抗样本技术

对抗样本由 ChristianSzegedy[1]等人提出，他们发现通过深度神经网络训练得到的模型，在输入与输出之间的映射往往不是线性的。这样就存在一个问题: 在输入数据中通过故意添加肉眼不易察觉的细微扰动，可以生成对抗样本，导致AI模型以高置信度给出一个错误的输出。如下图所示：

AI 安全在阿里业务中的实践，你了解吗？

目前的对抗样本根据是否需要指定攻击的类目可以分为无目标攻击(non-targeted attack)和目标攻击(targeted attack)。前者不指定具体类目，只要让AI识别错误即可。后者不仅需要使AI识别错误，还需要使AI识别到指定的类别。

生成对抗样本，最直接的方法是在给定扰动量的范围内修改样本，使得修改后的样本在AI模型上的损失函数最大化（非定向攻击）或最小化（定向攻击），这样就可以把生成对抗样本的问题归纳为空间搜索的优化问题。基于不同的优化算法，学术界提出了很多对抗样本生成算法，有兴趣的朋友可以自行检索，此处不具体展开。

对抗样本应用场景

对抗样本技术提出后引发了学术界和工业界对于深度学习模型在安全方面的广泛关注，成为目前深度学习领域最火热的研究课题之一，新的对抗攻击方法不断涌现，应用场景从图像分类扩展到目标检测等。

阿里安全一直以来致力于用技术解决社会问题。为了保障整个生态圈中7亿多消费者和千万商家的信息安全，AI技术很早就被应用到了阿里安全体系建设中。安全领域一个重要的特点就是存在很强的对抗性，日常防控中，黑灰产会尝试使用各种对抗样本攻击我们部署的AI防控大坝。对此，一方面，阿里安全图灵实验室的算法专家们提出了若干种提升模型安全性能的方法，强化自身堡垒；另一方面，算法专家们也会以战养战，开展针对对抗样本的攻防研究，利用对抗技术去防御攻击者的模型。下面我们结合实际业务，介绍两种对抗样本的应用场景：

1.人脸识别

人脸识别技术已经在生活的各个场景普遍应用，手机解锁要靠脸、移动支付要靠脸，机场安检要靠脸……一脸走天下的时代逐渐到来。

然而，Bose 和 Aarabi[2]发现通过在原始图像中加入人眼不可区分的微量干扰对人脸识别算法进行攻击后，能够使人脸无法被检测算法定位到。如下图所示，左列为原始图像，检测算法可以准确定位，右列为对抗样本，已经成功绕开了人脸检测算法，而在我们肉眼看来两幅图画基本没有差别。

AI 安全在阿里业务中的实践，你了解吗？

更进一步，采用对抗样本攻击人脸识别系统，还可以使算法把人脸识别成指定的错误类别[3]。下图第一列为目标类别，第2和第4列为原始样本，对其加入干扰生成的对抗样本在第3和第5列，它们均被算法错误识别为第一列目标类别。

AI 安全在阿里业务中的实践，你了解吗？

2.对抗验证码

如同网络通信的基础安全设施——防火墙，互联网业务安全也有其基础安全设施——图片验证码和短信验证码。互联网业务广泛使用图形验证码用于区分人类和机器的操作行为，使用短信验证码过滤黑灰产批量账号及提供二次校验功能。现在随着深度学习的门槛越来越低，黑灰产会利用深度学习技术构建模型自动识别验证码，突破算法模型设置的人机识别防线。下图的文本验证码基本都可以被AI模型轻松识别。

AI 安全在阿里业务中的实践，你了解吗？

针对文本验证码面临的挑战，阿里安全图灵实验室的算法专家们将原始验证码替换成增加扰动后的对抗验证码。为了增加对抗验证码的识别难度，又不影响正常用户的体验，算法专家们又在图像区域和生成方式上进行了组合扩展，最终生成的对抗样验证码有效抵御了黑灰产的批量破解，成为阿里业务安全的一道铜墙铁壁。采用该组合扩展生成的对抗验证码如下图所示：

AI 安全在阿里业务中的实践，你了解吗？

针对点击式的图文验证与行为辅助验证码，阿里安全图灵实验室的算法专家们首先在验证码中结合了NLP的问答技术，再将全部问答转换成图片，最后利用对抗技术生成对抗问答图片。使用商业的OCR引擎进行对此类对抗问答图片样本进行识别测试，和原始样本的识别率相比，对抗样本的识别率大幅降低，且并没有对用户的体验带来很大的影响，由此可见AI结合安全能为业务带来巨大的价值。

AI 安全在阿里业务中的实践，你了解吗？

本文作者：安全第一

阿里人工智能算法

硕鼠

0 关注 0 粉丝 0 动态

相关推荐

阿里云centos7安装mysql8.0.22的详细教程

设置开机启动Mysql[root@localhost ~]# systemctl enable mysqld.service. mysql> alter user 'root'@'localhost' identified by '新密码';这里建议

CosEmon 2020-11-13

详解使用阿里云镜像仓库构建国外Docker镜像

在日常使用 Docker 或 K8S 的过程中，经常会需要到国外的网站中下载镜像，但是有些网站在国内是无法访问的。对于这个问题可以使用阿里云提供的镜像仓库进行下载，然后 pull 到本地并修改 tag 来实现。例如在使用 K8S 部署 Istio 时，需要

lihongtai 2020-11-09

阿里云双11热门产品低至1折,全年冰点钜惠,再赢100万红包

阿里云双11热门产品低至1折,全年冰点钜惠,再赢100万红包，云服务器、云数据库等云产品享全年最优底价，新老用户共享巨惠狂欢，另有11111元现金红包大将等着你，进入下面相应链接了解：。突如其来的一场疫情让数字化迅速成为全社会热点，在消费数字化浪潮中诞生的

sqisydream 2020-11-11

2020年阿里云双11企业购买短信优惠推荐

2020年阿里云双11企业购买短信优惠推荐，云服务器、云数据库都有超值特惠，新老用户共享优惠狂欢，另有11111元现金红包大将等着你，进入下面相应链接了解：云通信钜惠狂欢双11，爆款产品低至0.72折，短信低至0.034元/条，惠不可失。第一次使用阿里云短

fjlmcy 2020-10-31

2020年阿里云双11企业建站价格最低优惠推荐

阿里云建站费用需要多少？11月9日，双11冲刺阶段。之前处于预热阶段的各家云服务器，不断放出双11的冲刺价格。因为国内服务器的带宽成本较高，目前云服务器入门级1M带宽基本是限速不限量，可以满足入门级使用。但这么多家云服务器品牌，各家活动力度如何，哪一家最划

visionarywind 2020-10-31

2020年阿里云双11企业建站提供折扣

用户可以通过云小站购买优惠产品，产品分为秒杀产品、新用户专享产品、新老用户同享产品，用户符合购买资格即可直接购买。阿里云阿里云阿里云双11企业建站折扣火爆来袭热门活动主要内容及亮点云·企业官网定制建站限时买一年送半年量身定制1对1，建站专业又省心！

特立独行 2020-10-30

2020年阿里双11企业购买云服务器优惠

2020年阿里双11企业购买云服务器优惠，云服务器、云数据库都有超值特惠，新老用户共享优惠狂欢，另有11111元现金红包大将等着你，进入下面相应链接了解：。腾讯云率先上线了活动，阿里云也从1024程序员节开始预热，各大品牌都在陆续公布双11活动方案。对于阿

Hitpoint云计算 2020-10-30

阿里云服务器双11拼团上云低至85元，拼团赢11111元现金红包

阿里云双11优惠狂欢活动：100%性能云服务器84元/年，开上云宝箱，领亿元津贴，更多优惠请点击进链接了解。腾讯云双11云上盛惠来了，2核/4G/3M不限性能云服务器仅698元/3年，更有万元大礼包等着你来抽。2020年阿里云双十一拼团活动开始了。上云狂欢

sqsfjsjlpf 2020-10-29

阿里主办国际AI 顶会，医疗AI、多媒体内容理解成热门话题

10月15日，记者获悉，由阿里巴巴主办的2020年ACM Multimedia大会于日前正式召开，这是国际AI顶会主办权首次花落中国科技企业。目前刷新多项纪录，论文投稿数和收录数均创下历史新高，达摩院城市大脑实验室负责人、ACM MM 2020大会主席华

平凡的程序员 2020-10-15

阿里巴巴正式开源 Inclavare Containers 技术

Inclavare，是 Enclave 一词的拉丁语词源，读音是 [?Enclave 指的是一种受保护的执行环境，能为其中的敏感和机密数据提供基于密钥学算法的强安全隔离，阻止不可信的实体访问用户的数字资产。Inclavare Containers 是由阿里

yunna0 2020-09-23

云栖大会CDN技术专场：如何构建企业级内容分发加速体验？

9月18日，全球顶尖科技盛会——2020云栖大会圆满落幕。本次大会首次采用“云上”形式，为全球科技人带来三场主论坛和展厅、100场分论坛和专场、100个城市站点线上线下联动和100大新品发布。其中，新一代CDN技术突破和应用实践产品技术专场聚焦当前全球企业

OpenCDN网站加速 2020-09-21

阿里云发布边缘计算视频上云解决方案为海量视图处理提供城市级云基础设施

日前，2020云栖大会在云上成功召开，此次大会汇聚行业领袖，共同见证数智未来的重构进程。在9月18日的产品发布大厅，阿里云正式发布边缘计算视频上云解决方案，旨在依托城市级云计算基础设施，实现海量视图数据就近上云计算，助力行业最大化的挖掘视图数据价值，赋能城

82453961 2020-09-21

聚焦2020云栖大会边缘计算专场畅谈技术应用创新

9月17-18日，一年一度科技圈盛事——云栖大会如期上演，本届大会以“数智未来，全速重构”为主题，历时2天，首次采用云上云栖的模式，与业界同仁、合作伙伴共同打造了一场数字时代的云上相聚。其中，边缘计算技术领域因5G商用落地而备受瞩目，边缘计算技术应用创新专

qual0 2020-09-21

加速连接效率阿里云推出5G消息使能平台MEP

过去两年，5G无疑是全球最热门的新技术之一，亦是一场对产业互联网的巨大赋能。为了帮助云上用户更好地使用5G新消息，阿里云正式推出5G新消息使能平台MEP平台。李海波表示：在过去的几个月中，阿里云通信与新零售行业伙伴联合，在用户咨询、购买、售后服务等多个环节

mysteryrat 2020-09-21

盘点中国云服务商四大巨头，未来十年，谁主沉浮？

本文转载自微信公众号「悲了伤的白犀牛」，作者悲了伤的白犀牛。今天若是谈起国内云服务商，大抵总逃不出这四个名字：阿里云、腾讯云、华为云、百度云，他们联手几乎掌控了整个国内云市场90%以上的江山。其中又以阿里云以近半壁江山的权势，傲视群雄，隐然成为武林霸主。

Liucute 2020-09-21

阿里云2.0：超级计算机+操作系统

走向第二个十年，阿里云迎来最重要的全面升级。9月17日，在2020云栖大会上，阿里云智能总裁张建锋宣布阿里云进入2.0时代: 飞天云这个“超级计算机”，将装上一个数字原生操作系统，就像Windows让电脑走进千家万户一样，升级后的云让人类和云计算的交互更

古影轩 2020-09-17

阿里云监控看起来不连贯？那就看看Grafana的解决方案

最近上云的应用越来越多，我们也不例外，最近有很多应用上云，但是随之而来的问题就是监控的统一展现，最近查阅阿里云文档，阿里可以提供API接口，但是得到的数据比较复杂，需要修整，这样还不如自己开发算了，但是发现阿里云提供一个grafana插件，能够用grafa

aolia000 2020-09-11

阿里云容器镜像加速

针对Docker客户端版本大于 1.10.0 的用户

丽丽 2020-08-17

React实现阿里云OSS上传文件的示例

阿里云 OSS 是阿里云提供的海量、安全、低成本、高可靠的云存储服务，提供 99.9999999999%的数据可靠性（号称）。能够使用 RESTful API 可以在互联网任何位置存储和访问，支持容量和处理能力弹性扩展。钩子函数首先计算签名是否过期，如果

罗忠浩 2020-08-16

还不会springboot，阿里p8大牛一份385页pdf直接甩在脸上，给我啃

不能及时与流行开源技术结合；Java EE 应用服务器收费。spring的提出，核心功能仅仅只是Aop和IoC，发展如火如荼之后也有缺点，spring boot应运而生。JDK安装、maven配置、IoC与bean容器、注解、AOP示例。hibernate

zhengsj 2020-07-29

硕鼠

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号