如何防止信息泄露？阿里巴巴数据风险防控体系揭秘！

理想国

2017-12-13

近年来，大规模的个人信息泄漏事件不断发生，由此引发的精准诈骗也经常被媒体报道。有着庞大用户群体和海量交易的阿里巴巴却能独善其身，这背后有什么独门秘籍呢？

当我们表明来意时，阿里安全技术平台资深专家玄泰反复提到“御城河”三个字。

“我们的秘密武器就是御城河。”玄泰沉吟片刻，“它是阿里巴巴独创的数据风险防控体系，围绕着数据在整个阿里生态的流转链路，从数据风险的预防、发现、定位、处置，再到更深层次的立体感知和溯源，形成了一套完备的数据安全解决方案。它向所有阿里生态伙伴开放，覆盖整个电商生态。”

为了强化我们对御城河的理解和感受，玄泰出示了一组惊人的数据。

如何防止信息泄露？阿里巴巴数据风险防控体系揭秘！

据玄泰介绍，目前，御城河保护数几百万商家的几千万台终端，1000多家核心服务商的几千个应用，以及主流物流公司的10余万个网点，实时检测系统、应用、账号等30多个维度的数据访问风险。在2017天猫双11当天，御城河进行风险检测就超过65亿次，发现主机、访问、木马等风险1万多个，拦截账号、主机等风险数万个。

何谓“御城河”？

不得不说，阿里安全的工程师还是很会取名字的。御城河，从字面上就有一种高大上的感觉，而且基本一看就能够揣测其意。但它究竟是什么呢？玄泰为我们揭开了这个谜底。

“以订单信息为例，用户在平台购物下单后，会进入复杂的订单处理流程。在一个典型的场景中，订单会首先进入商家订购的三方软件开发商的ERP处理系统，经过处理后传输到商家的仓储WMS系统，再然后对接到物流公司的物流系统。同时商品上也会有打印出来的收货信息，货物经过物流公司的多次转运，最后由快递员送到用户手中。”

“可以看到，数据就像河流一样错综复杂地流过各个生态伙伴的数据使用节点，这些节点就像是城池，也是是黑灰产时刻窥视的攻击目标。御城河取其意，像护城河一样守护这些城池，防止城池中的数据被非法窃取。”

“御城河体系就是基于整个数据链路中的风险来设计的。首先，是风险预防，加高各个城池的城墙。对容易出现的风险点进行加固，涉及服务端的防御、前端的防御、客户端防御等方面。比如服务器防入侵、应用保护、客户端防护、账号保护等等；”

“随之是风险发现，在城池上安装了全方位的视频监控系统。御城河有一套基于大数据的智能风控模型，对每个核心数据流通环节进行风险建模，识别核心数据的访问风险；。”

“之后是对异常或风险进行定位和处置。比如风险原因、影响范围等等；定位之后需要进行处置，即怎么将这些风险消化掉。方式可能会有很多种。比如说，直接线上自动处置掉，也有可能是人工介入处理等等，需要根据不同的风险状态进行决策；”

“再深层次的，就是对整个全局的风险和异常的感知。这一阶段往往是对未来可能发生的风险进行预测。这一系列都是通过御城河在各个链路的产品能力实现的。”

玄泰告诉我们，御城河经过演进，目前已经研发出针对不同行业的多个版本，包括服务商版、商家版、物流版、跨境版、通用版以及针对特殊业务或架构而定制的版本。

事实上，御城河之所以诞生，是为了使命而来，而这个使命就是为了数据安全，其中以防止信息泄露为重。玄泰认为，信息泄露并不能被认为是某种风险，而是由各种风险引发或导致的结果。“比如，服务器被入侵，导致数据被窃取。或者，账号被盗后被别人用来偷了数据。也有可能是，内鬼将自己能够接触到的数据拿去贩卖等等，这些都是导致信息泄露的风险点。”玄泰说。

因此，阿里安全的工程师针对信息泄露的问题进行回溯，去分析、覆盖所有可能的风险。以帮助阿里经济体的生态伙伴进行风险防控。这其中包括端的对抗、后端的漏洞检测修复、运行环境的安全等等，几乎从最底层的系统到应用，再到设备、账号等，均会进行保护。

在玄泰看来，这条链路上的任何一个点出问题，都有可能导致信息泄露，因此，必须实现无缝覆盖。

“御城河”诞生记

既然这么牛，那么御城河是怎么诞生的呢？玄泰娓娓道来。

2013年以前阿里巴巴集团就开始做信息泄露防控，而“御城河”这套体系化的防控体系则始于2014年，而负责这套系统的团队——生态安全也成立于2014年。

“那时候对于怎么解决开放场景下的数据安全问题，没有现成的经验可以借鉴，也没有看到解决这类问题的产品。很多是遇到问题就去解决，偏事后，我们也逐步摸索，希望可以更加系统、智能地去做数据安全。我们做了大量的创新，实现了通过流量和主机层行为的关联分析，发现可疑的入侵行为。提出利用大数据驱动的行为分析技术来监测和定位风险，并将能力SaaS化，供所有生态伙伴使用。在这个过程中，团队申请了6个技术专利。”玄泰说。

到2015年开始，玄泰和他的团队逐步摸索出了一个完整的产品体系。并在2015年年中，对御城河产品体系进行轻量级升级，对生态伙伴则采用全新的方式进行系统安全升级。“很快，年中的时候就把御城河武装到了大半的淘系订单数据链路。”玄泰说。

那么，按照“轻装上阵”的思路开发出来的系统实战效果如何呢？

“哐”，玄泰用了这个非常形象的词来形容全新系统的功效。“我们能看到用户的投诉就‘哐’地往下掉，直线往下掉。而且掉下来之后，就再也没有反弹。”玄泰的言语中透露出一丝自豪。

新系统完全展现了新的开发思路，提供优化后的轻量级产品，建立规范，帮生态伙伴进行基础的安全建设，最为重要的是，生态伙伴一旦有风险，系统马上就能实时发现，而且能够即时找到问题所在。

“如同警察抓小偷一样，只要小偷一伸手就会被抓到，而平常根本没有发现警察出现，用户也没有感知。这种模式非常的轻，而且我们把很多的产品都拆解得更细，不再像过去那样，只能一整套全部使用，可以单独地用。”玄泰的语气中充满是自豪。

然而，这仅仅是个开始。

服务商、商家、物流全链路的保护

据玄泰介绍，2014-2015年，生态安全团队主要集中在做服务商的治理。慢慢地，玄泰和他的团队基本完成了服务商的治理。淘系电商每天经过服务商应用的订单中，98%经过御城河。而且御城河接入的成本大大降低，一般的接入仅需很短时间即可完成。

“2015年随着御城河在服务商领域的大范围使用，针对服务商的投诉占比从绝对数几乎降到了最低。”玄泰说。

但是，在解决服务商的问题之后，商家的问题又出来了。

据介绍，商家的信息泄露主要由几大类风险引发。第一个，商家的正常的客服被黑产收买；第二个，黑产人员经过培训后，应聘到商家，获取权限之后窃取数据；第三个，一些商家是传统企业转型而来，拥有多年来自己开发使用的系统，并且是单独部署的，安全往往比较薄弱。

2016年，阿里安全发布了御城河商家版，免费提供给卖家使用。“我们的系统有非常强的风险发现能力，在发现风险之后，可以实时处置。”玄泰说，“这些风险我们会进行等级划分，不同等级的风险处置方式也会不一样。”

好了，除了服务商和商家的问题，物流商也是一大领域。

“物流产业非常庞大也更为复杂，一开始的时候甚至不知道到底有多少问题。”玄泰说。于是，同年，御城河的物流版上线了。

相较于商家来说，快递公司的数量要少得多，全国范围来看，数得上名的大概也就几十家，但网点、从业人员可以说是非常庞大。但是有了服务商的治理经验，生态安全团队并没有急于一拥而上，而是有自己的策略。这个策略就是，先覆盖快递商，并将主要的精力放在最TOP的快递商上。

“今年我们就花了比较多的精力在快递行业的治理。今年御城河已经和大部分的快递展开合作并且取得了很好的效果。”玄泰说，“接下去，我们的目标就是物流的其他方面，包括仓储和配送。”

“把日常做成双11，把双11做成日常”

对于今年的双11，玄泰坦言，他能讲的东西并不多。

2014年，生态安全团队成立，那一年的双11也是由玄泰负责相关的工作。“那一年的双11从 8月份就开始准备安全预案，当时做得很痛苦。”玄泰说。也就是自那时起，玄泰和他的团队作出了一个决定。

“用2-3年的时间，把日常做成双11，把双11做成日常。”

正是基于这样的决心并落地实施。2016年双11和2017年双11，生态安全团队都感觉“轻松写意”，甚至在2016年双11的时候打算不值班了！“未来希望每年双十一都能喝着茶然后买买买”。

但最终，2016年双11，御城河顺利扛过系统压力。因为系统实现了三个“0”，即“0故障、0降级、0事件”，要知道，这是在那么大订单量的情况下获得的荣誉。

而2017年双11，御城河同样达成了三个“0”这一结果。

“御城河在技术上也是蛮有意思的，我们从14年底开始发布，一直到目前为止，我们只出现了一个P4故障。所有的质量保证，研发阶段就搞定。”玄泰说。

通常来说，在阿里，P4故障都是不记录的。这么牛，是怎么保证的？

在玄泰看来，研发保障质量，这是他对自己团队的要求。“研发还是比较牛的。所有的东西要求他们自己去保障，所以，质量方面、稳定性方面还算是不错的。”玄泰給予自己的小伙伴们极高的评价。

“今年双11值班了，但其实状态相对轻松。”当我们最后想要试图挖出一些料的时候，玄泰淡淡地说。

阿里巴巴信息泄露大数据科技新闻

安科网

如何防止信息泄露？阿里巴巴数据风险防控体系揭秘！

理想国

何谓“御城河”？

“御城河”诞生记

“把日常做成双11，把双11做成日常”

理想国

相关推荐

“人脸识别”事故频发，“猪脸识别”却很靠谱！阿里巴巴赌对了

阿里巴巴成立云原生技术委员会云原生升级为阿里技术新战略

重磅！阿里巴巴开源首个边缘计算云原生项目 OpenYurt

重磅！阿里巴巴开源首个边缘计算云原生项目 OpenYurt

马云为什么要卸任软银董事？开放和全球化的技术时代会终结吗

阿里巴巴泰山版《Java 开发者手册》，也是一份防坑指南

2020版SpringBoot2.2.X集成Dubbo2.6.8，一次配置多处使用，支持定制

阿里巴巴编码规范

Flutter 使用阿里巴巴icon库

Flutter 使用阿里巴巴icon库

阿里巴巴王帅：世界因淘宝神人而不同

阿里巴巴向全社会开放黑科技：“泡在水里”的服务器

阿里巴巴北京总部园区正式奠基计划于2024年建成

【Idea】Idea中实用的插件

阿里巴巴：新职业新机会 2019年数字经济就业火爆

阿里巴巴 Kubernetes 能力再获 CNCF 认可 | 云原生生态周报 Vol. 32

双11的全链路可观测性：阿里巴巴鹰眼在“云原生时代”的全面升级

双11 背后的全链路可观测性：阿里巴巴鹰眼在“云原生时代”的全面升级

双11 背后的全链路可观测性：阿里巴巴鹰眼在“云原生时代”的全面升级

阿里巴巴架构再调整：鲁肃接棒行癫任 CTO，孙权就任蚂蚁金服 CEO

理想国