抢滩IPv6!阿里巴巴的下一代网络演进
作者 | 陈思
嘉宾 | 张先国
背景介绍
IPv4 诞生与七十年代,当时处理器普遍为 8bit,采用 32bit 作为地址来寻址,有 40 亿个地址空间,发明人文顿·瑟夫做了长远布局,也并使其支撑了互联网飞速发展长达 40 年。现今的互联网络发展蓬勃,截至 2017 年,全球上网人数已达 34 亿,同时物联网终端超过 80 亿,但 IPv4 仅能提供约 42.9 亿个 IP 位置。
虽然目前的网络地址转换及无类别域间路由等技术可延缓网络地址匮乏之现象,但为求解决根本问题,从 1990 年开始,互联网工程工作小组开始规划 IPv4 的下一代协议。1994 年,各领域的代表们于多伦多举办的 IETF 会议中,正式提议 IPv6 发展计划,并最终在 1998 年 12 月被互联网工程工作小组通过公布互联网标准规范(RFC 2460)的方式定义出台。
2017 年 11 月,中办、国办印发实施《推进互联网协议第六版(IPv6)规模部署行动计划》,5 月 2 日正式印发工业和信息化部关于贯彻落实《推进互联网协议第六版(IPv6)规模部署行动计划》的通知。作为中国互联网企业的“排头兵”之一,阿里巴巴率先在全业务中部署 IPv6,带头向下一代网络演进。
为了对阿里巴巴 IPv6 的部署进行深入解读,InfoQ 采访到了阿里巴巴网络高级架构师张先国,他将从专业的角度为我们讲述全面部署 IPv6 背后的故事。
5 月 2 日,工信部印发《IPv6 规模部署行动计划》通知,正式推动 IPv6 在国内的落地。在此之前,阿里云已经在内部启动了 IPv6 的升级换代项目,阿里更表示,要在双十一之前将 IPv6 贯彻到全集团。IPv6 的抢滩登陆战役,已经打响了。
为什么要 IPv6
几乎学过计算机的人都知道,IPv4 的地址只能容纳 42.9 亿个 IP 位置,本来好几年前就应该耗尽,但其实我们现在仍然在用 IPv4。
之所以出现这种现象,是因为我们用 NAT 技术绕过了这个限制,网络地址转换(Network Address Translation,缩写为 NAT),是一种在 IP 数据包通过路由器或防火墙时重写来源 IP 地址或目的 IP 地址和四层端口的技术。这种技术被普遍使用在有多台主机但只通过一个公有 IP 地址访问因特网的私有网络中。它是一个方便且得到了广泛应用的技术。
当然,NAT 也让主机之间的通信变得复杂,导致了通信效率的降低。另外,在很多领域 NAT 技术很难解决业务的需求,IPv4 存在很多局限,影响未来业务的发展:
- 首先是云计算公网 IP 消耗迅速。IPv4 公网 IP 消耗迅速,每个客户的每个应用需要对应 1 个或多个公网 IP,每个地址目前购买成本十几美元;以阿里为例,目前阿里需要从海外大量购买资源,耗资数亿。
- 其次,虚拟化会快速消耗私网地址,私网地址空间为 1600W,当大型数据中心发展到百万服务器,虚拟比 1:10,地址需求量超 1000W 将面临瓶颈。对于阿里如此大规模的体量,私网地址消耗也非常迅速。
- 此外,物联网海量终端接入,需要大量 IP 地址,物联网要求永远在线,现有的 NAT GW 无法长时间维护巨量会话,难以支撑实时在线的业务。4G 手机的 VoLTE 大部分已经切换到 IPv6 就是此类原因。
- 还有正在发展中的 5G,更大带宽(单用户 1G)、更加海量的终端(千亿级终端,100 万 /km2)、更实时的业务响应 (1ms),都无法继续采用 NAT Gateway 进行处理,这让 IPv6 成为默认 IP 协议选项。
IPv6 在 1998 年正式发布,采用 128bit 作为地址空间标识,容纳 3.4×1038 个地址空间,全球每个人可以分配 4.86×1028 个地址(是 IPv4 总量的 1/4)。
张先国告诉记者:“对于云计算产业每个 VM 提供一个公有 IP 将给用户带来极大便利;对于虚拟化造成大量地址占用的问题,我们也将用 IPv6 来解决。面向公众服务的物联网采用 IPv6 也是首选技术,比如共享单车。”
“安全性上来说,”张先国进一步补充道:“IPv6 协议簇天然集成了 IPSec,但产业界一般情况下并没有集成此项技术,因为 Http 发展带动了 SSL 的应用层安全加密技术的普及,这是 IPv6 发明时没有看到的。”
虽然优点颇多,但是 IPv6 也是有明显缺陷的,“当然,这些缺陷跟它诞生的时间过早是有关系的。”张先国告诉我们:除了安全加密技术,在 IPv6 诞生时,还没有虚拟化、Overlay、Service-chain、TE、质量保障等场景,因此新协议没有解决以上问题,对产业应用吸引力不够。
“所以协议诞生过早也并不是就一定能抢先成为主流,有很多缺陷是需要通过后天的技术不断完善的。但是,这也并不能阻碍 IPv6 成为下一代网络协议的步伐。”张先国进而说道。
国内 IPv6 的现状
去年 11 月,中办、国办印发实施《推进互联网协议第六版(IPv6)规模部署行动计划》,5 月 2 日正式印发工业和信息化部关于贯彻落实《推进互联网协议第六版(IPv6)规模部署行动计划》的通知。
这样一连串计划的出台让人不免有些猜想:国家为何要如此重视 IPv6 的部署?
中国率先起步,却一直原地踏步
张先国在采访中为我们进行了一些分析,在他看来:IP 网络作为语音、视频、App/Web 等全业务承载技术,在国际形式风云变幻的今天,如何保障国家网络安全,实现自主可控,是我们实现网络强国必须面对的挑战。
其次,作为信息产业的技术基础,IP 协议构建在下一代平台上,在未来产业演进才更加有全球竞争力,包括安全技术、5G、物联网、云计算以及基础 IT 技术的发展。
最后还有一点,过去有些组织在不遗余力推广“IPv9”,在大方向上 混淆了 国家对未来演进的路线。我国与全球的经济是开放融合的,互联网更是这样,坚定地选择 IPv6 正是这一思想的体现。
从国际大环境上来看,我国是 IPv6 第一波浪潮发展贡献者,由于人口基数和教育网的快速推进,很快实现了千万级用户体量;美国、西欧、印度都受到鼓舞和竞争压力,近几年在 ISP 4G 部署、领先互联网企业的带动下用户量和应用迅猛增长。回头再看国内,张先国却告诉我们:我国这些年的发展基本还是原地踏步。
他通过一组数据来进一步解释自己的说法:全球来看 印度 IPv6 用户达到 2.2 亿,普及率接近 50%,美国则达到 1 亿,而中国只有 2800 万,并且多数集中在教育网。
全球 IPv6 用户数排名
在 IPv4 时代,美国作为发起者获得了最大量的地址空间,我国网民基数最大,但只拥有 3 亿地址,无法满足用户和海量终端的接入需求,目前大量使用了地址翻译技术,带来了部署成本高、用户体验差、应用访问受限、无法进行合规审计、难以安全溯源等问题。
升级 IPv6 有哪些困难?
如同全世界所有新兴技术在部署和发展的过程中遇到的问题一样,阿里巴巴在 IPv6 的部署过程中也遇到了来自各方的压力与阻碍。但是令人头疼的是,首当其冲的竟然是投资上的挑战。
这个“投资”可并不是字面上的意思,而是指部署 IPv6 所需要投入的人力物力。
对于阿里如此庞大的生态体系,拥有数百亿的 IT 资产,数万个应用,数十个自动化的管控体系,IAAS+PAAS+SAAS 升级 IPv6 不是一件容易的事情。人才投入、硬件升级替换、应用改造、业务研发,如果没有一个合理的顶层设计,整体投入将无法控制。张先国坦言:阿里为国内互联网产业向下一代演进,付出了极大的代价。而他所在的项目团队也遭遇过网络大型故障、业务的抱怨。
在技术上,张先国和团队遇到的挑战也不少:IPv4 协议 1500 字节 MTU,经过网关转化到 IPv6 会增加 20 个字节,因此可能导致网络丢包、分片,体验问题。类似的还有路由表项爆炸,IPv4 一个 C 的公网地址,最多可产生 254 个主机路由,而 IPv6 的一个 /64,则可产生数亿亿个地址,管控系统稍有不慎,则会导致 FIB 爆炸,交换机转发故障。
此外,还有 ISP 网络初期的稳定性问题、防攻击问题,乱序问题,MTU 问题、IP 地址规划问题、跨厂商对接风险、DNS 调度、fall back 问题等等。
张先国告诉记者,这些问题在项目中一个个都遇到了,解决问题过程中他们打磨出了阿里一系列下一代网络产品和技术模块。
在经历了上述各种问题与挑战的洗礼之后,张先国表示:“我们不仅在国内第一个发布了 IPv6 的系列云产品,而且 IPv6 业务配套的转发、管控、安全防护系统也是国内最强的。”
作为第一个吃螃蟹的人,在国内产业还没有成熟的阶段,张先国和他的团队踩了很多坑,付出了不小的代价,但是他们为产业趟出了一条路,同时张先国也希望后来者能走的更顺利。
阿里升级 IPv6 的实践
据了解,阿里巴巴从去年就开始布局 IPv6 的演进。而张先国正是负责此项目的架构设计与业务推进。
阿里网络团队有全球汇集的人才,包括来自顶尖网络设备厂商人才,也包括来自 Big4 的高级人才。张先国自信地说:“我们的方案设计起步阶段就是与全球领先技术看齐的。”
卓有成效的 IPv6
张先国介绍道:阿里的云产品系列已经上线 IPv6,基础设施层进行了一些打磨,电商业务全年交易额去年是 4.8 万亿,他说:“比云计算提供 IAAS 方案更复杂的是,我们需要在中间件、大数据产品、和电商业务层做更多开发和改造,比如 Web 和 App 端的搜索、推荐、支付、物流等等业务模块。”
阿里自有应用有用户量 7 亿以上用户,包括淘宝、天猫、支付宝,以及体量中大型的高德、优酷、钉钉等,张先国表示,今年全面上线 IPv6 后,可以让用户享受到 IPv6 的应用。在今年的世界杯直播期间,阿里巴巴也在教育网开通了 IPv6,让学生们享受了更加流畅的视频体验。
阿里云平台支撑了国内 40% 的网站应用,基础设施完成大量改造投入后,就可以给云上企业用户更便捷的 IPv6 应用部署环境,阿里花费了一年的时间投入改造,而企业采用云计划只需要数周完成应用适配和改造,即可快速演进到下一代网络。
在基础网络方面,运营商国际出口已经打通,新开通 IPv6 出口中,移动国际 50G,电信 / 联通各 20G,带宽大,没有拥塞。对于教育网 BGP 带宽资费比 V4 更加低廉; 由于地址是免费的,阿里云将为每一个 VPC 分配 /56 的地址(2^72),用户户也不必再负担成本。
此外,IPv6 提供了终端唯一标识,为交易安全、精准服务推送提供了方案。过去由于运营商 IPv4 地址紧缺,无法为每个终端分配独享公网地址,服务器端能获得的往往是接入网关地址,NAT 翻译技术给用户画像分析带来很多麻烦(GPS、IMEI 可能无授权访问,IP 地址是重要参数)。当然 Android 和 iOS 为了保护隐私,手机重启地址会变化的,做用不画像分析时需要注意。
中国的 IPv6,世界的 IPv6
IPv6,输不起的“战争”
在谈及这个问题的时候,张先国没有从正面直接回答,而是先举了一个例子:高铁是中国的骄傲,而高铁的全球竞争力,是基于国内投资和市场的培育;美国的八大金刚为代表的信息产业发展,也得益于美国旺盛的 IT 软硬件的投资。
这个案例说明了什么呢?张先国解释道,在 5G,云计算,物联网,通信设备,终端制造等领域我国产业面临全球竞争,如果市场需求还构建在上一代技术体系上,那么我们本土成长起来的企业很难具备全球竞争力。日本数字产业和互联网产业集体没落,是我们的前车之鉴。
热带雨林可以栖息繁衍丰富的物种,相互滋养繁荣,IPv6 也是一个生态体系,只有网络和 PC 终端,没有丰富的应用,是我国第一个发展 IPv6 浪潮遇到的问题,基础设施之后的应用普及是重中之重。中国互联网终于跻身全球高速发展的赛道之中,全球竞争者纷纷将业务构建在下一代互联网平台之上,比如 Facebook 的 IPv6 only IDC,印度运营商的 4G+v6 网络,苹果的 AppStore IPv6 only 推广,Cisco/Juniper 的网络设备技术演进,等等…. 如果我们的信息产业基础架构停滞不前,那等待我们的只有落后和淘汰。
尾 声
回顾不久之前的“中兴事件”,芯片发展上的短板让中国的科技企业严重受挫,这时人们才意识到:仅靠商业模式上的成功无法长久发展,技术的强大才是硬道理。
截止 2017 年年底,中国已经有互联网用户 7.72 亿人,占全球网民总数五分之一;互联网经济水平仅低于美国,占全球第二,并且互联网的用户数与产业价值都在持续高速增长。但一片欣欣向荣下,中国互联网经济,却是建立在底层互联网协议全部被美国等国家所掌握的条件下。
正如张先国所说:如果国内还构建在落后的一代技术上,那么我们本土成长起来的企业很难具备全球竞争力。中国与世界的 IPv6 之争,是一场输不起也不能输的竞争。
在这场竞争中,阿里巴巴等一众中国互联网领军者需要扮演的,绝不仅仅是“领头羊”的角色,而是云计算平台和应用生态的奠基人,与全球领先技术同台竞技,我们希望中国技术真正强大的那一天早日到来。
嘉宾介绍
张先国,阿里巴巴网络高级架构师,负责阿里云计算、电商、支付的全集团数据中心网络的架构设计、规划,设计了云计算 VPC、Loadbance、overlay、安全等相关业务的新一代网络架构,是阿里 IPv6 下一代网络演进的架构设计者和项目负责人,负责推进全集团业务向 IPv6 演进。