CDN与DNS知识汇总
在性能优化的时候,比较常见的一个建议是,把资源部署在CDN上,那么问题来了,CDN是什么?这样做有什么好处?
DNS
我们先讲一下域名系统DNS(Domain Name System)吧。
他是一个分布式数据库,功能是联系域名和ip地址。域名与ip的对应关系,被称为记录(record),可分为各种类型
- A: Address,域名指向的IP地址,一个域名可以有多个A记录。
- NS:Name Server,保存下一级域名信息的服务器地址
- MX:Mail eXchange,接受电子邮件的服务器地址
- CNAME:Canonical Name,返回另一个域名,令当前查询域名挑去该域名,多个域名->服务器的映射。
- PTR: Pointer Record,只用于ip地址查询域名
DNS由下面三个部分组成
- 名称解析器(resolver)
- 域名空间(domain name space)
- 名称服务器(name server)
假如你要访问baidu.com,需要先通过dns系统查出他的ip地址如220.181.57.216,才能访问。
dns查询的过程
那么问题来了,dns是怎么通过域名来查出ip的呢?我们以浏览器输入www.example.com为例,
- 检查浏览器缓存
- 检查操作系统缓存,常见的如hosts文件
- 检查路由器缓存
- 如果前几步都没没找到,会向ISP(网络服务提供商)的LDNS服务器查询
如果LDNS服务器没找到,会向跟域名服务器(Root Server)请求解析,分为以下几步:
- 跟服务器返回顶级域名(TLD)服务器如.com,.cn,.org等的地址,全球只有13台,该例子中会返回.com的地址
- 接着向TLD发送请求,然后会返回次级域名(SLD)服务器的地址,本例子会返回.example的地址
- 接着向SLD域名服务器通过域名查询目标IP,本例子会返回www.example.com的地址
- Local DNS Server会缓存结果,并返回给用户,缓存在系统中。
DNS安全问题
- DNS反射/放大攻击
向大量开放DNS服务器发送大范围域名查询的DNS请求,并将该DNS请求的源IP地址伪造成想要攻击的目标IP地址。由于请求数据比相应数据小得多,攻击者可以利用该技术放大掌握的带宽资源和攻击流量。
- DDOS攻击可能造成域名解析瘫痪
- DNS/域名劫持
在劫持的网络范围内拦截域名解析的请求,分析请求的域名,返回假的IP地址或者使请求失去响应。DNS劫持通过篡改DNS服务器上的数据返回给用户一个错误的查询结果来实现的。 - DNS污染
DNS污染是一种让一般用户由于得到虚假目标主机IP而不能与其通信的方法,指的是用户访问一个地址,国内的服务器(非DNS)监控到用户访问的已经被标记地址时,服务器伪装成DNS服务器向用户发回错误的地址的行为。
dns污染与dns劫持的区别在于,dns劫持修改了dns的解析结果,dns污染是不经过dns服务器,返回错误信息
- DNS信息黑客被修改
DNS优化
可以看出,dns解析是一个漫长的过程,如何优化这一过程呢?
- DNS Prefetching
用户在请求某个链接之前,浏览器先尝试解析该链接的域名再将其进行缓存。这样真正请求的时候就不需要进行DNS解析。
可以
- 在服务器中响应设置
X-DNS-Prefetch-Control
的值为on
启动预解析 - HTML中,
<meta http-equiv="x-dns-prefetch-control" content="on">
- 对特定域名预解析
<link rel=”dns-prefetch” href=”//fonts.googleapis.com”>
域名收敛
建议将静态资源只放在一个域名下面,可以有效减少dns的请求
- httpdns
基于Http协议向HTTPDNS服务器发送域名解析请求,替代了基于DNS协议向运营商Local DNS发起解析请求的传统方式,可以避免运营商的域名劫持和进行精准调度。
这过程分为两步
- 客户端直接访问HttpDNS接口,获取业务在域名配置管理系统上配置的访问延迟最优的IP。(基于容灾考虑,还是保留次选使用运营商LocalDNS解析域名的方式)
- 客户端向获取到的IP后就向直接往此IP发送业务协议请求。以Http请求为例,通过在header中指定host字段,向HttpDNS返回的IP发送标准的Http请求即可。
CDN
CDN是什么
讲完DNS,现在可以开始讲CDN了,CDN的全称是Content Delivery Network,即内容分发网络,它能够实时地根据网络流量和各节点的连接、负载状况以及到用户的距离和响应时间等综合信息将用户的请求重新导向离用户最近的服务节点上。其目的是使用户可就近取得所需内容,解决 Internet网络拥挤的状况,提高用户访问网站的响应速度。
典型的CDN系统由下面三个部分组成
- 分发服务系统
最基本的工作单元就是Cache设备,cache(边缘cache)负责直接响应最终用户的访问请求,把缓存在本地的内容快速地提供给用 户。同时cache还负责与源站点进行内容同步,把更新的内容以及本地没有的内容从源站点获取并保存在本地。Cache设备的数量、规模、总服务能力是衡 量一个CDN系统服务能力的最基本的指标
- 负载均衡系统
主要功能是负责对所有发起服务请求的用户进行访问调度,确定提供给用户的最终实际访问地址。两级调度体系分为全局负载均衡(GSLB)和本 地负载均衡(SLB)。GSLB主要根据用户就近性原则,通过对每个服务节点进行“最优”判断,确定向用户提供服务的cache的物理位置。SLB主要负 责节点内部的设备负载均衡
- 运营管理系统
分为运营管理和网络管理子系统,负责处理业务层面的与外界系统交互所必须的收集、整理、交付工作,包含客户管理、产品管理、计费管理、统计分析等功能。
CDN的过程
使用CDN的方法很简单,只需要修改自己的DNS解析,设置一个CNAME指向CDN服务商即可。
用户访问未使用CDN缓存资源的过程为:
- 浏览器通过前面提到的过程对域名进行解析,以得到此域名对应的IP地址;
- 浏览器使用所得到的IP地址,向域名的服务主机发出数据访问请求;
- 服务器向浏览器返回响应数据
使用CDN后
- 当用户点击网站页面上的内容URL,经过本地DNS系统解析,DNS系统会最终将域名的解析权交给CNAME指向的CDN专用DNS服务器。
- CDN的DNS服务器将CDN的全局负载均衡设备IP地址返回用户。
- 用户向CDN的全局负载均衡设备发起内容URL访问请求。
- CDN全局负载均衡设备根据用户IP地址,以及用户请求的内容URL,选择一台用户所属区域的区域负载均衡设备,告诉用户向这台设备发起请求。
- 区域负载均衡设备会为用户选择一台合适的缓存服务器提供服务,选择的依据包括:根据用户IP地址,判断哪一台服务器距用户最近;根据用户所请求的URL中携带的内容名称,判断哪一台服务器上有用户所需内容;查询各个服务器当前的负载情况,判断哪一台服务器尚有服务能力。基于以上这些条件的综合分析之后,区域负载均衡设备会向全局负载均衡设备返回一台缓存服务器的IP地址。
- 全局负载均衡设备把服务器的IP地址返回给用户
- 用户向缓存服务器发起请求,缓存服务器响应用户请求,将用户所需内容传送到用户终端。如果这台缓存服务器上并没有用户想要的内容,而区域均衡设备依然将它分配给了用户,那么这台服务器就要向它的上一级缓存服务器请求内容,直至追溯到网站的源服务器将内容拉到本地。
上面的字太多,有点绕?通俗点就是用户访问的资源原本是存放在你自己的服务器,通过修改DNS让用户根据IP等情况来选择合适的CDN缓存服务器来获取资源。
CDN的优点
这样做有什么好处呢?
- 本地Cache加速,加快访问速度
- 镜像服务,消除运营商之间互联的瓶颈影响,保证不同网络的用户都能得到良好的访问质量
- 远程加速,自动选择cache服务器
- 带宽优化,分担网络流量,减轻压力,
- 集群抗攻击
- 节约成本
最后
本文章为前端进阶系列的一部分,
欢迎关注和star本博客或是关注我的github