计算机网络——应用层

本章讨论各种应用进程通过什么样的应用层协议来使用网络所提供的这些通信服务。

在上一章,我们已学习了运输层为应用进程提供了端到端的通信服务。但不同的网络应用的应用进程之间,还需要有不同的通信规则。因此在运输层协议之上,还需要有应用层协议(application layer protocol)。这是因为,每个应用层协议都是为了解决某一类应用问题,而问题的解决又必须通过位于不同主机中的多个应用进程之间的通信和协同工作来完成。应用进程之间的这种通信必须遵循严格的规则。应用层的具体内容就是精确定义这些通信规则。具体来说,应用层协议应当定义:

  • 应用进程交换的报文类型,如请求报文和响应报文。
  • 各种报文类型的语法,如报文中的各个字段及其详细描述。
  • 字段的语义,即包含在字段中的信息的含义。
  • 进程何时、如何发送报文,以及对报文进行响应的规则。

请注意,应用层协议与网络应用并不是同一个概念。应用层协议只是网络应用的一部分。例如,万维网应用是一种基于客户/服务器体系结构的网络应用。万维网应用包含很多部件,有万维网浏览器、万维网服务器、万维网文档的格式标准,以及一个应用层协议。万维网的应用层协议是HTTP,它定义了在万维网浏览器和万维网服务器之间传送的报文类型、格式和序列等规则。而万维网浏览器如何显示一个万维网页面,万维网服务器是用多线程还是用多进程来实现,则都不是HTTP所定义的内容。

应用层的许多协议都是基于客户服务器方式。即使是P2P对等通信方式,实质上也是一种特殊的客户服务器方式。这里再明确一下,客户(client)和服务器(server)都是指通信中所涉及的两个应用进程。客户服务器方式所描述的是进程之间服务和被服务的关系。这里最主要的特征就是:客户是服务请求方,服务器是服务提供方。

域名系统DNS

域名系统概述

域名系统DNS (Domain Name System)是互联网使用的命名系统,用来把便于人们使用的机器名字转换为IP地址。域名系统其实就是名字系统。为什么不叫“名字"而叫“域名"昵?这是因为在这种互联网的命名系统中使用了许多的“域"(domain),因此就出现了“域名”这个名词。“域名系统”很明确地指明这种系统是用在互联网中的。

许多应用层软件经常直接使用域名系统DNS。虽然计算机的用户只是间接而不是直接使用域名系统,但DNS却为互联网的各种网络应用提供了核心服务。

用户与互联网上某台主机通信时,必须要知道对方的IP地址。然而用户很难记住长达32位的二进制主机地址。即使是点分十进制IP地址也并不太容易记忆。但在应用层为了便于用户记忆各种网络应用,连接在互联网上的主机不仅有IP地址,而且还有便于用户记忆的主机名字。域名系统DNS能够把互联网上的主机名字转换为IP地址。

互联网的域名系统DNS被设计成为一个联机分布式数据库系统,并釆用客户服务器方式。DNS使大多数名字都在本地进行解析(resolve),仅少量解析需要在互联网上通信,因此DNS系统的效率很高。由于DNS是分布式系统,即使单个计算机出了故障,也不会妨碍整个DNS系统的正常运行。

域名到IP地址的解析是由分布在互联网上的许多域名服务器程序(可简称为域名服务器)共同完成的。域名服务器程序在专设的结点上运行,而人们也常把运行域名服务器程序的机器称为域名服务器

域名到IP地址的解析过程的要点如下:当某一个应用进程需要把主机名解析为IP地址时,该应用进程就调用解析程序(resolver),并成为DNS的一个客户,把待解析的域名放在DNS请求报文中,以UDP用户数据报方式发给本地域名服务器(使用UDP是为了减少开销)。本地域名服务器在查找域名后,把对应的IP地址放在回答报文中返回。应用进程获得目的主机的IP地址后即可进行通信

互联网的域名结构

早期的互联网使用了非等级的名字空间,其优点是名字简短。但当互联网上的用户数急剧增加时,用非等级的名字空间来管理一个很大的而且是经常变化的名字集合是非常困难的。因此,互联网后来就釆用了层次树状结构的命名方法,就像全球邮政系统和电话系统那样。釆用这种命名方法,任何一个连接在互联网上的主机或路由器,都有一个唯一的层次结构的名字,即域名(domain name)。这里,“域"(domain)是名字空间中一个可被管理的划分。域还可以划分为子域,而子域还可继续划分为子域的子域,这样就形成了顶级域、二级域、三级域,等等。

从语法上讲,每一个域名都由标号(label)序列组成,而各标号之间用点隔开(请注意,是小数点不是中文的句号“。“)。例如下面的域名

计算机网络——应用层

就是中央电视台用于收发电子邮件的计算机(即邮件服务器)的域名,它由三个标号组成,其中标号com是顶级域名,标号cctv是二级域名,标号mail是三级域名。

DNS规定,域名中的标号都由英文字母和数字组成,每一个标号不超过63个字符(但为了记忆方便,最好不要超过12个字符),也不区分大小写字母(例如,CCTV或cctv在域名中是等效的)。标号中除连字符(-)外不能使用其他的标点符号。级别最低的域名写在最左边,而级别最高的顶级域名则写在最右边。由多个标号组成的完整域名总共不超过255个字符。DNS既不规定一个域名需要包含多少个下级域名,也不规定每一级的域名代表什么意思。各级域名由其上一级的域名管理机构管理,而最高的顶级域名则由ICANN进行管理。用这种方法可使每一个域名在整个互联网范围内是唯一的,并且也容易设计出一种查找域名的机制。

需要注意的是,域名只是个逻辑概念,并不代表计算机所在的物理地点。变长的域名和使用有助记忆的字符串,是为了便于人使用。而IP地址是定长的32位二进制数字则非常便于机器进行处理。这里需要注意,域名中的“点”和点分十进制IP地址中的“点”并无一一对应的关系。点分十进制IP地址中一定是包含三个“点”,但每一个域名中“点"的数目则不一定正好是三个。

据2012年5月的统计[W-IANA-root],现在顶级域名TLD (Top Level Domain)已有326个。原先的顶级域名共分为三大类:

  1. 国家顶级域名nTLD:釆用ISO 3166的规定。如:cn表示中国,us表示美国,uk表示英国,等等。国家顶级域名又常记为ccTLD (cc表示国家代码country-code)。到2012年5月为止,国家顶级域名总数己达296个。
  2. 通用顶级域名gTLD:到2006年12月为止,通用顶级域名的总数已经达到20个。最先确定的通用顶级域名有7个,即:com (公司企业),net (网络服务机构),org (非营利性组织),int (国际组织),edu(美国专用的教育机构).gov (美国的政府部门),mil表示(美国的军事部门)。以后又陆续增加了 13个通用顶级域名:aero (航空运输企业),asia (亚太地区),biz (公司和企业),cat (使用加泰隆人的语言和文化团体),coop (合作团体),info (各种情况),jobs (人力资源管理者),mobi (移动产品与服务的用户和提供者),museum (博物馆),name (个人),pro (有证书的专业人员),tel (Telnic股份有限公司),travel (旅游业)。
  3. 基础结构域名(in&astructure domain):这种顶级域名只有一个,即arpa,用于反向域名解析,因此又称为反向域名。

值得注意的是,ICANN于2011年6月20日在新加坡会议上正式批准新顶级域名(NewgTLD),因此任何公司、机构都有权向ICANN申请新的顶级域。新顶级域名的后缀特点,使企业域名具有了显著的、强烈的标志特征。因此,新顶级域名被认为是真正的企业网络商标。新顶级域名是企业品牌战略发展的重要内容,其申请费很高(18万美元),并且在2013年开始启用。目前已有一些由两个汉字组成的中文的顶级域名出现了,例如,商城、公司、新闻等。到2016年,在ICANN注册的中文顶级域名已有60个[W-IANA-root]。

在国家顶级域名下注册的二级域名均由该国家自行确定。例如,顶级域名为jp的日本,将其教育和企业机构的二级域名定为ac和co,而不用edu和com。

我国把二级域名划分为“类别域名”和“行政区域名”两大类。“类别域名"共7个,分别为:ac (科研机构),com (工、商、金融等企业),edu(中国的教育机构),gov (中国的政府机构),mil (中国的国防机构),net (提供互联网络服务的机构),org (非营利性的组织)。“行政区域名"共34个,适用于我国的各省、自治区、直辖市。例如:bj (北京市),js (江苏省),等等。关于我国的互联网络发展现状以及各种规定(如申请域名的手续),均可在中国互联网网络信息中心CNNIC的网址上找到[W-CNNIC]。

用域名树来表示互联网的域名系统是最清楚的。图6-1是互联网域名空间的结构,它实际上是一个倒过来的树,在最上面的是根,但没有对应的名字。根下面一级的节点就是最高一级的顶级域名(由于根没有名字,所以在根下面一级的域名就叫做顶级域名)。顶级域名可往下划分子域,即二级域名。再往下划分就是三级域名、四级域名,等等。图6-1列举了一些域名作为例子。凡是在顶级域名com下注册的单位都获得了一个二级域名。图中给出的例子有:中央电视台cctv,以及IBM、华为等公司。在顶级域名cn (中国)下面举出了几个二级域名,如:bj, edu以及com。在某个二级域名下注册的单位就可以获得一个三级域名。图中给出的在edu下面的三级域名有:tsinghua (清华大学)和pku (北京大学)。
一旦某个单位拥有了一个域名,它就可以自己决定是否要进一步划分其下属的子域,并且不必由其上级机构批准。图中cctv (中央电视台)和tsinghua (清华大学)都分别划分了自己的下一级的域名mail和www (分别是三级域名和四级域名)气域名树的树叶就是单台计算机的名字,它不能再继续往下划分子域了。

计算机网络——应用层

域名服务器

上面讲述的域名体系是抽象的。但具体实现域名系统则是使用分布在各地的域名服务器。从理论上讲,可以让每一级的域名都有一个相对应的域名服务器,使所有的域名服务器构成和图6-1相对应的“域名服务器树”的结构。但这样做会使域名服务器的数量太多,使域名系统的运行效率降低。因此DNS就釆用划分区的办法来解决这个问题。

一个服务器所负责管辖的(或有权限的)范围叫做区(zone)。各单位根据具体情况来划分自己管辖范围的区。但在一个区中的所有节点必须是能够连通的。每一个区设置相应的权限域名服务器(authoritative name server),用来保存该区中的所有主机的域名到IP地址的映射。总之,DNS服务器的管辖范围不是以“域”为单位,而是以“区”为单位。区是DNS服务器实际管辖的范围。区可能等于或小于域,但一定不能大于域。

图6-2是区的不同划分方法的举例。假定abc公司有下属部门x和y,部门x下面又分三个分部门u, v和w,而y下面还有其下属部门to图6-2(a)表示abc公司只设一个区abc.com。这时,区abc.com和域abc.com指的是同一件事。但图6-2(b)表示abc公司划分了两个区(大的公司可能要划分多个区):abc.com和y.abc.como这两个区都隶属于域abc.com,都各设置了相应的权限域名服务器。不难看出,区是“域"的子集。

计算机网络——应用层

图6-3以图6-2(b)中公司abc划分的两个区为例,给出了 DNS域名服务器树状结构图。这种DNS域名服务器树状结构图可以更准确地反映出DNS的分布式结构。在图6-3中的每一个域名服务器都能够进行部分域名到IP地址的解析。当某个DNS服务器不能进行域名到IP地址的转换时,它就设法找互联网上别的域名服务器进行解析。

计算机网络——应用层

从图6-3可看出,互联网上的DNS域名服务器也是按照层次安排的。每一个域名服务器都只对域名体系中的一部分进行管辖。根据域名服务器所起的作用,可以把域名服务器划分为以下四种不同的类型:

根域名服务器(root name server)

根域名服务器是最高层次的域名服务器,也是最重要的域名服务器。所有的根域名服务器都知道所有的顶级域名服务器的域名和IP地址。根域名服务器是最重要的域名服务器,因为不管是哪一个本地域名服务器,若要对互联网上任何一个域名进行解析(即转换为IP地址),只要自己无法解析,就首先要求助于根域名服服务器

顶级域名服务器(即TLD服务器)

这些域名服务器负责管理在该顶级域名服务器注册的所有二级域名。当收到DNS査询请求时,就给出相应的回答(可能是最后的结果,也可能是下一步应当找的域名服务器的IP地址)。

权限域名服务器

这就是前面已经讲过的负责一个区的域名服务器。当一个权限域名服务器还不能给出最后的査询回答时,就会告诉发出查询请求的DNS客户,下一步应当找哪一个权限域名服务器。例如在图6-2(b)中,区abc.com和区y.abc.com各设有一个权限域名服务器。

本地域名服务器(local name server)

本地域名服务器并不属于图6-3所示的域名服务器层次结构,但它对域名系统非常重要。

当一台主机发出DNS査询请求时,这个査询请求报文就发送给本地域名服务器。由此可看出本地域名服务器的重要性。每一个互联网服务提供者ISP,或一个大学,甚至一个大学里的系,都可以拥有一个本地域名服务器,这种域名服务器有时也称为默认域名服务器。

本地域名服务器离用户较近,一般不超过几个路由器的距离。当所要査询的主机也属于同一个本地ISP时,该本地域名服务器立即就能将所查询的主机名转换为它的IP地址,而不需要再去询问其他的域名服务器。

下面简单讨论一下域名的解析过程。这里要注意两点。

第一,主机向本地域名服务器的查询一般都是采用递归查询(recursive quay)。(较少使用)

所谓递归查询就是:如果主机所询问的本地域名服务器不知道被査询域名的IP地址,那么本地域名服务器就以DNS客户的身份,向其他根域名服务器继续发出査询请求报文(即替该主机继续査询),而不是让该主机自己进行下一步的査询。因此,递归査询返回的査询结果或者是所要査询的IP地址,或者是报错,表示无法査询到所需的IP地址。

第二,本地域名服务器向根域名服务器的查询通常是釆用迭代查询(iterative query)。

迭代査询的特点是这样的:当根域名服务器收到本地域名服务器发出的迭代査询请求报文时,要么给出所要查询的IP地址,要么告诉本地域名服务器:“你下一步应当向哪一个域名服务器进行查询”。然后让本地域名服务器进行后续的查询(而不是替本地域名服务器进行后续的查询)。根域名服务器通常是把自己知道的顶级域名服务器的IP地址告诉本地域名服务器,让本地域名服务器再向顶级域名服务器查询。顶级域名服务器在收到本地域名服务器的査询请求后,要么给出所要査询的IP地址,要么告诉本地域名服务器下一步应当向哪一个权限域名服务器进行査询,本地域名服务器就这样进行迭代査询。最后,知道了所要解析的
域名的IP地址,然后把这个结果返回给发起査询的主机。当然,本地域名服务器也可以釆用递归查询,这取决于最初的查询请求报文的设置是要求使用哪一种査询方式。

图6-5用例子说明了这两种査询的区别。

计算机网络——应用层

假定域名为rn.xyz.com的主机想知道另一台主机(域名为y.abc.com)的IP地址。例如,主机rn.xyz.com打算发送邮件给主机y.abc.com。这时就必须知道主机y.abc.com的IP地址。下面是图6-5(a)的几个査询步骤:

  1. 主机rn.xyz.com先向其本地域名服务器dns.xyz.com进行递归査询。
  2. 本地域名服务器采用迭代査询。它先向一个根域名服务器査询。
  3. 根域名服务器告诉本地域名服务器,下一次应査询的顶级域名服务器dns.com的IP地址。
  4. 本地域名服务器向顶级域名服务器dns.com进行査询。
  5. 顶级域名服务器dns.com告诉本地域名服务器,下一次应查询的权限域名服务器dns.abc.com 的 IP 地址。
  6. 本地域名服务器向权限域名服务器dns.abc.com进行査询。
  7. 权限域名服务器dns.abc.com告诉本地域名服务器,所查询的主机的IP地址。
  8. 本地域名服务器最后把査询结果告诉主机rn.xyz.como

我们注意到,这8个步骤总共要使用8个UDP用户数据报的报文。本地域名服务器经过三次迭代查询后,从权限域名服务器dns.abc.com得到了主机y.abc.com的IP地址,最后把结果返回给发起査询的主机rn.xyz.com 。

图6-5(b)是本地域名服务器釆用递归査询的情况。在这种情况下,本地域名服务器只需向根域名服务器查询一次,后面的几次査询都是在其他几个域名服务器之间进行的(步骤3至6)。只是在步骤7,本地域名服务器从根域名服务器得到了所需的IP地址。最后在步骤8,本地域名服务器把査询结果告诉主机m.xyz.como整个的査询也是使用8个UDP报文。

为了提高DNS查询效率,并减轻根域名服务器的负荷和减少互联网上的DNS査询报文数量,在域名服务器中广泛地使用了高速缓存(有时也称为高速缓存域名服务器)。高速缓存用来存放最近査询过的域名以及从何处获得域名映射信息的记录。

例如,在图6-5(a)的査询过程中,如果在不久前已经有用户査询过域名为y.abc.com的IP地址,那么本地域名服务器就不必向根域名服务器重新查询y.abc.com的IP地址,而是直接把高速缓存中存放的上次査询结果(即y.abc.com的IP地址)告诉用户。

假定本地域名服务器的缓存中并没有y.abc.com的IP地址,而是存放着顶级域名服务器dns.com的IP地址,那么本地域名服务器也可以不向根域名服务器进行査询,而是直接向com顶级域名服务器发送查询请求报文。这样不仅可以大大减轻根域名服务器的负荷,而且也能够使互联网上的DNS査询请求和回答报文的数量大为减少。

由于名字到地址的绑定并不经常改变,为保持高速缓存中的内容正确,域名服务器应为每项内容设置计时器并处理超过合理时间的项(例如,每个项目只存放两天)。当域名服务器己从缓存中删去某项信息后又被请求査询该项信息,就必须重新到授权管理该项的域名服务器获取绑定信息。

文件传送协议

FTP概述

文件传送协议FTP (File Transfer Protocol) [RFC 959]是互联网上使用得最广泛的文件传送协议。FTP提供交互式的访问,允许客户指明文件的类型与格式(如指明是否使用ASCH码),并允许文件具有存取权限(如访问文件的用户必须经过授权,并输入有效的口令FTP屏蔽了各计算机系统的细节,因而适合于在异构网络中任意计算机之间传送文件。RFC959很早就成为了互联网的正式标准。

在互联网发展的早期阶段,用FTP传送文件约占整个互联网的通信量的三分之一,而由电子邮件和域名系统所产生的通信量还小于FTP所产生的通信量。只是到了 1995年,WWW的通信量才首次超过了 FTP。

文件共享协议中的另一大类是联机访问(on-line access)。联机访问意味着允许多个程序同时对一个文件进行存取。和数据库系统的不同之处是用户不需要调用一个特殊的客户进程,而是由操作系统提供对远地共享文件进行访问的服务,就如同对本地文件的访问一样。这就使用户可以用远地文件作为输入和输出来运行任何应用程序,而操作系统中的文件系统则提供对共享文件的透明存取。透明存取的优点是:将原来用于处理本地文件的应用程序用来处理远地文件时,不需要对该应用程序作明显的改动

FTP的基本工作原理

网络环境中的一项基本应用就是将文件从一台计算机中复制到另一台可能相距很远的
计算机中。初看起来,在两台主机之间传送文件是很简单的事情。其实这往往非常困难。原
因是众多的计算机厂商研制出的文件系统多达数百种,且差别很大。经常遇到的问题是:

  1. 计算机存储数据的格式不同。
  2. 文件的目录结构和文件命名的规定不同。
  3. 对于相同的文件存取功能,操作系统使用的命令不同。
  4. 访问控制方法不同。

文件传送协议FTP只提供文件传送的一些基本的服务,它使用TCP可靠的运输服务。FTP的主要功能是减少或消除在不同操作系统下处理文件的不兼容性。

FTP使用客户服务器方式。一个FTP服务器进程可同时为多个客户进程提供服务。FTP的服务器进程由两大部分组成:一个主进程,负责接受新的请求;另外有若干个从属进程,负责处理单个请求。

主进程的工作步骤如下:

  1. 打开熟知端口(端口号为21),使客户进程能够连接上。
  2. 等待客户进程发出连接请求。
  3. 启动从属进程处理客户进程发来的请求。从属进程对客户进程的请求处理完毕后即终止,但从属进程在运行期间根据需要还可能创建其他一些子进程。
  4. 回到等待状态,继续接受其他客户进程发来的请求。主进程与从属进程的处理是并
    发进行的。

FTP的工作情况如图6-6所示。图中的椭圆圈表示在系统中运行的进程。图中的服务器端有两个从属进程:控制进程和数据传送进程。为简单起见,服务器端的主进程没有画上。客户端除了控制进程和数据传送进程外,还有一个用户界面进程用来和用户接口。

在进行文件传输时,FTP的客户和服务器之间要建立两个并行的TCP连接:“控制连接"和“数据连接控制连接在整个会话期间一直保持打开,FTP客户所发出的传送请求,通过控制连接发送给服务器端的控制进程,但控制连接并不用来传送文件。实际用于传输文件的是“数据连接"。服务器端的控制进程在接收到FTP客户发送来的文件传输请求后就创建“数据传送进程"和“数据连接",用来连接客户端和服务器端的数据传送进程。数据传送进程实际完成文件的传送,在传送完毕后关闭“数据传送连接”并结束运行。由于FTP使用了一个分离的控制连接,因此FTP的控制信息是带外(out of band)传送的。

计算机网络——应用层

计算机网络——应用层

相关推荐