HTTP协议Keep-Alive模式详解

88407013

2013-05-24

详见：http://blog.yemou.net/article/query/info/tytfjhfascvhzxcytp22

1、什么是Keep-Alive模式

我们知道HTTP协议采用“请求-应答”模式，当使用普通模式，即非KeepAlive模式时，每个请求/应答客户和服务器都要新建一个连接，完成之后立即断开连接(HTTP协议为无连接的协议)；当使用Keep-Alive模式(又称持久连接、连接重用)时，Keep-Alive功能使客户端到服务器端的连接持续有效，当出现对服务器的后继请求时，Keep-Alive功能避免了建立或者重新建立连接。

http1.0中默认是关闭的，需要在http头加入”Connection:Keep-Alive”，才能启用Keep-Alive；http1.1中默认启用Keep-Alive，如果加入”Connection:close“，才关闭。目前大部分浏览器都是用http1.1协议，也就是说默认都会发起Keep-Alive的连接请求了，所以是否能完成一个完整的Keep-Alive连接就看服务器设置情况。

2、启用Keep-Alive的优点

从上面的分析来看，启用Keep-Alive模式肯定更高效，性能更高。因为避免了建立/释放连接的开销。

下面是RFC2616上的总结：

ByopeningandclosingfewerTCPconnections,CPUtimeissavedinroutersandhosts(clients,servers,proxies,gateways,tunnels,orcaches),andmemoryusedforTCPprotocolcontrolblockscanbesavedinhosts.

HTTPrequestsandresponsescanbepipelinedonaconnection.Pipeliningallowsaclienttomakemultiplerequestswithoutwaitingforeachresponse,allowingasingleTCPconnectiontobeusedmuchmoreefficiently,withmuchlowerelapsedtime.

NetworkcongestionisreducedbyreducingthenumberofpacketscausedbyTCPopens,andbyallowingTCPsufficienttimetodeterminethecongestionstateofthenetwork.

LatencyonsubsequentrequestsisreducedsincethereisnotimespentinTCP'sconnectionopeninghandshake.

HTTPcanevolvemoregracefully,sinceerrorscanbereportedwithoutthepenaltyofclosingtheTCPconnection.ClientsusingfutureversionsofHTTPmightoptimisticallytryanewfeature,butifcommunicatingwithanolderserver,retrywitholdsemanticsafteranerrorisreported.

RFC2616(P47)还指出：单用户客户端与任何服务器或代理之间的连接数不应该超过2个。一个代理与其它服务器或代码之间应该使用不超过2*N的活跃并发连接。这是为了提高HTTP响应时间，避免拥塞(冗余的连接并不能代码执行性能的提升)。

3、如何判断消息内容/长度的大小

Keep-Alive模式，客户端如何判断请求所得到的响应数据已经接收完成(或者说如何知道服务器已经发生完了数据)？我们已经知道了，Keep-Alive模式发送玩数据HTTP服务器不会自动断开连接，所有不能再使用返回EOF(-1)来判断(当然你一定要这样使用也没有办法，可以想象那效率是何等的低)！下面我介绍两种来判断方法。

3.1、使用消息首部字段Conent-Length

故名思意，Conent-Length表示实体内容长度，客户端(服务器)可以根据这个值来判断数据是否接收完成。但是如果消息中没有Conent-Length，那该如何来判断呢？又在什么情况下会没有Conent-Length呢？请继续往下看……

3.2、使用消息首部字段Transfer-Encoding

当客户端向服务器请求一个静态页面或者一张图片时，服务器可以很清楚的知道内容大小，然后通过Content-length消息首部字段告诉客户端需要接收多少数据。但是如果是动态页面等时，服务器是不可能预先知道内容大小，这时就可以使用Transfer-Encoding：chunk模式来传输数据了。即如果要一边产生数据，一边发给客户端，服务器就需要使用”Transfer-Encoding:chunked”这样的方式来代替Content-Length。

chunk编码将数据分成一块一块的发生。Chunked编码将使用若干个Chunk串连而成，由一个标明长度为0的chunk标示结束。每个Chunk分为头部和正文两部分，头部内容指定正文的字符总数(十六进制的数字)和数量单位(一般不写)，正文部分就是指定长度的实际内容，两部分之间用回车换行(CRLF)隔开。在最后一个长度为0的Chunk中的内容是称为footer的内容，是一些附加的Header信息(通常可以直接忽略)。Chunk编码的格式如下：

Chunked-Body=*chunk

"0"CRLF

footer

CRLF

chunk=chunk-size[chunk-ext]CRLF

chunk-dataCRLF

hex-no-zero=<HEXexcluding"0">

chunk-size=hex-no-zero*HEX

chunk-ext=*(";"chunk-ext-name["="chunk-ext-value])

chunk-ext-name=token

chunk-ext-val=token|quoted-string

chunk-data=chunk-size(OCTET)

footer=*entity-header

即Chunk编码由四部分组成：1、0至多个chunk块，2、”0″CRLF，3、footer，4、CRLF.而每个chunk块由：chunk-size、chunk-ext(可选)、CRLF、chunk-data、CRLF组成。

4、消息长度的总结

其实，上面2中方法都可以归纳为是如何判断http消息的大小、消息的数量。RFC2616对消息的长度总结如下：一个消息的transfer-length(传输长度)是指消息中的message-body(消息体)的长度。当应用了transfer-coding(传输编码)，每个消息中的message-body(消息体)的长度(transfer-length)由以下几种情况决定(优先级由高到低)：

任何不含有消息体的消息(如1XXX、204、304等响应消息和任何头(HEAD，首部)请求的响应消息)，总是由一个空行(CLRF)结束。

如果出现了Transfer-Encoding头字段并且值为非“identity”，那么transfer-length由“chunked”传输编码定义，除非消息由于关闭连接而终止。

如果出现了Content-Length头字段，它的值表示entity-length(实体长度)和transfer-length(传输长度)。如果这两个长度的大小不一样(i.e.设置了Transfer-Encoding头字段)，那么将不能发送Content-Length头字段。并且如果同时收到了Transfer-Encoding字段和Content-Length头字段，那么必须忽略Content-Length字段。

如果消息使用媒体类型“multipart/byteranges”，并且transfer-length没有另外指定，那么这种自定界(self-delimiting)媒体类型定义transfer-length。除非发送者知道接收者能够解析该类型，否则不能使用该类型。

由服务器关闭连接确定消息长度。(注意：关闭连接不能用于确定请求消息的结束，因为服务器不能再发响应消息给客户端了。)

为了兼容HTTP/1.0应用程序，HTTP/1.1的请求消息体中必须包含一个合法的Content-Length头字段，除非知道服务器兼容HTTP/1.1。一个请求包含消息体，并且Content-Length字段没有给定，如果不能判断消息的长度，服务器应该用用400(badrequest)来响应；或者服务器坚持希望收到一个合法的Content-Length字段，用411(lengthrequired)来响应。

所有HTTP/1.1的接收者应用程序必须接受“chunked”transfer-coding(传输编码)，因此当不能事先知道消息的长度，允许使用这种机制来传输消息。消息不应该够同时包含Content-Length头字段和non-identitytransfer-coding。如果一个消息同时包含non-identitytransfer-coding和Content-Length，必须忽略Content-Length。

5、HTTP头字段总结

最后我总结下HTTP协议的头部字段。

1、Accept：告诉WEB服务器自己接受什么介质类型，/表示任何类型，type/*表示该类型下的所有子类型，type/sub-type。

2、Accept-Charset：浏览器申明自己接收的字符集Accept-Encoding：浏览器申明自己接收的编码方法，通常指定压缩方法，是否支持压缩，支持什么压缩方法(gzip，deflate)Accept-Language：浏览器申明自己接收的语言语言跟字符集的区别：中文是语言，中文有多种字符集，比如big5，gb2312，gbk等等。

3、Accept-Ranges：WEB服务器表明自己是否接受获取其某个实体的一部分(比如文件的一部分)的请求。bytes：表示接受，none：表示不接受。

4、Age：当代理服务器用自己缓存的实体去响应请求时，用该头部表明该实体从产生到现在经过多长时间了。

5、Authorization：当客户端接收到来自WEB服务器的WWW-Authenticate响应时，用该头部来回应自己的身份验证信息给WEB服务器。

6、Cache-Control：请求：no-cache(不要缓存的实体，要求现在从WEB服务器去取)max-age：(只接受Age值小于max-age值，并且没有过期的对象)max-stale：(可以接受过去的对象，但是过期时间必须小于max-stale值)min-fresh：(接受其新鲜生命期大于其当前Age跟min-fresh值之和的缓存对象)响应：public(可以用Cached内容回应任何用户)private(只能用缓存内容回应先前请求该内容的那个用户)no-cache(可以缓存，但是只有在跟WEB服务器验证了其有效后，才能返回给客户端)max-age：(本响应包含的对象的过期时间)ALL:no-store(不允许缓存)

7、Connection：请求：close(告诉WEB服务器或者代理服务器，在完成本次请求的响应后，断开连接，不要等待本次连接的后续请求了)。keepalive(告诉WEB服务器或者代理服务器，在完成本次请求的响应后，保持连接，等待本次连接的后续请求)。响应：close(连接已经关闭)。keepalive(连接保持着，在等待本次连接的后续请求)。Keep-Alive：如果浏览器请求保持连接，则该头部表明希望WEB服务器保持连接多长时间(秒)。例如：Keep-Alive：300

8、Content-Encoding：WEB服务器表明自己使用了什么压缩方法(gzip，deflate)压缩响应中的对象。例如：Content-Encoding：gzip

9、Content-Language：WEB服务器告诉浏览器自己响应的对象的语言。

10、Content-Length：WEB服务器告诉浏览器自己响应的对象的长度。例如：Content-Length:26012

11、Content-Range：WEB服务器表明该响应包含的部分对象为整个对象的哪个部分。例如：Content-Range:bytes21010-47021/47022

12、Content-Type：WEB服务器告诉浏览器自己响应的对象的类型。例如：Content-Type：application/xml

13、ETag：就是一个对象(比如URL)的标志值，就一个对象而言，比如一个html文件，如果被修改了，其Etag也会别修改，所以ETag的作用跟Last-Modified的作用差不多，主要供WEB服务器判断一个对象是否改变了。比如前一次请求某个html文件时，获得了其ETag，当这次又请求这个文件时，浏览器就会把先前获得的ETag值发送给WEB服务器，然后WEB服务器会把这个ETag跟该文件的当前ETag进行对比，然后就知道这个文件有没有改变了。

14、Expired：WEB服务器表明该实体将在什么时候过期，对于过期了的对象，只有在跟WEB服务器验证了其有效性后，才能用来响应客户请求。是HTTP/1.0的头部。例如：Expires：Sat,23May200910:02:12GMT

15、Host：客户端指定自己想访问的WEB服务器的域名/IP地址和端口号。例如：Host：rss.sina.com.cn

16、If-Match：如果对象的ETag没有改变，其实也就意味著对象没有改变，才执行请求的动作。

17、If-None-Match：如果对象的ETag改变了，其实也就意味著对象也改变了，才执行请求的动作。

18、If-Modified-Since：如果请求的对象在该头部指定的时间之后修改了，才执行请求的动作(比如返回对象)，否则返回代码304，告诉浏览器该对象没有修改。例如：If-Modified-Since：Thu,10Apr200809:14:42GMT

19、If-Unmodified-Since：如果请求的对象在该头部指定的时间之后没修改过，才执行请求的动作(比如返回对象)。

20、If-Range：浏览器告诉WEB服务器，如果我请求的对象没有改变，就把我缺少的部分给我，如果对象改变了，就把整个对象给我。浏览器通过发送请求对象的ETag或者自己所知道的最后修改时间给WEB服务器，让其判断对象是否改变了。总是跟Range头部一起使用。

21、Last-Modified：WEB服务器认为对象的最后修改时间，比如文件的最后修改时间，动态页面的最后产生时间等等。例如：Last-Modified：Tue,06May200802:42:43GMT

22、Location：WEB服务器告诉浏览器，试图访问的对象已经被移到别的位置了，到该头部指定的位置去取。例如：Location：http://i0.sinaimg.cn/dy/deco/2008/0528/sinahome_0803_ws_005_text_0.gif</a>

23、Pramga：主要使用Pramga:no-cache，相当于Cache-Control：no-cache。例如：Pragma：no-cache

24、Proxy-Authenticate：代理服务器响应浏览器，要求其提供代理身份验证信息。Proxy-Authorization：浏览器响应代理服务器的身份验证请求，提供自己的身份信息。

25、Range：浏览器(比如Flashget多线程下载时)告诉WEB服务器自己想取对象的哪部分。例如：Range:bytes=1173546-

26、Referer：浏览器向WEB服务器表明自己是从哪个网页/URL获得/点击当前请求中的网址/URL。例如：Referer：http://www.sina.com/</a>

27、Server:WEB服务器表明自己是什么软件及版本等信息。例如：Server：Apache/2.0.61(Unix)

28、User-Agent:浏览器表明自己的身份(是哪种浏览器)。例如：User-Agent：Mozilla/5.0(Windows;U;WindowsNT5.1;zh-CN;rv:1.8.1.14)Gecko/20080404Firefox/2、0、0、14

29、Transfer-Encoding:WEB服务器表明自己对本响应消息体(不是消息体里面的对象)作了怎样的编码，比如是否分块(chunked)。例如：Transfer-Encoding:chunked

30、Vary:WEB服务器用该头部的内容告诉Cache服务器，在什么条件下才能用本响应所返回的对象响应后续的请求。假如源WEB服务器在接到第一个请求消息时，其响应消息的头部为：Content-Encoding:gzip;Vary:Content-Encoding那么Cache服务器会分析后续请求消息的头部，检查其Accept-Encoding，是否跟先前响应的Vary头部值一致，即是否使用相同的内容编码方法，这样就可以防止Cache服务器用自己Cache里面压缩后的实体响应给不具备解压能力的浏览器。例如：Vary：Accept-Encoding

31、Via：列出从客户端到OCS或者相反方向的响应经过了哪些代理服务器，他们用什么协议(和版本)发送的请求。当客户端请求到达第一个代理服务器时，该服务器会在自己发出的请求里面添加Via头部，并填上自己的相关信息，当下一个代理服务器收到第一个代理服务器的请求时，会在自己发出的请求里面复制前一个代理服务器的请求的Via头部，并把自己的相关信息加到后面，以此类推，当OCS收到最后一个代理服务器的请求时，检查Via头部，就知道该请求所经过的路由。例如：Via：1.0236.D0707195.sina.com.cn:80(squid/2.6.STABLE13)

=====================================================================HTTP请求消息头部实例：Host：rss.sina.com.cnUser-Agent：Mozilla/5、0(Windows;U;WindowsNT5、1;zh-CN;rv:1、8、1、14)Gecko/20080404Firefox/2、0、0、14Accept：text/xml,application/xml,application/xhtml+xml,text/html;q=0、9,text/plain;q=0、8,image/png,/;q=0、5Accept-Language：zh-cn,zh;q=0、5Accept-Encoding：gzip,deflateAccept-Charset：gb2312,utf-8;q=0、7,*;q=0、7Keep-Alive：300Connection：keep-aliveCookie：userId=C5bYpXrimdmsiQmsBPnE1Vn8ZQmdWSm3WRlEB3vRwTnRtW<-CookieIf-Modified-Since：Sun,01Jun200812:05:30GMTCache-Control：max-age=0HTTP响应消息头部实例：Status：OK-200—响应状态码，表示web服务器处理的结果。Date：Sun,01Jun200812:35:47GMTServer：Apache/2.0.61(Unix)Last-Modified：Sun,01Jun200812:35:30GMTAccept-Ranges：bytesContent-Length：18616Cache-Control：max-age=120Expires：Sun,01Jun200812:37:47GMTContent-Type：application/xmlAge：2X-Cache：HITfrom236-41.D07071951.sina.com.cn—反向代理服务器使用的HTTP头部Via：1.0236-41.D07071951.sina.com.cn:80(squid/2.6.STABLE13)Connection：close

keep-alive http协议 alive

安科网

HTTP协议Keep-Alive模式详解

88407013

88407013

相关推荐

HttpClient连接池

浅谈Vue页面级缓存解决方案feb-alive(上)

4.5长连接

HTTP Header(协议头)与Keep-Alive模式详解

HTTP协议头部与Keep-Alive模式详解

HTTP Keep-Alive

通过vue提供的keep-alive减少对服务器的请求次数

vue项目优化之通过keep-alive数据缓存的方法

高并发场景下的httpClient优化使用

深入理解vue-router之keep-alive

http请求和响应格式

keep-alive遇见vue-router

http client 实现 keep-alive 源码探究

vue spa应用中的路由缓存问题与解决方案

vue的keep-alive中使用EventBus的方法

在移动端使用vue-router和keep-alive的方法示例

详解vue服务端渲染浏览器端缓存（keep-alive）

HTTP协议----（1）手工发送HTTP请求报文

Request、Response 之 Http 请求

隐藏nginx版本号

88407013