浏览器缓存_HTTP Cache-control

gxyblue

2012-03-05

HTTP协议分别在 1.0 / 1.1 两个时代推出了 Expires / Cache-control 两种cache策略，这里我们无需了解全部的细节，无需记住整个RFC内容,但是当我们需要使用HTTP cache策略时，我们需要注意以下细节：

Expires是HTTP1.0那个时代的东西了，目前来看，可以不使用了，因为HTTP1.0的useragent占有率在0.1%以下（我们主要面向的web浏览器均默认使用HTTP1.1）,Cache-control是HTTP1.1的新特性，也是我们主要做文章使用cache策略的工具.

Cache策略：

#1保鲜期only

这个是最最基础的一种策略，只需要在响应头中设定：

Cache-control:max-age=[secs]

[secs]是cache在客户端存活的秒数，例如Cache-control:max-age=1800表明cache的时间是半小时,只使用这样一个声明就可以使浏览器能够将这个HTTP响应的内容写入临时目录做cache.

这里是简要过程:

I(1)浏览器第一次请求资源http://test.qq.com/test.cgi

(2)查询临时文件目录发现无cache存储，遂发出请求到webserver

(3)webserver响应资源，并设定Cache-control:max-age=300

(4)浏览器收到响应将资源呈献给用户的同时，在临时文件目录以"http://test.qq.com/test.cgi"为key缓存这个响应

---5分钟内---

II(1)浏览器再一次请求资源http://test.qq.com/test.cgi

(2)查询临时文件目录发现存在cache存储，检查保鲜期max-age，还未过期，则直接读取之，响应给用户

---5分钟后---

III(1)浏览器再一次请求资源http://test.qq.com/test.cgi

(2)查询临时文件目录发现存在cache存储，检查保鲜期max-age，已经过期，则发请求到web server

#2保鲜期+最后修改时间验证

这里的要素是，在给出保鲜期的同时，给出一个资源的验证方式：

Last-Modified:[UTCtime]

[UTCtime]标示这个响应资源的最后修改时间，例如Last-Modified:Mon,06Jul200909:21:48GMT

这个响应头只有配合Cache-control的时候才有实际价值，只是声明校验资源的方式，并不能影响资源的保鲜期时长

利用资源的可校验性，我们可以实现在cache的资源超过保鲜期浏览器再次请求时的304响应，令浏览器再次使用之前的cache

这里是简要过程：

I(1)同#1中I(1)

(2)同#1中I(2)

(3)webserver响应资源，并设定

Cache-control:max-age=300

Last-Modified:Mon,06Jul200909:21:48GMT

(4)同#1中I(4)

---5分钟内---

(同#1中II)

---5分钟后---

III(1)浏览器再一次请求资源http://test.qq.com/test.cgi

(2)查询临时文件目录发现存在cache存储，检查保鲜期max-age，已经过期发现资源具有Last-Modified声明，则为请求带上头If-Modified-Since:Mon,06Jul200909:21:48GMT发送请求到webserver

(3)webserver收到请求后发现有头If-Modified-Since则与被请求资源的最后修改时间进行比对,若最后修改时间较新，说明资源又被改动过，则响应整片资源内容，HTTP200(需要整块内容写为包体).若最后修改时间较旧，说明资源无新修改，则响应HTTP304(无需包体)，告知浏览器继续使用所保存的cache,(这里当然也可以根据自己的需要决定是200还是304，我们的CGI毕竟是一种原始的实现)

#3保鲜期+自定义标识验证

这里的要素是，在给出保鲜期的同时，给出另一种资源的验证方式：

ETag:[customflag]

[customflag]标示这个响应资源的由开发者自己确定的签名验证标识，例如ETag:"abcdefg",这个响应头只有配合Cache-control的时候才有实际价值，是声明校验资源的方式

ETag的使用为我们实现304响应提供了更多的灵活性，我们可以抛开必须将验证转化成时间格式的限制

这里是简要过程：

I(1)同#1中I(1)

(2)同#1中I(2)

(3)webserver响应资源，并设定

Cache-control:max-age=300

ETag:"abcdefg"

(4)同#1中I(4)

---5分钟内---

(同#1中II)

---5分钟后---

III(1)浏览器再一次请求资源http://test.qq.com/test.cgi

(2)查询临时文件目录发现存在cache存储，检查保鲜期max-age，已经过期发现资源具有ETag声明，则为请求带上头If-None-Match:"abcdefg",发送请求到webserver

(3)webserver收到请求后发现有头If-None-Match则与被请求资源的相应校验串进行比对,Etag可以是一个版本号，可以是短时间戳，可以是资源校验和(强烈不推荐使用)，或者干脆是一个常量(可以干脆拿来做容错)

If-None-Match发来的串与我们的自有值比对，根据我们自己的任何策略算法，可以自由决定如何返回浏览器，304或200

这里有一个使用ETag来做容错的例子(应用列表目前在使用):

(1)我们的每次正常返回都是200

Cache-control:max-age=1800

ETag:"anything"

这里anything是个常量，我们只用来告诉浏览器，cache过期要发带If-None-Match的请求过来

(2)这样来自客户端的一大部分请求基本上都会带上If-None-Match头，我们的CGI据此可以知道这个请求的客户端是否有cache,此时如果CGI联系server失败，那么可以直接返回304，驱使客户端使用上一次cache的正确结果，且更新保鲜期max-age为300秒,这样我们实现了一个基于HTTPcache的容错，如果我们的资源还能实现一套时间戳存储的话,那么我们可以在正常情况下也实现校验后的304，从而节省流量

这里还有一个比较惨的教训，国内www上都没有文献记载，全球业界也只有一点文献可以找到:

IE6 在资源有gzip压缩同时有ETag头时，cache后再次发请求不会带If-None-Match头！！！

参考：http://blog.csdn.net/youngerchen/article/details/6116147

=文章结束

cache-control 浏览器缓存临时文件

安科网

浏览器缓存_HTTP Cache-control

gxyblue

gxyblue

相关推荐

浏览器缓存剖析

网站优化：浏览器缓存控制简介及配置策略

Nginx静态文件缓存过期配置

HTTP协议（四）：缓存

http 缓存小结

深入剖析浏览器缓存策略

浏览器缓存整理

图解浏览器缓存，教你提高用户体验

HTTP缓存（Cache-Control、Expires 、ETag）

关于浏览器缓存的控制cache-control,expires,last-modified,etag,及编程示例

浏览器缓存机制学习总结

网站优化：浏览器缓存控制简介及配置策略

网站性能优化:cache-control设置详解

简单教学 apache 配置 Expire/Cache-Control 头

JSP禁用缓存常用方法

设置浏览器不缓存

浏览器缓存实现原理

浏览器缓存

HTTP 缓存的相关协议

Cache-Control参数

gxyblue