网站性能优化:cache-control设置详解

转自:http://www.ggseo.cn/blog/post/cache-control.html

很多与网站性能优化相关的帖子,大多只讲了应该怎么做,应该怎么设置,没有太多讲这些设置的相关解释及案例。此文重点介绍网站缓存cache-control,即哪些页面,哪些资源应该做网站缓存?并用京东的cache-control设置为案例做参考。

http响应头信息与搜索引擎蜘蛛,网站速度有着密切关系。通过设置相关头信息可以提高搜索引擎蜘蛛及用户的访问速度,提升网站有效内容的抓取量.下面重点介绍cache-control

cache-control是用于控制网页的缓存.常见的取值有private、no-cache、max-age、must-revalidate等,默认为private。

cache-control有哪些属性?

其作用根据不同的重新浏览方式分为以下几种情况:

cache-control

打开新窗口(_blank)

private、no-cache、must-revalidate再次访问服务器

Cache-control:max-age=5(表示当访问此网页后的5秒内再次访问不会去服务器)

在地址栏回车

值为private或must-revalidate则只有第一次访问时会访问服务器,以后就不再访问。

值为no-cache,那么每次都会访问。

值为max-age,则在过期之前不会重复访问。

按后退按扭

值为private、must-revalidate、max-age,则不会重访问,

值为no-cache,则每次都重复访问

按刷新按扭

无论为何值,都会重复访问

cache-control在哪里设置

001.gif

在IIS的网站属性中的http头信息选项卡中,勾选启用内容过期后有三个相关选项.

一、立即过期

启用此选项后,每次请求都会向服务器申请下载最新版本。浏览器不做缓存处理。状态返回码200。Cache信息是:no-cache。这种方式可以保证客户端看到的永远是最新版本,也就是说如果服务器端进行了更新,一定能被客户端看到。

二、此时段后过期与过期时间

这两种情况下,浏览器缓存将其作用。注意,第一次的状态是200,同时cache-control为30天(对应的秒数)。就是说这个网页会有30天的缓存。所以,而后的状态都会是304.

cache-control应该怎么设置更好?

对于图片,css,等长期不变化的内容应该设置较长的过期时间(如180天)

建议:

1.对于js和css可以独立到一个二级域名中,启用GZIP,且设置较长的过期时间

2.对于图片独立到另一个二级域名中,且设置较长的过期时间

对于静态文件(html)如果长期不更新也可以设置稍长的过期时间(如30天),需要根据当前网站的实际而定。

对于动态文件(php)可以设置较短的过期时间(如120秒)

注意:在过期时间内,如果您对文件内容进行了变化,对于用户或蜘蛛都不能浏览或抓取到你更改后的内容。这也是动态文件设置较短过期时间的主要原因。cache-control的设置只是为了节约搜索引擎蜘蛛资源,让其抓取更多有效内容,千万不能弄巧成拙。

cache-control设置案例(京东)

京东的html文件大多是产品及分类页面,设置的过期时间较短

css文件不是太长,可能由于是大网站,页面变化频率更快。对于不经常变化的css完全可以设置更长的过期时间

动态文件,这是京东的新闻内容,由于是新闻的原因,可能不常更新,所以反而设置的过期时间比静态文件长

图片文件设置了很长的过期时间,如果没算错应该是120天。

有兴趣的可以仔细研究,京东的大多类型不一样的页面的过期时间都是不同的。

网页的缓存是由HTTP消息头中的“Cache-control”来控制的,常见的取值有private、no-cache、max-age、must-revalidate等,默认为private。其作用根据不同的重新浏览方式分为以下几种情况:

(1)打开新窗口

如果指定cache-control的值为private、no-cache、must-revalidate,那么打开新窗口访问时都会重新访问服务器。而如果指定了max-age值,那么在此值内的时间里就不会重新访问服务器,例如:

Cache-control:max-age=5

表示当访问此网页后的5秒内再次访问不会去服务器

(2)在地址栏回车

如果值为private或must-revalidate(和网上说的不一样),则只有第一次访问时会访问服务器,以后就不再访问。如果值为no-cache,那么每次都会访问。如果值为max-age,则在过期之前不会重复访问。

(3)按后退按扭

如果值为private、must-revalidate、max-age,则不会重访问,而如果为no-cache,则每次都重复访问

(4)按刷新按扭

无论为何值,都会重复访问

当指定Cache-control值为“no-cache”时,访问此页面不会在Internet临时文章夹留下页面备份。

另外,通过指定“Expires”值也会影响到缓存。例如,指定Expires值为一个早已过去的时间,那么访问此网时若重复在地址栏按回车,那么每次都会重复访问:

Expires:Fri,31Dec199916:00:00GMT

在ASP中,可以通过Response对象的Expires、ExpiresAbsolute属性控制Expires值;通过Response对象的CacheControl属性控制Cache-control的值,例如:

Response.ExpiresAbsolute=#2000-1-1#'指定绝对的过期时间,这个时间用的是服务器当地时间,会被自动转换为GMT时间

Response.Expires=20'指定相对的过期时间,以分钟为单位,表示从当前时间起过多少分钟过期。

Response.CacheControl="no-cache"

Expires值是可以通过在Internet临时文件夹中查看临时文件的属性看到的。

数据包中的格式:

Cache-Control:cache-directive

cache-directive可以为以下:

request时用到:

|"no-cache"

|"no-store"

|"max-age""="delta-seconds

|"max-stale"["="delta-seconds]

|"min-fresh""="delta-seconds

|"no-transform"

|"only-if-cached"

|"cache-extension"

response时用到:

|"public"

|"private"["="<">field-name<">]

|"no-cache"["="<">field-name<">]

|"no-store"

|"no-transform"

|"must-revalidate"

|"proxy-revalidate"

|"max-age""="delta-seconds

|"s-maxage""="delta-seconds

|"cache-extension"

部分说明:

根据是否可缓存分为

Public指示响应可被任何缓存区缓存。

Private指示对于单个用户的整个或部分响应消息,不能被共享缓存处理。这允许服务器仅仅描述当用户的

部分响应消息,此响应消息对于其他用户的请求无效。

no-cache指示请求或响应消息不能缓存(HTTP/1.0用Pragma的no-cache替换)

根据什么能被缓存

no-store用于防止重要的信息被无意的发布。在请求消息中发送将使得请求和响应消息都不使用缓存。

根据缓存超时

max-age指示客户机可以接收生存期不大于指定时间(以秒为单位)的响应。

min-fresh指示客户机可以接收响应时间小于当前时间加上指定时间的响应。

max-stale指示客户机可以接收超出超时期间的响应消息。如果指定max-stale消息的值,那么客户机可以

接收超出超时期指定值之内的响应消息。

Expires表示存在时间,允许客户端在这个时间之前不去检查(发请求),等同max-age的

效果。但是如果同时存在,则被Cache-Control的max-age覆盖。

格式:

Expires="Expires"":"HTTP-date

例如

Expires:Thu,01Dec199416:00:00GMT(必须是GMT格式)

通过HTTP的META设置expires和cache-control

Html代码

<metahttp-equiv="Cache-Control"content="max-age=7200"/>

<metahttp-equiv="Expires"content="Mon,20Jul200923:00:00GMT"/>

[html]viewplaincopy

<metahttp-equiv="<spanclass="hilite1">Cache-Control</span>"content="max-age=7200"/><metahttp-equiv="<spanclass="hilite2">Expires</span>"content="Mon,20Jul200923:00:00GMT"/>

上述设置仅为举例,实际使用其一即可。这样写的话仅对该网页有效,对网页中的图片或其他请求无效,并不会做任何cache。

这样客户端的请求就多了,尽管只是检查Last-modified状态的东西,但是请求一多对浏览速度必定有影响。

如果要对文件添加cache可以通过apache的mod_expire模块,写法为

<IfModulemod_expires.c>

ExpiresActiveOn

ExpiresDefault"accessplus1days"

</IfModule>

记得ExpiresActive设为On,我起先没设置On,似乎怎样YSlow都查不到缓存机制。这样添加的话就是默认所有的。

如果要针对个别MIME类型则可以:

ExpiresByTypeimage/gif"accessplus5hours3minutes"

见ApacheModulemod_expires

另外,当点击浏览器上的刷新,客户端发送的请求中均是max-age=0,表示validate操作,发送请求到服务器

要求检查cache,再更新cache,一般得到的是304NotModified,表示没变动。

项目中使用过滤器来设置网页的缓存

FilterConfigfc;

publicvoiddoFilter(ServletRequestreq,ServletResponseres,

FilterChainchain)throwsIOException,ServletException{

HttpServletResponseresponse=(HttpServletResponse)res;

//settheprovidedHTTPresponseparameters

for(Enumeratione=fc.getInitParameterNames();e.hasMoreElements();){

StringheaderName=(String)e.nextElement();

response.addHeader(headerName,fc.getInitParameter(headerName));

}

//passtherequest/responseon

chain.doFilter(req,response);

}

配置文件的配置:

<filter>

<filter-name>NoCache</filter-name>

<filter-class>filter.CacheFilter</filter-class>

<init-param>

<param-name>Cache-Control</param-name>

<param-value>no-cache,must-revalidate</param-value>

</init-param>

</filter>

<filter>

<filter-name>CacheForWeek</filter-name>

<filter-class>filter.CacheFilter</filter-class>

<init-param>

<param-name>Cache-Control</param-name>

<param-value>max-age=604800</param-value>

</init-param>

</filter>

<filter-mapping>

<filter-name>CacheForWeek</filter-name>

<url-pattern>*.js</url-pattern>

</filter-mapping>

<filter-mapping>

<filter-name>CacheForWeek</filter-name>

<url-pattern>*.css</url-pattern>

</filter-mapping>

<filter-mapping>

<filter-name>CacheForWeek</filter-name>

<url-pattern>*.gif</url-pattern>

</filter-mapping>

上述设置保存了1周的缓存

相关推荐