Apache Rewrite详解
Rewrite的需求
在用Apache做web服务器的时候,有的时候需要将输入的URL转换成另一个URL这种需求。比如用CodeIgniter框架开发web应用的时候,我们访问的所有路径都要经过index.php,由这个index.php做统一路由,访问地址如下:
example.com/index.php/news/article/my_article
每次访问都带着index.php,实在太多余了,我们想要一个干净的地址如下:
example.com/news/article/my_article
这时你的 Apache 服务器需要启用mod_rewrite,然后简单的通过一个 .htaccess 文件再加上一些简单的规则就可以移除URL中的 index.php 了。下面是这个文件的一个例子, 其中使用了 "否定条件" 来排除某些不需要重定向的项目:
RewriteEngine On RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^(.*)$ index.php/$1 [L]
在上面的例子中,除已存在的目录和文件,其他的 HTTP 请求都会经过你的 index.php 文件。也就是说单用户在地址栏里输入【example.com/news/article/my_article】的时候实际上访问的是【example.com/index.php/news/article/my_article】。
Rewrite使用详解
确认Apache是否加载了Rewrite模块
Apache2.x
LoadModule rewrite_module modules/mod_rewrite.so
启用.htaccess
AllowOverride None 修改为: AllowOverride All
RewriteCond 与 RewriteRule
学习Rewrite需要重点了解它的三个核心:RewriteEngine,RewriteCond,RewriteRule。
RewriteEngine
这个是rewrite功能的总开关,用来开启是否启动url rewrite
RewriteEngine on
RewriteCond
RewriteCond就是一个过滤条件,简单来说,当URL满足RewriteCond配置的条件的情况,就会执行RewriteCond下面紧邻的RewriteRule语句。
RewriteCond的格式如下:RewriteCond %{NAME_OF_VARIABLE} REGX FLAG
举个例子:
RewriteEngine on RewriteCond %{HTTP_USER_AGENT} ^Mozilla//5/.0.* RewriteRule index.php index.m.php
如果设置上面的匹配规则,到来的http请求头中的HTTP_USER_AGENT匹配【^Mozilla//5/.0.*】正则表达式的话,则执行下面的RewriteRule,也就是说访问路径会跳转到 index.m.php这个文件。
RewriteCond 和 RewriteRule 是上下对应的关系。可以有1个或者好几个RewriteCond来匹配一个RewriteRule
那么RewriteCond可以匹配什么样的数据请求呢?
RewriteCond %{HTTP_REFERER} (www.test.cn) RewriteCond %{HTTP_USER_AGENT} ^Mozilla//5/.0.* RewriteCond %{REQUEST_FILENAME} !-f
上面是常见的3种最常见使用最多的HTTP头连接与请求匹配。
- HTTP_REFERER 当前请求页面的来源页面的地址
- 当前请求头中 User-Agent: 项的内容,如果存在的话。该字符串表明了访问该页面的用户代理的信息。一个典型的例子是:Mozilla/5.0 (Windows NT 10.0; WOW64; rv:64.0) Gecko/20100101 Firefox/64.0。
- REQUEST_FILENAME 当前请求的文件名
RewriteRule 写法和规则
RewriteRule是配合RewriteCond一起使用,可以说,RewriteRule是RewriteCond成功匹配后的执行结果,所以,它是很重要的。
RewriteRule的格式
RewriteRule Pattern Substitution [flags]
Pattern是一个正则匹配。Substitution是匹配的替换 [flags]是一些参数限制;
举几个栗子:
RewriteRule ^room/video/(\d+)\.html web/index\.php?c=room&a=video&r=$1 [QSA,NC,L]
意思是以 room开头的 room/video/123.html 这样子,变成 web/index.php?c=room&a=video&r=123
RewriteRule \.(jpg|gif) http://image.baidu.com/ [R,NC,L]
意思是以为是访问.jpg或者gif的文件,都会调整到 http://image.baidu.com
从上面看出,掌握Rewrite,学习正则表达式是关键所在。
我们再看看[flags]是什么意思?
因为它太多了。我就挑几个最常用的来说说。
- [QSA] qsappend(追加查询字符串)的意思,次标记强制重写引擎在已有的替换字符串中追加一个查询字符串,而不是简单的替换。如果需要通过重写规则在请求串中增加信息,就可以使用这个标记。上面那个room的例子,就必须用它。
- [NC] nocase(忽略大小写)的意思,它使Pattern忽略大小写,也就是在Pattern与当前URL匹配时,"A-Z"和"a-z"没有区别。这个一般也会加上,因为我们的url本身就不区分大小写的。
- [R] redirect(强制重定向)的意思,适合匹配Pattern后,Substitution是一个http地址url的情况,就定向出去了。上面那个定向到image.baidu.com的例子,就必须也用它。
- [L] last(结尾规则)的意思,就是已经匹配到了,就立即停止,不再匹配下面的Rule了,类似于编程语言中的break语法,跳出去了。