Apache+Tomcat+AJP

介绍

大部分一开始接触WEB服务器的人可能和我一样对为什么有Apache又有Tomcat服务器感到奇怪(它们还都是Apache开发的呵呵),其实他们不是冗余的服务器,虽然他们都能对外提供WEB服务器,但总的来说还是各有侧重点。下面做个简单介绍。

 

1.       Apache是世界排名第一的Web服务器;在Apache基金会里其永远被第一支持。而开源的Apache Tomcat也非常关注,由于开源,用户最支持。

2.       Apache支持静态页面,Tomcat支持动态页面(servlet, JSP);一般在使用Apache + Tomcat的配置下,Apache都是实现对JSP的转发,交给Tomcat来处理。Apache可以支持PHP,但如果要支持JAVA,就需要Tomcat来处理。

3.       Apache是Web服务器,Tomcat是应用(Java)服务器,它只是一个servlet容器,是Apache的扩展,但可以独立于Apache运行;如果以独立方式运行,功能与Apache等效,但对静态页面的处理不太理想。

通过上面分析,可以知道:

1.       Apache能有很好的静态页面处理能力,如果搭配Tomcat能同时支持静态和动态页面

2.       Tomcat能够承担性能要求较低的WEB应用。

负载均衡

 

为了提高整个系统的可用性和性能,常常会用到负载均衡,而Apache和Tomcat经常联合在一起来实现负载均衡技术。

主机Apache作为前段负载平衡服务器对用户进行分配,后端不同的Tomcat服务器最终处理请求,其中根据侧重点不同可以有两种不同的配置。

1.       增加系统可用性

保证多台Tomcat服务器之间会话的同步,确保任何一台当机都不会影响系统的运行,从而提高系统的可用性。

2.       提高系统性能

在负责负载平衡的Apache主机上记录每个请求的Session ID(这个ID是由Tomcat分配的)及回应Session的Tomcat Server对应关系,在下一个请求到来时先判断每个Session ID,如果有标识连接已经建立,那么转到对应服务器;负责就是新的连接,根据每个后台Tomcat服务器的状态分配一个服务器并记录Session ID.

如下图:

 

Apache+Tomcat+AJP

Apache + Tomcat配置

正如上面中看到的可以通过Apache +Tomcat来配置来达到较高WEB服务器同时,也能高正较高的可用性和系统性能。这些是通过Apache与Tomcat之间的通讯来完成的。Apache和Tomcat之间的通讯基本有三种方式:

1.       Mod_Jk

2.       HTTP_Proxy

3.       AJP_Proxy

这里主要介绍Mod_JK方式,其也是最流行的方式,并且官方的文档也非常全。

Mod_JK

Mod_JK是Apache的一个模块,其通过AJP协议实现Apache与Tomcat之间的通讯,而Tomcat默认监听AJP连接器的8009端口来接受AJP的连接请求;一般这些请求来自前端的Apache服务器。

由于Mod_JK已经被设计成Apache的一个模块,因此可以通过一些相对简单的配置就能达到Apache和Tomcat之间通讯的目的;同样包含负载均衡。

配置步骤

安装

1.       安装Apache HTTP服务器,从Apache官方网站下载;我安装的是Apache2.0.64

2.       安装Apache Tomcat,可以安装在Apache同一个机器,也可以在其他的机器,版本要与Mod_JK匹配

3.       下载Mod_Jk;这里注意要与Apache Tomcat匹配。

配置

加在Mod_Jk

Mod_Jk是在Apache HTTP服务器上被加载的,需要将下载下来的Mod_Jk.so放到Apache/Modules目录下,并修改httpd.conf,增加下面一行:

Include conf/mod_jk.conf

 

使用include命令包含mod_jk.conf,这个是我们自己添加的关于mod_jk的配置文件。

 

新建Mod_jk.conf,并添加如下内容:

#Load mod_jk module.

LoadModule jk_module modules/mod_jk.so

 

#Where to find workers.properties

JkWorkersFile conf/workers2.properties

JkMountFile conf/urimap.properties

 

#Where to put jk logs

JkLogFile logs/mod_jk.log

 

#Set the jk log level[debug/error/info]

JkLogLevel info

 

#Select the log format

JkLogStampFormat "[%a %b %d %H:%M:%S %Y]"

 

#JkRequestLogFormat set the request format

JkRequestLogFormat "%w %V %T"

 

JkMount /* loadbalancer

 

上面包含了两个properties文件,分别是workers2.properties和urimap.properties。

Workers2.properties用于说明Tomcat服务器的负载均衡配置方法,具体如下:#worker.list=loadbalancer

worker.list=loadbalancer,tomcat1,tomcat2  #server 列表

 

#define the first node

worker.tomcat1.port=8009

worker.tomcat1.host=10.224.70.57

worker.tomcat1.type=ajp13

worker.tomcat1.lbfactor=1

 

#define the first node

worker.tomcat2.port=8009

worker.tomcat2.host=10.224.70.57

worker.tomcat2.type=ajp13

worker.tomcat2.lbfactor=1

 

#Now we define the load-balancing behavior

worker.loadbalancer.type=lb

worker.loadbalancer.balance_workers=tomcat1, tomcat2

 

worker.loadbalancer.sticky_session=true

 

worker.loadbalancer.sticky_session_force=true

在Mod_jk.conf中有JkMount /* loadbalancer,这个loadbalancer正好对应上面worker.list一行的loadbalancer。

另外tomcat1和tomcat2是配置的后台tomcat服务器;当然这里只有一台服务器,所以两个worker都是同样的地址。lbfactor表示在负载均衡算法中采用的权重。

 

另外在urimap.properties文件中说明了哪些请求会转交给Tomcat服务器,配置项为:

!/*.htm=loadbalancer

注意这里的表示*.htm的请求都到loadbalancer;这个loadbalancer是上文中的loadbalancer。

至此Apache和Tomcat之间的负载均衡已经被配置好了。

 

运行时观察

这里主要观察session的stickiness是如何被实现的;已经Apache服务器如何了解到关于Session ID相关的信息。
实际上对于负载均衡来说,如果上面的例子中你配置了两个Tomcat,那么关闭sticky_session的情况下,每个Tomcat服务器将轮流收到请求。

 

其实在试验的时候发现session ID是Tomcat服务器分配创建的,Apache服务器只是用来管理其与Tomcat服务器之间的关系;当然Apache服务器需要检查每次请求中的Session ID。这个ID是由Tomcat分配的;Tomcat对于每个第一次请求的动态页面都会生成JSESSIONID;而对于静态页面是不会生成JESSIONID的。

具体运行过程:

1.       Apache服务器接收到来自client的请求,检查HTTP请求是否包含SESSIONID

2.       如果不包含,采用负载均衡算法选择一个Tomcat服务器

3.       Apache服务器将这个client请求转发到选定Tomcat服务器的8009端口,数据包的格式是AJP协议

4.       Tomcat解析AJP协议,生成SESSION ID并且取得响应,将结果发送给Apache服务器,这个是通过之前的8009连接过来的链接发送回去的。

5.       Apache服务器解析AJP包,并得到SESSION ID信息,并将其与对应的服务器(和会话)关联起来。

6.       Apache将SESSION ID转发给client

7.       Client将Session ID保存到Cookie中用于下次使用。

Packet No

Apache

Tomcat:8009

1

2:REQ:GET /index.jsp HTTP/1.1 à

 

2

 

ß2:RSP:send headers:200 OK

3

 

ß2:RSP:SEND BODY CHUNK

4

 

ß2:RSP:END RESPONSE

 

通常这个连接建立好了之后短时间是不会断,不过这是可以通过参数来配置的。

在上面的包交互过程中:第2个包包含了SESSION ID的信息;内容类似于下面:

Set-Cookie..3JSESSIONID=955AAE2AA22B074BD1824395B6E4835A; Path=/...Content-Type...text/html...Content-Length...141.AB.....

AJP(Apache JServer Protocol)

AJPv13协议是面向包的。WEB服务器和Servlet容器通过TCP连接来交互;为了节省SOCKET创建的昂贵代价,WEB服务器会尝试维护一个永久TCP连接到servlet容器,并且在多个请求和响应周期过程会重用连接。

一旦一个连接被分配给特定的请求,在请求处理周期结束之前这个连接不能被重用;换句话说,请求不是连接多工的。这样编码比较简单。

一旦连接被分配给特定的请求,基本请求信息(HTTP头)以压缩的个性(通常字符串会编码为整数);如果有请求实体,会随后立即发送。

这个时候,servlet容器已经准备好了处理请求并发送西面的信息回WEB服务器:

1.       SEND_HEADERS:发回浏览器的响应头

2.       SEND_BODY_CHUNK:将实体发送给浏览器

3.       GET_BODY_CHUNK:获取更多的请求数据,这些数据没有被发送。

4.       END_RESPONSE:表示请求处理周期结束。

 

WEB服务器发送给Servlet容器的请求包括:

1.       转发请求开始

2.       关闭

3.       Ping

4.       CPing

 

AJP13_FORWARD_REQUEST的格式

AJP13_FORWARD_REQUEST :=

    Magic:            (word)

    Length:           (word)

    prefix_code      (byte) 0x02 = JK_AJP13_FORWARD_REQUEST

    method           (byte)       HTTP请求方法的字节编码

    protocol         (string)

    req_uri          (string)

    remote_addr      (string)

    remote_host      (string)

    server_name      (string)

    server_port      (integer)

    is_ssl           (boolean)

    num_headers      (integer)

    request_headers *(req_header_name req_header_value)

    attributes      *(attribut_name attribute_value)

    request_terminator (byte) OxFF

AJP13_SEND_HEADERS

AJP13_SEND_HEADERS :=
  prefix_code       4
  http_status_code  (integer)
  http_status_msg   (string)
  num_headers       (integer)
  response_headers *(res_header_name header_value)

更多信息,参见:http://tomcat.apache.org/connectors-doc/ajp/ajpv13a.html#header_encoding

相关推荐