通俗易懂客户端与服务器端交互原理(HTTP数据请求与HTTP响应,包括Servlet部分)
HTTP介绍
1.HTTP是一种超文本传送协议(HyperTextTransferProtocal),是一套计算机在网络中通信的一种规则。在TCP/IP体系结构中,HTTP属于应用层协议,位于TCP/IP协议的顶层.
2.HTTP是一种无状态的协议,意思是指在WEB浏览器客户端和WEB服务器之间不需要建立持久的连接。整个过程就是当一个客户端向服务器端发送一个请求request,然后WEB服务器返回一个响应response,之后连接就关闭了,在服务端此时是没有保留连接的信息.
3.HTTP遵循请求/响应request/response模型的,所有的通信交互都被构造在一套请求和响应模型中。
4.浏览WEB时,浏览器通过HTTP协议与WEB服务器交换信息,WEB服务器向WEB浏览器返回的文件都有与之相关的类型,这些信息类型的格式由MIME定义。
HTTP定义的事物处理由以下四步组成:
1.建立连接
2.客户端发送HTTP请求
3.服务器段响应生成结果回发
4.服务器端关闭连接,客户端解析回发响应头,恢复页面
1.建立连接:以下用我的另一篇文章的地址作为例子--Servlet介绍以及Servlet生命周期(详细)
客户端,也就是我请求一个地址时,即打开了到WEB服务器的HTTP端口的一个套接字。因为在网络中间作为传递数据的实体介质就是网线,数据实质上是通过IO流进行输出和输入,这就不难理解我们为什么在写一个Servlet的时候要引用importjava.io.*;的原因,包括我们在向客户端回发结果的时候要用到PrintWriter对象的println()方法.
在JAVA底层代码中是这样实现的,只不过它们已经帮我们做了
InputStreamin=socket.getInputStream();
OutputStreamout=socket.getOutputStream();
2.客户端发送HTTP请求头
一旦建立了TCP连接,WEB浏览器就会向WEB服务器发送请求命令,是一个ASCII文本请求行,后跟0个或多个HTTP头标,一个空行和实现请求的任意数据。
四个部分:请求行请求头标空行和请求数据
1)请求行由三个标记组成请求方法请求URLHTTP版本中间用空格分开
例如GETadmin/blogs/234610HTTP/1.1
HTTP规范定义了8种可能的请求方法,最常见的是GET和POST
GET检索URI中标识资源的一个简单请求HEAD与GET方法相同,服务器只返回状态行和头标,并不返回请求文档
POST服务器接受被写入客户端输出流中的数据的请求PUT服务器保存请求数据作为指定URI新内容的请求
DELETE服务器删除URI中命名的资源的请求
OPTIONS关于服务器支持的请求方法信息的请求
TRACEWeb服务器反馈Http请求和其头标的请求
CONNECT已文档化但当前未实现的一个方法,预留做隧道处理
2)请求头标,由KEY:VALUE键值组成,每行一对。请求头标通知服务器有关客户端的功能和标识。
User-Agent用户即客户端可以使用的浏览器如Mozilla/4.0
Accpet客户端可以接受的MIME类型列表如image/giftext/htmlapplication/msword等等还有很多
Content-length只适用于POST请求,以字节给出POST数据的尺寸
3)空行发送回车符和退行,通知服务器以下不再有头标
4)请求数据:使用POST传送数据,最常用使用的是Content-Type和Content-Length头标
总结以上我们可以这样写出一个标准的HTTP请求
POST/admin/blogs/234610HTTP1.1
User-AgentMozilla/4.0
Acceptimage/gif,text/html,application/pdf,...
key=value&key=value&key=value(POST)请求的数据
那么,这上面的一个例子说明的就是
这个页面用的是HTTP1.1规范我的浏览器版本是Mozilla/4.0
可以支持的MIME格式为image/gif,text/html,application/pdf...
这个MIME格式在我们写的response.setContentType("text/html;charset=gb2312")中出现过
或者在
<%@pagecontentType="text/html;charset=gb2312"%>中也出现过
或者在
<meta..contentType="text/html;charset=gb2312">中也见到过
那么在这里如何理解GET和POST最直接的区别就是,GET方法将数据的请求跟在了所请求的URL后面,也就是在请求行里面我们是这样来做的:
GETadmin/blogs/234610?key=value&key=value...HTTP
也就是实际上用GET如此传递数据
3.服务器端接受请求,处理数据后生成响应返回数据到客户端(部分Servlet内容穿插)
1)根据在请求是的GET/POST来按照响应的doGet()/doPost()方法来处理(有可能是一些业务逻辑,也有可能是一些验证等等,也有可能是一些数据查询,提交等等)其有效的数据就来源于name=lvpin&password=simonlv,还有其它的一些封装在request对象中的数据资源。
2)处理请求之后,由response对象得到PrinterWriter输出流对象out,通过out.println()将数据以在客户端提交过的采用Accept中形式中的一种,如按照response.setContentType("text/html;charset=gb2312")的格式输出流。
它的响应信息与请求信息非常类似,其区别就在于我们在请求阶段的请求行被状态行给替换了,再来看响应头
一个响应由四个部分组成;状态行、响应头标、空行、响应数据
1.状态行:状态行由三个标记组成:HTTP版本、响应代码和响应描述。
HTTP1.1100continue------继续追加后继内容
HTTP/1.1200OK--------一切正常
HTTP1.1301MovedPermanently---请求的文档在其它地方,会自动连接
HTTP1.1403Forbidden-------绝对拒绝你访问这个资源,不管授权没有
HTTP1.1400BadRequest-----客户端请求中的不良语法
HTTP1.1404NotFound---最常见,绝对是大名鼎鼎的找不到
HTTP响应码:
1xx:提示性信息,告诉客户端应该对某些其它的动作作出响应
2xx:这些就代表了请求成功
3xx:重定向,为了完成请求,必须进一步执行的动作
4xx:客户端错误
500-599:服务器端的错误
2.响应头标:像请求头标一样,它们指出服务器的功能,标识出响应数据的细节。
Date:Sat,31Dec200523:59:59GMT--响应生成的日期和时间
ContentType:text/html;charset=gb2312'Content-Length:122---响应中的字节数,只在浏览器使用永久(Keep-alive)HTTP连接时需要。
3.空行:最后一个响应头标之后是一个空行,发送回车符和退行,表明服务器以下不再有头标。
4.响应数据:HTML文档和图像等,也就是HTML本身。out.println("<html>").......写出的。。。
Java代码
1.<html>
2.<head>
3.<title>Welcomtosimonlv'shome</title>
4.</head>
5.<body>
6.<!--这里是具体的内容,看到了这里
7.
8.相信大家对HTTP工作原理和服务器交互过程已经很清楚了吧
9.
10.-->
11.</body>
12.</html>
<html>
<head>
<title>Welcomtosimonlv'shome</title>
</head>
<body>
<!--这里是具体的内容,看到了这里
相信大家对HTTP工作原理和服务器交互过程已经很清楚了吧
-->
</body>
</html>
4.服务器端关闭连接,客户端解析回发响应头,恢复页面
1)浏览器先解析状态行,查看请求是否成功的状态代码--HTTP响应码:404400200....
2)解析每一个响应头标如
ContentType:text/html;charset=gb2312Content-Length:122---响应中的字节数,只在浏览器使用永久(Keep-alive)HTTP连接时需要。
3)读取响应数据HTML,根据它的语法标签<html></html>等和内容恢复标准的HTML格式页面或者其它。
4)一个HTML文档可能包含其它的需要被载入的资源,浏览器会识别,并对这些资源再进行额外的请求,这个过程可以一直循环到所有的数据都按照响应头标中规定的格式恢复到页面中。
5)数据传送完毕,服务器端关闭连接,即无状态协议。
写了很长时间,估计里面也有些没有表达清楚的地方,但是整个流程可以清晰的展现,对于大家理解HTTP请求头和响应头的内容以及他们之间的关系应该很有帮助。