HTTP协议基础与基础实验
一. HTTP协议(Hypetext Transfer Protoacal,超文本传输协议)
HTTP协议规定了Web基本的运作过程,以及Web服务器之间的通信细节。
Http协议采用客户端/服务器端通信模式,服务器端为Http服务器,也即Web服务器。客户端为Http客户程序,浏览器即为最常见的Http客户程序。
在分层的网络体系结果中,Http协议位于应用层。建立在TCP/IP协议基础之上。HTTP协议采用可靠的TCP连接,默认端口80。
HTTP协议的版本从HTTP 0.9 ,HTTP 1.0,HTTP 1.1。HTTP 1.0协议对应的RFC文档为RFC1945。HTTP 1.1协议对应的RFC文档为RFC2068。
HTTP协议是一个基于请求/响应模式的,无状态的协议。(命令模式)
客户端(浏览器)与服务器端(Web服务器应用程序)建立连接后,向服务器端发送一个请求,服务器对这个请求进行 ,然后返回一个响应信息,之后双方的连接被关闭。
在HTTP1.0中,当连接建立后,浏览器发送一个请求,服务器回应一个消息,之后,连接就被关闭.
当浏览器下次请求的时候,需要重新建立连接,这样的通信方式比较繁琐。
因此在HTTP1.1中,给出了一个持续连接的机制.并将其作为HTTP1.1中建立连接的默认行为.浏览器可以在建立一个连接后没发生请求并得到回应,然后继续发生请求并得到回应.而且,客户端还可以连续发送多个请求,而不用等待每个响应的到来。
二. HTTP URL
HTTP URL基本格式 http://host[:port][abs_path]
http要通过HTTP协议来定位网络资源。
host表示合法的Internet主机域名或IP地址(点分十进制的格式)。
port用于指定端口号.若port是空则使用默认端口号80。
abs_path指定请求资源的URL,如果URL中没有给出abs_path,那么当它作为请求的URI时,必须以”/”的形式给出。
通常浏览器会帮助我们把输入的URL合法化.
例如在浏览器中输入www.XXXX.com浏览器会自动将其转化为http://www.XXXX.com/
三. HTTP请求
客户端通过发送HTTP请求向服务器请求对资源的访问。
HTTP请求由三部分组成,分别是:请求行,消息报头,请求正文。
1.请求行
请求行由请求方法,URI,HTTP协议的版本组成,请求行以空格分隔。以CRLF(回车换行)作为结尾。
CRLF(Carriage Return Linefeed)是指回车符和行结束符"\r\n"。
Method Request-URI HTTP-Version CRLF
- Method 表示请求的方法。
- Request-URI 表示请求资源的URI。通常URI只要给出服务器的根目录的相对目录即可。所以以“\”开头。
- HTTP-Version 表示请求的HTTP版本。
- CRLF 表示回车换行。
例: GET /form.html HTTP/1.1 (CRLF)
* 请求方法
在HTTP协议中,HTTP请求可以使用多种请求方法.这些方法指明了访问用Request-URI标识的资源的方式.HTTP1.1请求方法如下
客户端发送给服务器的请求称为方法.
方法:GET,POST,HEAD,PUT,DELETE,TRACE,OPTIONS。
其中最常用的是GET,POST,HEAD
GET方法,用来从服务器读取信息。例:从服务器读取文件,表格,数据库查询结果等.GET方法原则上不会用来发送大量的信息.有些服务器将URL以及查询字符串的长度限制在240个字符内.
POST方法,用来向服务器传输信息.例:把信号卡号,表格,存储与数据库的数据等传送到服务器.
HEAD方法,用来读取服务器响应.例:得到文件大小,文件最后修改时间,服务器类型等信息.
PUT方法将文件直接传到服务器.
DELETE方法将文件直接总服务器删除.
TRACE方法,用来协助程序调试.
OPTIONS方法,用来歘讯服务器所支持的方法.
2. 请求头
请求头包含许多有关客户端环境和请求正文的有用信息。如请求头可以声明浏览器类型,所以语言,请求正文的类型,正文的长度等。
例:
3. 请求正文
HTTP协议规定,请求头和请求正文之间必须以空行分隔(即只有CRLF符号的行),这个空行非常重要,它表示请求头已经结束,接下来是请求正文。请求正文中可以包含客户以POST方式提交的数据:
username=superman&password=8888
四. HTTP响应
1. 响应行
响应行由HTTP协议的版本,状态代码,状态描述组成,请求行以空格分隔。以CRLF(回车换行)作为结尾。
例: HTTP/1.1 200 OK(CRLF)
状态代码是一个3为整数,以1,2,3,4,5开头。
1xx :信息提示,表示临时的响应。
2 xx :响应成功,表示服务器成功地接收了客户端请求。
3 xx :重定向。
4 xx :客户端错误,表明客户端可能有问题。
5 xx :服务器错误,表明服务器由于遇到某种错误而不能响应客户端请求。
常见状态代码:
200 :响应成功。
400 :错误的请求。客户端发送的HTTP请求不正确。
404 :文件不存在。在服务器上没有客户要求访问的文档。
405 :服务器不支持客户的请求方式。
500 :服务器内部错误。
2.响应头
响应头包含响应正文的有用信息。如服务器类型,正文类型,正文长度等。
3. 响应正文
响应正文就是服务器返回的具体数据。即浏览器真正请求访问的信息。最常见的是HTML文档。
响应头与响应正文之间用空行分隔。
<html>
…
</html>
浏览器在接收到HTTP响应后,会根据响应正文的不同类型来进行不同的处理。
HTTP请求正文可以是任意格式的数据。HTTP协议采用MIME协议来指定响应正文的数据格式。
五.测试与实验:
1.一个简易的HTTP服务器
code:这是一个单线程的无响应的Socket服务器。只是为了可以看到浏览器发来的请求形式。
import java.io.IOException; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.util.Arrays; public class HttpServer { public static void main(String[] args) { ServerSocket server = null; Socket client = null; byte[] bytes = new byte[512]; while (true) { try { server = new ServerSocket(10001); client = server.accept(); System.out.println("接收数据"); InputStream in = client.getInputStream(); int len = in.read(bytes); System.out.println(Arrays.toString(bytes)); System.out.println("读取到"+len+"个字节,以下内容为http报文的字符形式:"); String str = new String(bytes); System.out.println(str); } catch (IOException e) { e.printStackTrace(); } finally { try { if (client != null) { client.close(); } if (server != null) { server.close(); } } catch (IOException e) { e.printStackTrace(); } } } } }
(1)在Chrome中输入:http://127.0.0.1:10001
输出内容:
接收数据 [71, 69, 84, 32, 47, 32, 72, 84, 84, 80, 47, 49, 46, 49, 13, 10, 72, 111, 115, 116, 58, 32, 49, 50, 55, 46, 48, 46, 48, 46, 49, 58, 49, 48, 48, 48, 49, 13, 10, 67, 111, 110, 110, 101, 99, 116, 105, 111, 110, 58, 32, 107, 101, 101, 112, 45, 97, 108, 105, 118, 101, 13, 10, 67, 97, 99, 104, 101, 45, 67, 111, 110, 116, 114, 111, 108, 58, 32, 109, 97, 120, 45, 97, 103, 101, 61, 48, 13, 10, 65, 99, 99, 101, 112, 116, 58, 32, 116, 101, 120, 116, 47, 104, 116, 109, 108, 44, 97, 112, 112, 108, 105, 99, 97, 116, 105, 111, 110, 47, 120, 104, 116, 109, 108, 43, 120, 109, 108, 44, 97, 112, 112, 108, 105, 99, 97, 116, 105, 111, 110, 47, 120, 109, 108, 59, 113, 61, 48, 46, 57, 44, 42, 47, 42, 59, 113, 61, 48, 46, 56, 13, 10, 85, 115, 101, 114, 45, 65, 103, 101, 110, 116, 58, 32, 77, 111, 122, 105, 108, 108, 97, 47, 53, 46, 48, 32, 40, 87, 105, 110, 100, 111, 119, 115, 32, 78, 84, 32, 54, 46, 49, 41, 32, 65, 112, 112, 108, 101, 87, 101, 98, 75, 105, 116, 47, 53, 51, 55, 46, 51, 54, 32, 40, 75, 72, 84, 77, 76, 44, 32, 108, 105, 107, 101, 32, 71, 101, 99, 107, 111, 41, 32, 67, 104, 114, 111, 109, 101, 47, 50, 55, 46, 48, 46, 49, 52, 53, 51, 46, 49, 49, 54, 32, 83, 97, 102, 97, 114, 105, 47, 53, 51, 55, 46, 51, 54, 13, 10, 65, 99, 99, 101, 112, 116, 45, 69, 110, 99, 111, 100, 105, 110, 103, 58, 32, 103, 122, 105, 112, 44, 100, 101, 102, 108, 97, 116, 101, 44, 115, 100, 99, 104, 13, 10, 65, 99, 99, 101, 112, 116, 45, 76, 97, 110, 103, 117, 97, 103, 101, 58, 32, 122, 104, 45, 67, 78, 44, 122, 104, 59, 113, 61, 48, 46, 56, 13, 10, 13, 10, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 读取到349个字节,以下内容为http报文的字符形式: GET / HTTP/1.1 Host: 127.0.0.1:10001 Connection: keep-alive Cache-Control: max-age=0 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 User-Agent: Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.116 Safari/537.36 Accept-Encoding: gzip,deflate,sdch Accept-Language: zh-CN,zh;q=0.8
说明:可以看到一个简单的http的报文的结构。注意:在http报文的结尾处的字节为10,13,即\r\n。
(2)在Chrome中输入:http://127.0.0.1:10001/project?a=1&b=3
实验输出内容为:
接收数据 [71, 69, 84, 32, 47, 112, 114, 111, 106, 101, 99, 116, 63, 97, 61, 49, 38, 98, 61, 51, 32, 72, 84, 84, 80, 47, 49, 46, 49, 13, 10, 72, 111, 115, 116, 58, 32, 49, 50, 55, 46, 48, 46, 48, 46, 49, 58, 49, 48, 48, 48, 49, 13, 10, 67, 111, 110, 110, 101, 99, 116, 105, 111, 110, 58, 32, 107, 101, 101, 112, 45, 97, 108, 105, 118, 101, 13, 10, 67, 97, 99, 104, 101, 45, 67, 111, 110, 116, 114, 111, 108, 58, 32, 109, 97, 120, 45, 97, 103, 101, 61, 48, 13, 10, 65, 99, 99, 101, 112, 116, 58, 32, 116, 101, 120, 116, 47, 104, 116, 109, 108, 44, 97, 112, 112, 108, 105, 99, 97, 116, 105, 111, 110, 47, 120, 104, 116, 109, 108, 43, 120, 109, 108, 44, 97, 112, 112, 108, 105, 99, 97, 116, 105, 111, 110, 47, 120, 109, 108, 59, 113, 61, 48, 46, 57, 44, 42, 47, 42, 59, 113, 61, 48, 46, 56, 13, 10, 85, 115, 101, 114, 45, 65, 103, 101, 110, 116, 58, 32, 77, 111, 122, 105, 108, 108, 97, 47, 53, 46, 48, 32, 40, 87, 105, 110, 100, 111, 119, 115, 32, 78, 84, 32, 54, 46, 49, 41, 32, 65, 112, 112, 108, 101, 87, 101, 98, 75, 105, 116, 47, 53, 51, 55, 46, 51, 54, 32, 40, 75, 72, 84, 77, 76, 44, 32, 108, 105, 107, 101, 32, 71, 101, 99, 107, 111, 41, 32, 67, 104, 114, 111, 109, 101, 47, 50, 55, 46, 48, 46, 49, 52, 53, 51, 46, 49, 49, 54, 32, 83, 97, 102, 97, 114, 105, 47, 53, 51, 55, 46, 51, 54, 13, 10, 65, 99, 99, 101, 112, 116, 45, 69, 110, 99, 111, 100, 105, 110, 103, 58, 32, 103, 122, 105, 112, 44, 100, 101, 102, 108, 97, 116, 101, 44, 115, 100, 99, 104, 13, 10, 65, 99, 99, 101, 112, 116, 45, 76, 97, 110, 103, 117, 97, 103, 101, 58, 32, 122, 104, 45, 67, 78, 44, 122, 104, 59, 113, 61, 48, 46, 56, 13, 10, 13, 10, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 读取到364个字节,以下内容为http报文的字符形式: GET /project?a=1&b=3 HTTP/1.1 Host: 127.0.0.1:10001 Connection: keep-alive Cache-Control: max-age=0 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 User-Agent: Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.116 Safari/537.36 Accept-Encoding: gzip,deflate,sdch Accept-Language: zh-CN,zh;q=0.8