1. http 协议简介 #
HTTP 是 Hyper Text Transfer Protocol(超文本传输协议)的缩写。它的发展是万维网协会(World Wide Web Consortium)[5]和 Internet 工作小组 IETF(Internet Engineering Task Force)合作的结果,(他们)最终发布了一系列的 RFC,RFC 1945 定义了 HTTP/1.0 版本。其中最著名的就是 RFC 2616。RFC 2616 定义了今天普遍使用的一个版本——HTTP 1.1。为纪念 Tim Berners-Lee 提出 HTTP 后对互联网发展的贡献,万维网协会保留有他最原始提交的版本。
HTTP 协议(HyperText Transfer Protocol,超文本转移协议)是用于从 WWW 服务器传输超文本到本地浏览器的传送协议。它可以使浏览器更加高效,使网络传输减少。它不仅保证计算机正确快速地传输超文本文档,还确定传输文档中的哪一部分,以及哪部分内容首先显示(如文本先于图形)等。
HTTP 是一个应用层协议,由请求和响应构成,是一个标准的客户端服务器模型。HTTP 是一个无状态的协议。 (引自百度百科)
2. http 报头举例 #
这里我们就用常用的百度搜索举例吧,虽然很多程序员看不起百度搜索!
Remote Address:61.135.169.125:80
Request URL:http://www.baidu.com/
Request Method:GET
Status Code:200 OK
Request Headersview source
Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Accept-Encoding:gzip,deflate,sdch
Accept-Language:zh-CN,zh;q=0.8,en;q=0.6
Cache-Control:max-age=0
Connection:keep-alive
Cookie:BDUT=eiceD23DDBB7D809C94A0E669E114AB2FAA613c5bfe280c0; SSUDBTSP=1374456410;
Host:www.baidu.com
Referer:http://tieba.baidu.com/
User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.114 Safari/537.36
Response Headersview source
BDPAGETYPE:2
BDQID:0xa86e37090000192c
BDUSERID:263345794
Cache-Control:private
Connection:Keep-Alive
Content-Encoding:gzip
Content-Type:text/html
Date:Fri, 30 May 2014 06:07:20 GMT
Expires:Fri, 30 May 2014 06:07:19 GMT
Server:BWS/1.1
Set-Cookie:H_PS_PSSID=6225_5230_1461_5224_6553_6506_4759_6018_6676_6698_6441_6774_6502_6819_6838; path=/; domain=.baidu.com
Set-Cookie:BDSVRTM=133; path=/
Transfer-Encoding:chunked
3. http 报头详解 #
这里我就根据上面的那个例子把所有的字段说一下,当然,有的字段,我们通过他的名字就已经知道大概的意思了!有链接的字段,我们在下面进行了更详细的讲解!
表 1 公共头部
字段 | 说明 |
---|---|
Remote Address | 请求的远程地址 |
Request URL | 请求的域名 |
Request Method | 页面请求的方式:GET/POST |
Status Code | 请求的返回状态 |
表 2 请求头
字段 | 说明 |
---|---|
Accept | 表示浏览器支持的 MIME 类型 |
Accept-Encoding | 浏览器支持的压缩类型 |
Accept-Language | 浏览器支持的语言类型,并且优先支持靠前的语言类型 |
Cache-Control | 指定请求和响应遵循的缓存机制 |
Connection | 当浏览器与服务器通信时对于长连接如何进行处理:close/keep-alive |
Cookie | 向服务器返回 cookie,这些 cookie 是之前服务器发给浏览器的 |
Host | 请求的服务器 URL |
Referer | 该页面的来源 URL |
User-Agent | 用户客户端的一些必要信息 |
表 3 返回头
字段 | 说明 |
---|---|
Cache-Control | 告诉浏览器或者其他客户,什么环境可以安全地缓存文档 |
Connection | 当 client 和 server 通信时对于长链接如何进行处理 |
Content-Encoding | 数据在传输过程中所使用的压缩编码方式 |
Content-Type | 数据的类型 |
Date | 数据从服务器发送的时间 |
Expires | 应该在什么时候认为文档已经过期,从而不再缓存它? |
Server | 服务器名字。Servlet 一般不设置这个值,而是由 Web 服务器自己设置 |
Set-Cookie | 设置和页面关联的 cookie |
Transfer-Encoding | 数据传输的方式 |
4. 几个字段的说明 #
4.1 Accept #
例子中的 Accept 字段是这样子的:Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,/;q=0.8。意思是:浏览器支持的 MIME 类型分别是 text/html、application/xhtml+xml、application/xml 和*/*,优先顺序是它们从左到右的排列顺序。
Accept 表示浏览器支持的 MIME 类型;
MIME 的英文全称是 Multipurpose Internet Mail Extensions(多功能 Internet 邮件扩充服务),它是一种多用途网际邮件扩充协议,在 1992 年最早应用于电子邮件系统,但后来也应用到浏览器。
text/html,application/xhtml+xml,application/xml 都是 MIME 类型,也可以称为媒体类型和内容类型,斜杠前面的是 type(类型),斜杠后面的是 subtype(子类型);type 指定大的范围,subtype 是 type 中范围更明确的类型,即大类中的小类。
Text:用于标准化地表示的文本信息,文本消息可以是多种字符集和或者多种格式的;
text/html 表示 html 文档;
Application:用于传输应用程序数据或者二进制数据;
application/xhtml+xml 表示 xhtml 文档;
application/xml 表示 xml 文档。
4.2 Cache-Control #
Cache-Control 指定请求和响应遵循的缓存机制。在请求消息或响应消息中设置 Cache-Control 并不会影响到另一个消息处理过程中的缓存处理过程。
请求时的缓存指令包括:no-cache, no-store, max-age, max-stale, min-fresh, only-if-cached。
响应消息中的指令包括:public, private, no-cache, no-store, no-transform, must-revalidate, proxy-revalidate, max-age。
各个指令的含义:
- Public:指示响应可被任何缓存区缓存。
- Private:指示对于单个用户的整个或部分响应消息,不能被共享缓存处理。这允许服务器仅仅描述当前用户的部分响应消息,此响应消息对于其他用户的请求无效。
- no-cache:指示请求或响应消息不能缓存
- no-store:用于防止重要的信息被无意的发布。在请求消息中发送将使得请求和响应消息都不使用缓存。
- max-age:指示客户机可以接收生存期不大于指定时间(以秒为单位)的响应。
- min-fresh:指示客户机可以接收响应时间小于当前时间加上指定时间的响应。
- max-stale:指示客户机可以接收超出超时期间的响应消息。如果指定 max-stale 消息的值,那么客户机可以接收超出超时期指定值之内的响应消息。
4.3 User-Agent #
User-Agent 的值是:用户使用的客户端的一些必要信息,比如操作系统、浏览器及版本、浏览器渲染引擎等。
4.4 Transfer-Encoding #
transfer-encoding 的可选值有:chunked,identity,从字面意义可以理解,前者指把要发送传输的数据切割成一系列的块数据传输,后者指传输时不做任何处理,自身的本质数据形式传输。举个例子,如果我们要传输一本“红楼梦”小说到服务器,chunked 方式就会先把这本小说分成一章一章的,然后逐个章节上传,而 identity 方式则是从小说的第一个字按顺序传输到最后一个字结束。
5. 总结 #
http 报头让客户端和服务器之间传递了更多的信息,服务器能够发送过来的报头了解到用户的一些必要信息,服务器传回的报头,让客户端更好的理解和解析。