一文读懂Http Headers为何物(超详细)

jiezi

6 年前

一、HTTP 请求内容
由于最新的 http2，并没有被各大浏览器广泛使用，所以本文是基于 http/1.1 所编写的。同时经过检测我们也发现，chrome 等浏览器也正是使用 http/1.1 版本的。
关于 http/1.1 协议的详情，可查看官方文档
我们打开 chrome 的 network，点击任何一条 request 请求，即可发现，每个 http headers 都包含以下部分:Genaral，Response Headers，
General(不属于 headers，只用于收集请求 url 和响应的 status 等信息)
Request Headers(请求 headers)
Response Headers(响应 headers)
Request Payload(请求参数)

二、HTTP Headers 分类
在 http heanders 中，为了方便，分为以下几类：Genaral headers(和上面说的 General 不同，这个只是为了方便统计)，Request Headers，Response Headers，Entity Headers(也是为了方便统计)。

1、Genaral headers: 同时适用于请求和响应消息，但与最终消息主体中传输的数据无关的消息头。2、Request Headers: 包含更多有关要获取的资源或客户端本身信息的消息头。3、Response Headers：包含有关响应的补充信息，如其位置或服务器本身（名称和版本等）的消息头 4、Entity Headers：包含有关实体主体的更多信息，比如主体长 (Content-Length) 度或其 MIME 类型(用于响应 header 中)。
1、Genaral headers
Cache-Control——控制缓存的行为；详情 Connection——决定当前的事务完成后，是否会关闭网络连接；详情 Date——创建报文的日期时间；详情 Keep-Alive——用来设置超时时长和最大请求数；详情 Via——代理服务器的相关信息；详情 Warning——错误通知；详情 Trailer——允许发送方在分块发送的消息后面添加额外的元信息；详情 Transfer-Encoding——指定报文主体的传输编码方式；详情 Upgrade——升级为其他协议；
2、Request headers
Accept——客户端可以处理的内容类型；详情 Accept-Charset——客户端可以处理的字符集类型；详情 Accept-Encoding——客户端能够理解的内容编码方式；详情 Accept-Language——客户端可以理解的自然语言；详情 Authorization——Web 认证信息；详情 Cookie——通过 Set-Cookie 设置的值；详情 DNT——表明用户对于网站追踪的偏好；详情 From——用户的电子邮箱地址；详情 Host——请求资源所在服务器；详情 If-Match——比较实体标记（ETag）；详情 If-Modified-Since——比较资源的更新时间；详情 If-None-Match——比较实体标记（与 If-Match 相反）；详情 If-Range——资源未更新时发送实体 Byte 的范围请求；详情 If-Unmodified-Since——比较资源的更新时间（与 If-Modified-Since 相反）；详情 Origin——表明了请求来自于哪个站点；详情 Proxy-Authorization——代理服务器要求客户端的认证信息；详情 Range——实体的字节范围请求；详情 Referer——对请求中 URI 的原始获取方；详情 TE——指定用户代理希望使用的传输编码类型；详情 Upgrade-Insecure-Requests——表示客户端优先选择加密及带有身份验证的响应；详情 User-Agent——浏览器信息；详情

3、Response Headers
Accept-Ranges——是否接受字节范围请求；详情 Age——消息对象在缓存代理中存贮的时长，以秒为单位；详情 Clear-Site-Data——表示清除当前请求网站有关的浏览器数据（cookie，存储，缓存）；详情 Content-Security-Policy——允许站点管理者在指定的页面控制用户代理的资源；详情 Content-Security-Policy-Report-Only—— 详情 ETag——资源的匹配信息；链接描述 Location——令客户端重定向至指定 URI；详情 Proxy-Authenticate——代理服务器对客户端的认证信息；详情 Public-Key-Pins——包含该 Web 服务器用来进行加密的 public key（公钥）信息；详情 Public-Key-Pins-Report-Only——设置在公钥固定不匹配时，发送错误信息到 report-uri；详情 Referrer-Policy——用来监管哪些访问来源信息——会在 Referer 中发送；详情 Server——HTTP 服务器的安装信息；详情 Set-Cookie——服务器端向客户端发送 cookie；详情 Strict-Transport-Security——它告诉浏览器只能通过 HTTPS 访问当前资源；详情 Timing-Allow-Origin——用于指定特定站点，以允许其访问 Resource Timing API 提供的相关信息；详情 Tk——显示了对相应请求的跟踪情况；详情 Vary——服务器缓存的管理信息；详情 WWW-Authenticate——定义了使用何种验证方式去获取对资源的连接；详情 X-XSS-Protection——当检测到跨站脚本攻击 (XSS)时，浏览器将停止加载页面；详情

4、Entity Headers
Allow——客户端可以处理的内容类型，这种内容类型用 MIME 类型来表示；详情 Content-Encoding——用于对特定媒体类型的数据进行压缩；详情 Content-Language——访问者希望采用的语言或语言组合；详情 Content-Length——发送给接收方的消息主体的大小；详情 Content-Location——替代对应资源的 URI；详情 Content-Range——实体主体的位置范围；详情 Content-Type——告诉客户端实际返回的内容的内容类型；详情 Expires——包含日期 / 时间，即在此时候之后，响应过期；详情 Last-Modified——资源的最后修改日期时间；详情

三、HTTP 具体应用
1、Cookie
HTTP 协议是无状态的，主要是为了让 HTTP 协议尽可能简单，使得它能够处理大量事务。HTTP/1.1 引入 Cookie 来保存状态信息。
Cookie 是服务器发送到用户浏览器并保存在本地的一小块数据，它会在浏览器之后向同一服务器再次发起请求时自动被携带上，用于告知服务端两个请求是否来自同一浏览器。由于之后每次请求都会需要携带 Cookie 数据，因此会带来额外的性能开销（尤其是在移动环境下）。
Cookie 曾一度用于客户端数据的存储，因为当时并没有其它合适的存储办法而作为唯一的存储手段，但现在随着现代浏览器开始支持各种各样的存储方式，Cookie 渐渐被淘汰。新的浏览器 API 已经允许开发者直接将数据存储到本地，如使用 Web storage API（本地存储和会话存储）或 IndexedDB。
a、创建过程
服务器发送的响应报文包含 Set-Cookie 首部字段，客户端得到响应报文后把 Cookie 内容保存到浏览器中。
HTTP/1.1 200 OK
Content-type: text/html
Set-Cookie: PHPSESSID=kq8v6iujarsgflkeq7shmai9c7
客户端之后对同一个服务器发送请求时，会从浏览器中取出 Cookie 信息并通过 Cookie 请求首部字段发送给服务器。
GET /sample_page.html HTTP/1.1
Host: www.example.org
Cookie: PHPSESSID=kq8v6iujarsgflkeq7shmai9c7
b、分类
会话期 Cookie：浏览器关闭之后它会被自动删除，也就是说它仅在会话期内有效。持久性 Cookie：指定一个特定的过期时间（Expires）或有效期（max-age）之后就成为了持久性的 Cookie。安全 Cookie：指定 HttpOnly，这样 cookie 不能使用 JavaScript 经由 Document.cookie 属性，来防范跨站脚本攻击（XSS）。HTTPS Cookie: 指定 Secure，只有在请求使用 SSL 和 HTTPS 协议的时候才会被发送到服务器。
Set-Cookie: id=a3fWa; Expires=Wed, 21 Oct 2015 07:28:00 GMT;
Set-Cookie: id=a3fWa; Expires=Wed, 21 Oct 2015 07:28:00 GMT;HttpOnly
Set-Cookie: id=a3fWa; Expires=Wed, 21 Oct 2015 07:28:00 GMT;Secure
2、缓存
降低客户端获取资源的延迟：缓存通常位于内存中，读取缓存的速度更快。并且缓存在地理位置上也有可能比源服务器来得近，例如浏览器缓存。
实现方法:1、让代理服务器进行缓存；2、让客户端浏览器进行缓存
a、使用 Cache-Control 来控制缓存
禁止进行缓存。no-store 规定不能对请求或响应的任何一部分进行缓存
Cache-Control:
强制确认缓存。no-cache 指令规定缓存服务器需要先向源服务器验证缓存资源的有效性，只有当缓存资源有效才将能使用该缓存对客户端的请求进行响应。
Cache-Control: no-cache
缓存过期机制。
max-age 指令出现在请求报文中，并且缓存资源的缓存时间小于该指令指定的时间，那么就能接受该缓存。max-age 指令出现在响应报文中，表示缓存资源在缓存服务器中保存的时间。或者使用 Expires
// 请求中
Cache-Control: max-age=31536000
// 响应中，优先处理 max-age
Cache-Control: max-age=31536000
Expires: Wed, 04 Jul 2012 08:26:05 GMT
缓存验证可以将缓存资源的值放入 request header 的 If-None-Match 首部，服务器收到该请求后，判断缓存资源的值和资源的最新值是否一致，如果一致则表示缓存资源有效，返回 304 Not Modified。并在 response header 中戴上 ETag 值
// 请求
If-None-Match: W/”646-RJRVaOjMluW+SOAL0EThThA2lnM”
// 响应
ETag: W/”646-RJRVaOjMluW+SOAL0EThThA2lnM”
后续待更 …