关于javascript:网络协议系列-特殊字符编码-转发程序与常见问题简答

288次阅读

共计 4381 个字符,预计需要花费 11 分钟才能阅读完成。

前言

这篇文章瞎话说我有点虚,因为平时都不怎么钻研这一块的,而后波及到的知识点超多,我只能到处看看材料总结一下相干信息,所以在此我只想说句:
本文章内容只代表集体立场,有错必改!
本来打算一次性总结,起初越扯越多超过字数限度了,就罗唆做成 http 系列文章了,不定时更新原有内容(发现哪里出错的话),不定时新增系列文章,请见谅!

因为之前写得太臃肿又不够具体,最近刚好温习到这一块的内容,所以决定把这些文章都拆分成更加粗疏一点,补充具体内容,优化排版布局,目前来看还是应该的,因为本身工夫问题和平台编译的问题迟迟未改,只好等都改完之后才收回来。

特殊字符编码

在应用 URL 进行参数传递时,常常会传递一些 中文名的参数或 URL 地址 ,在后盾解决时会产生转换谬误。例如:
在有些传递页面应用 GB2312,而在接管页面应用UTF8,这样接管到的参数就可能会与原来产生不统一。
应用服务器端的 urlEncode 函数编码的 URL,与应用客户端 Javascript 的 encodeURI 函数编码的 URL,后果就不一样。
在申请参数中有些字段是不能间接传输的,可能会引起问题,于是咱们须要在发送前先进行编码。

办法 用法 返回值 阐明
escape(string) 可对字符串进行编码,这样就能够在所有的计算机上读取该字符串。 已编码的 string 的正本。其中某些字符被替换成了十六进制的转义序列。 该办法不会对 ASCII 字母和数字进行编码,也不会对上面这些 ASCII 标点符号进行编码:* @ – _ + . /。其余所有的字符都会被转义序列替换。
unescape(string) 可对通过 escape()编码的字符串进行解码。 string 被解码后的一个正本。 通过找到模式为 %xx 和 %uxxxx 的字符序列(x 示意十六进制的数字),用 Unicode 字符 u00xx 和 uxxxx 替换这样的字符序列进行解码。
encodeURI(URIstring) 把字符串作为 URI 进行编码。 URIstring 的正本,其中的某些字符将被十六进制的转义序列进行替换。 该办法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码:- _ . ! ~ * ‘ ()。该办法的目标是对 URI 进行残缺的编码,因而对以下在 URI 中具备非凡含意的 ASCII 标点符号,encodeURI() 函数是不会进行本义的:;/?:@&=+$,#
decodeURI(URIstring) 对 encodeURI()函数编码过的 URI 进行解码。 URIstring 的正本,其中的十六进制转义序列将被它们示意的字符替换。
encodeURIComponent(URIstring) 把字符串作为 URI 组件进行编码。 URIstring 的正本,其中的某些字符将被十六进制的转义序列进行替换。 该办法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码:- _ . ! ~ * ‘ ()。其余字符(比方:;/?:@&=+$,# 这些用于分隔 URI 组件的标点符号),都是由一个或多个十六进制的转义序列替换的。
decodeURIComponent(URIstring) 对 encodeURIComponent()函数编码的 URI 进行解码。 URIstring 的正本,其中的十六进制转义序列将被它们示意的字符替换。
  • escape()除了 ASCII 字母、数字和特定的符号外,其余所有的字符都会被转义序列替换(已被废除应用)。
  • encodeURI()除了 ASCII 字母、数字和特定的符号外,对 URI 进行残缺的编码,并且 URI 中的非法字符都不会被编码转换。
  • encodeURIComponent()除了 ASCII 字母、数字和特定的符号外,其余字符都是由一个或多个十六进制的转义序列替换的。

留神:

  1. 下面指明的特定符号每个办法都各不相同;
  2. encodeURIComponent()函数 与 encodeURI()函数的区别之处在于前者假设它的参数是 URI 的一部分 (比方协定、主机名、门路或查问字符串)。因而 encodeURIComponent() 函数将本义用于分隔 URI 各个局部的标点符号。
escape('https://www.baidu.com/index.html?abc=1&name= 特殊字符编码')
// "https%3A//www.baidu.com/index.html%3Fabc%3D1%26name%3D%u7279%u6B8A%u5B57%u7B26%u7F16%u7801"

encodeURI('https://www.baidu.com/index.html?abc=1&name= 特殊字符编码')
// "https://www.baidu.com/index.html?abc=1&name=%E7%89%B9%E6%AE%8A%E5%AD%97%E7%AC%A6%E7%BC%96%E7%A0%81";

encodeURIComponent('https://www.baidu.com/index.html?abc=1&name= 特殊字符编码')
// "https%3A%2F%2Fwww.baidu.com%2Findex.html%3Fabc%3D1%26name%3D%E7%89%B9%E6%AE%8A%E5%AD%97%E7%AC%A6%E7%BC%96%E7%A0%81"

转发程序

代理

代理是位于客户端和服务器之间的 HTTP 两头实体。接管所有客户端的 HTTP 申请,并将这些申请转发给服务器(可能会对申请进行批改之后转发)。

(来自图解 http)

因为在 http 通信过程中能够级联多台代理服务器, 所以申请和响应的转发须要附加 Via 首部字段标记出通过的主机信息

代理次要分两大类

  • 缓存代理

    代理转发响应时, 会事后将资源的正本缓存在本身当再次承受雷同申请时间接返回缓存

  • 非 / 通明代理

    转发申请或者响应时是否对报文进行加工

网关

网关是一种转发其余服务器通信数据的服务器,作为其余服务器的两头实体应用。接管从客户端发送的申请就像本人领有源服务器 (即真正领有资源实体的服务器) 一样对申请进行解决.

性能与代理类似, 然而网关能够提供非 Http 协定通信, 在客户端和网关之间的通信线路上加密能够进步连贯的安全性

隧道

在间隔较远的客户单和服务器之间进行直达, 并放弃单方通信连贯

隧道是建设起来之后,就会在两条连贯之间对原始数据进行盲转发的 HTTP 应用程序。常见用处是通过 HTTP 连贯承载加密的安全套接字层 (SSL) 流量,这样 SSL 流量就能够穿过只容许 Web 流量通过的防火墙了。

疑难杂症

HTTP 管制的常见个性?

  1. 缓存
    服务端能通知代理和客户端哪些文档须要被缓存,缓存多久,而客户端也可能命令两头的缓存代理来疏忽存储的文档;
  2. 凋谢同源限度
    为了防止网络窥听和其它隐衷透露,浏览器强制对 Web 网站做了宰割限度。只有来自于雷同起源的网页才可能获取网站的全副信息。这样的限度有时反而成了累赘,HTTP 能够通过批改头部来凋谢这样的限度,因而 Web 文档能够是由不同域下的信息拼接成的(某些状况下,这样做还有平安因素思考);
  3. 认证
    一些页面可能被爱护起来,仅让特定的用户进行拜访。根本的认证性能能够间接通过 HTTP 提供,应用 Authenticate 类似的头部即可,或用 HTTP Cookies 来设置指定的会话;
  4. 代理和隧道
    通常状况下,服务器 (和 | 或) 客户端是处于内网的,对外网暗藏实在 IP 地址。因而 HTTP 申请就要通过代理越过这个网络屏障。但并非所有的代理都是 HTTP 代理。例如,SOCKS 协定的代理就运作在更底层,一些像 FTP 这样的协定也可能被它们解决;
  5. 会话
    应用 HTTP Cookies 容许你用一个服务端的状态发动申请,这就创立了会话;

代理 (Proxies) 作用?

  • 缓存(能够是公开的也能够是公有的,像浏览器的缓存);
  • 过滤(像反病毒扫描,家长管制。。。);
  • 负载平衡(让多个服务器服务不同的申请);
  • 认证(对不同资源进行权限治理);
  • 日志记录(容许存储历史信息);

什么是 Agent 代理?

用户 Agent 代理是代表用户发动 HTTP 的客户端程序。比方 Web 浏览器。另外有些主动发送 HTTP 申请并获取内容的代理,比方“网络蜘蛛”或者“Web 机器人”。

能够禁止浏览器缓存的办法?

  • Expires 设置 0;
  • Cache-Control: no-cache, no-store, must-revalidate
  • Pragma: no-cache;

对于 Cache-Control 中 no-cache、no-store、max-age= 0 区别?

  • no-cache 代表不缓存过期的资源,缓存会向服务器进行无效解决确认之后解决资源;
  • no-store 才是真正的不进行缓存;
  • max-age=<0 就申请服务器,如果资源批改了服务器就会返回最新资源,如果资源没批改服务器就只返回 304(Not Modified)状态码;

什么是 CDN?

CDN 的全称是 Content Delivery Network,即内容散发网络。其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输的更快、更稳固。通过在网络各处搁置节点服务器所形成的在现有的互联网根底之上的一层智能虚构网络,CDN 零碎可能实时地依据网络流量和各节点的连贯、负载情况以及到用户的间隔和响应工夫等综合信息将用户的申请从新导向离用户最近的服务节点上,其目标是使用户可就近获得所需内容,解决 Internet 网络拥挤的情况,进步用户拜访网站的响应速度。

  • 本地 Cache 减速: 进步了企业站点 (尤其含有大量图片和动态页面站点) 的访问速度,并大大提高以上性质站点的稳定性
  • 镜像服务: 打消了不同运营商之间互联的瓶颈造成的影响,实现了跨运营商的网络减速,保障不同网络中的用户都能失去良好的拜访品质。
  • 近程减速: 近程拜访用户依据 DNS 负载平衡技术智能主动抉择 Cache 服务器,抉择最快的 Cache 服务器,放慢近程拜访的速度
  • 带宽优化: 主动生成服务器的近程 Mirror(镜像)cache 服务器,近程用户拜访时从 cache 服务器上读取数据,缩小近程拜访的带宽、分担网络流量、加重原站点 WEB 服务器负载等性能。
  • 集群抗攻打: 宽泛散布的 CDN 节点加上节点之间的智能冗余机制,能够无效地预防黑客入侵以及升高各种 DDOS 攻打对网站的影响,同时保障较好的服务质量。

缓存服务器作用?

减速资源访问速度,升高源服务器的负载。缓存服务器从源服务器获取资源,并返回给浏览器。此外,缓存服务器个别还会在本地保留资源的正本,当有雷同的资源申请到来,缓存服务器可返回资源正本,以此进步资源访问速度。

应用 cookie 保留登陆信息的办法?

  • Cookie 保留用户名与明码,与数据库比拟;
  • Cookie 保留加密后的明码,拜访时解密与数据库比拟;
  • Cookie 保留用户名与加密后的用户名,与数据库比拟账号的加密规定是否正确;

正文完
 0