关于http:HTTP基础系列之一文搞懂URL

29次阅读

共计 3174 个字符,预计需要花费 8 分钟才能阅读完成。

个别咱们日常在上网的时候,会在浏览器的地址栏里输出一个网站的 “ 网址 ”,点击下回车,就会跳到你想去的网站,就相似这样

但其实,叫做 “ 网址 ” 并不是特地的精确,确切的说,应该叫做 URL

到底啥是 URL

那到底啥是 URL 呢?不就是一个网址吗?

URL 是英文 Uniform Resource Locator 的缩写,即对立资源定位器,是因特网上用于指定信息地位的示意办法,通过它就能找到网上的某个你要的资源

URL 的组成

尽管咱们平时应用浏览器的时候,只有输出 baidu.com 或者 qq.com 就能失常上网了,但其实咱们输出的只是整个 URL 中的一小部分

来,我先看看一个绝对残缺的 URL 的整体构造是怎么样的

这里大抵分了几个局部,咱们一个个来看,它们具体是干什么的

协定

图中 http:// 这部分就是协定局部,即指定了 URL 是以什么协定发送网络申请的

常见的协定如:http://https://ftp://file://,比方: http://就是超文本传输协定,平时上网大多用这个协定,https://是以平安为指标的 HTTP 协定。

地址

图中 localhost 就是地址局部,用来确定 URL 所要拜访的服务器的网络地址(也就是网址)。在 URL 中,地址能够用三个模式来示意:域名 主机名IP 地址

域名

咱们平时输出的 www.baidu.comwww.qq.com 就是域名,域名也分 一级域名 二级域名 、以及 顶级域名

  • 顶级域名 :在域名的尾巴局部,.com 这种就是 顶级域名 ,顶级域名个别都代表网站属于某种机构或组织。像.com(商业机构)、.org(非盈利组织)、
    .gov(政府机构) 这类就是常见的顶级域名,除此之外,还有些代表国家的顶级域名,如:.cn(中国)、.us(美国)、.jp(日本)等等
  • 一级域名 :像qq.com 就是 一级域名 ,看上去非常简洁,在顶级域名.com 前只有一个单词短语
  • 二级域名 :而mail.qq.comv.qq.com这种后面加了 mail.v. 等字符串的就叫 二级域名

不过,域名也只是一串文字,计算机和路由器并不能间接认出它,还须要通过 DNS 服务器找到域名对应的 IP 地址,再通过底层的TCP/IP 协定路由到对应的机器下来(这些内容不是本文的重点临时略过,先挖个坑再说)

主机名

主机名就是某台计算机的名字,在一个局域网内,能够通过 主机名 找到你要拜访的计算机。主机名和域名一样,计算机和路由器不认它,须要通过 HOSTS 文件 这样的技术找到 主机名 IP 地址 的关联关系,最初还是翻译成 IP 地址 再持续发送网络申请

图中的 localhost 也是 主机名 ,然而一种比拟非凡的 主机名,是给 回环地址的一个规范主机名,就是代表本机本人的地址。

IP 地址

在 URL 中也能够间接用 IP 地址 来代替域名或主机名,如 192.168.0.1,对于IP 地址 的相干知识点放到当前再讲(持续挖坑)

端口号

图中在冒号 : 前面的那串数字 8080 就是端口号,一台服务器上能够开多个端口号,往往一个网络服务程序就对应一个端口号

比方,我在机器 A 上,开了两个服务程序,别离是 TomcatSSH,让它们别离关联端口808022,那 URL 中如果端口号是 8080 就是会拜访到 Tomcat 程序,22就会连贯 SSH 服务。

但可能有小伙伴会有疑难:诶,我平时上百度看到的 URL 是 http://www.baidu.com 没看到有端口号啊

其实是有的,端口号是 80,只是它被暗藏起来了,咱们看不到而已,而这个80 端口也就是 URL 的默认端口号

但不是所有 URL 的默认端口号都是 80,如果协定是http://,默认端口号为80,但若是https:// 协定,默认端口号就是 443

虚拟目录

从第一个斜杠 / 开始,到最初一个斜杠 / 完结的那局部,也就是图中 /app/user/ 那局部即为 虚拟目录

它就相似咱们电脑中文件目录的格局,第一个 / 为根目录,每多一个 / 就多进入一层目录

文件名

从域名后开始算起的最初一个斜杠 / 开始,到 ? 为止,没有 ? 则到 # 为止,或者 ?#都没有就是到整个 URL 完结为止的那局部就为文件名

说起来很绕吧,其实就是图中 info.do 这部分,它个别蕴含文件名和扩展名(‘.’ 前面那局部),用来指代一个 URL 所拜访的具体文件或资源,它能够是图片、html 文件、css 文件,也能够是 js 文件、字体文件等等,它也能够不是某种文件,而是服务端后盾执行的某段程序。

甚至能够省略不写虚拟目录和文件名,因为它们原本就不是必须的,就如 http://www.baidu.com 这样的 URL 就没有文件名,但服务器会在缺省的状况下给你定位到某个特定的文件或程序下来。

查问参数

? 后到 # 完结,即图中的 ?uid=101&ty=2 为查问参数

查问参数,也称为 URL 参数、查问字符串,英文名为 Query,它是用来向服务端以字符串的模式传递参数和多数数据用的

其参数模式个别都以多个 键值对 的模式进行示意,如 a=1b=2就是两个 键值对 ,键为 ”a” 和 ”b”,值为对应的 ”1″ 和 ”2″, 多个 键值对 &连起来:a=1&b=2

URL 编码

但参数要传递的某些值往往带有特殊字符,这些字符和 URL 规范的格局抵触,比方要传 a&b 这样字符串,和查问参数键值对的连接符 & 抵触了,若不加以辨别就会产生歧义

而最简略的方法,就是对参数值进行编码,称为 URL Encoding,通过编码,a&b变成了a%26b,就不再蕴含会抵触的特殊字符

而有些参数即使有特殊字符,也不会被编码,除非自行强制编码,比方 URL 中参数值是另外一串 URL,就能够写成 http://localhost/do?url=http://www.baidu.com
这种非凡状况不会有歧义,因为计算机系统认得出参数是另一串 URL,就会按 URL 的模式来解析,但当子 URL 又蕴含子参数和多子键值对的时候也难免会分不清参数到底是儿子的还是父亲的,这时还是强制编码的好

列表参数

URL 的参数是一个个键值对,即一个 key 对应一个 value,那如果是一个key 要传递多个值,也就是一个列表咋办?也好办

URL 的参数名是能够反复的,比方 a=1&a=2&a=3, 这里穿了 3 个参数名都为a 的查问参数,是齐全能够的,能够利用这种个性,按程序将 123作为参数 a 的列表值

为了示意更分明点,个别都会在列表参数名前面加上一对方括号[],如:a[]=1&a[]=2&a[]=3

然而,对于 URL 参数的写法和格局的规范,也没有特地严格的规定,以上几种模式个别都会反对

图中 # 前面那局部字符串,#abc就是锚局部

锚,英文称做Reference,通常也是用来传递参数等信息,但与查问参数的本质区别就是这部分内容不会被传递到服务器端

锚个别用于页面,比方在浏览网页的时候,按个按钮忽然帮你定位到页首或页面中的某个位子去了,这就是锚

当初随着前后端拆散技术,尤其是 vuereactjs 等前端框架的衰亡,锚作为前端 javascript 程序处理的参数载体也越来越重要了

结语

URL 看似曾经司空见惯、非常简单的货色,背地往往也暗藏着很多技术细节和知识点,甚至这短短一篇文章也没方法穷尽

其实 URL 的内容还有不少,比方 < 用户名 >@< 明码 > 这种用户验证信息在 URL 中的传递,因为篇幅的关系还没有讲到

所以我讲分几篇文章来解说 HTTP 协定的其中几个重要局部,如果这一系列文章对你有帮忙,别忘了关注哦~

最初,我还要举荐一款非常好用的 Java 端 HTTP 框架: Forest

官网:http://forest.dtflyx.com
Gitee 仓库:https://gitee.com/dt_flys/forest
Github 仓库:https://github.com/dromara/fo…

这是一款声名式的 HTTP 框架,简略好用,因为它将拼接 URL、申请头、申请体参数、期待响应,失败重试,转换响应数据到 Java 类型等脏活累活全包了

正文完
 0