一、概述
- URL 是“统一资源定位符”(Uniform Resource Locator)。
- URL 中文译为“网址”。
- URL 表示各种资源的互联网地址。
二、网址的组成部分
1. 协议
协议(scheme)是浏览器请求服务器资源的方法。
- 默认协议是 HTTP 协议。
- HTTPS 是 HTTP 的加密版本,出于安全考虑可以使用此协议。
- HTTPS 协议和 HTTP 协议后面连接 :// 。其他协议并非如此,如邮件地址协议(mailto:)的协议名后面只有一个冒号。
2. 主机
主机(host)是资源所在的网站名或服务器的名字,又称域名。没有域名只有IP,通常出现在局域网。
3. 端口
- 同一个域名下面可能同时包含多个网站,它们之间通过端口(port)区分。
- 默认端口为80,省略此参数,服务器返回80端口的网站。
- 端口紧跟在域名后面,两者用冒号分隔。
4. 路径
路径(path)是资源在网站的位置。
- 现在服务器可以模拟这些位置,所以路径只是虚拟位置。
- 路径可能只包含目录,不包含文件名。(取决于服务器的设置)
5. 查询参数
查询参数(parameter)是提供给服务器的额外信息。
- 参数位置在路径后面用 ?分隔,即
6. 锚点
锚点(anchor)是网页内部的定位点。
- 使用 # 加上锚点名称放网址最后,加载就会到相应位置。
- 锚点名称通过网页元素 id 属性命名。
三、URL 字符
URL由哪些字符组成?
- 26个大、小写英文字母。
- 10个阿拉伯数字(0~9)
- 链接号(-)
- 句点(.)
- 下划线(_)
- 18个保留字符,只能在特定位置出现,否则要转义。
- 中文既不是合法字符也不是保留字符,也不是不可以用,但不建议。
四、绝对 URL 和 相对 URL
- 绝对 URL :只靠 URL 本身就能确定资源的位置。
- 相对 URL :URL 不包含资源位置的全部信息,必须结合当前网页的位置,才能定位资源。相对 URL :如果以斜杠(/)开头,表示网站的根目录。
- 特殊简写:
. :表示当前目录,如 ./abcdefg.html
.. :表示上级目录,如 ../abcdefg.html
也可以连用,如 ../../ 表示上两级目录。
绝对 URL 也可以使用,如 www.baidu.com/./a.html 等同于 www.baidu.com/a.html
五、 <base>
所有相对 URL 的计算基准。
- 整张网页只能有一个<base>标签,只能放在<head>里。
- 它是单独标签,无闭合标签。
- 它的 href 属性里出基准网址,target 属性为如何打开链接。