一、概述

  1. URL 是“统一资源定位符”(Uniform Resource Locator)。
  2. URL 中文译为“网址”。
  3. URL 表示各种资源的互联网地址。 

二、网址的组成部分

 1. 协议

        协议(scheme)是浏览器请求服务器资源的方法。

  •  默认协议是 HTTP 协议。
  •  HTTPS 是 HTTP 的加密版本,出于安全考虑可以使用此协议。
  •  HTTPS 协议和 HTTP 协议后面连接  ://   。其他协议并非如此,如邮件地址协议(mailto:)的协议名后面只有一个冒号。

2. 主机

        主机(host)是资源所在的网站名或服务器的名字,又称域名。没有域名只有IP,通常出现在局域网。

3. 端口

  • 同一个域名下面可能同时包含多个网站,它们之间通过端口(port)区分。
  • 默认端口为80,省略此参数,服务器返回80端口的网站。
  • 端口紧跟在域名后面,两者用冒号分隔。

4. 路径

       路径(path)是资源在网站的位置。

  • 现在服务器可以模拟这些位置,所以路径只是虚拟位置。
  • 路径可能只包含目录,不包含文件名。(取决于服务器的设置)

5. 查询参数

       查询参数(parameter)是提供给服务器的额外信息。

  • 参数位置在路径后面用 ?分隔,即

     

url中有中文 java如何处理 url的中文是_url中有中文 java如何处理

 6. 锚点

       锚点(anchor)是网页内部的定位点。

  • 使用 # 加上锚点名称放网址最后,加载就会到相应位置。
  • 锚点名称通过网页元素 id 属性命名。

三、URL 字符

       URL由哪些字符组成?

  • 26个大、小写英文字母。
  • 10个阿拉伯数字(0~9)
  • 链接号(-)
  • 句点(.)
  • 下划线(_)
  • 18个保留字符,只能在特定位置出现,否则要转义。
  • 中文既不是合法字符也不是保留字符,也不是不可以用,但不建议。

四、绝对 URL 和 相对 URL

  1. 绝对 URL :只靠 URL 本身就能确定资源的位置。
  2. 相对 URL :URL 不包含资源位置的全部信息,必须结合当前网页的位置,才能定位资源。相对 URL :如果以斜杠(/)开头,表示网站的根目录。
  3. 特殊简写:
.        :表示当前目录,如  ./abcdefg.html
..       :表示上级目录,如  ../abcdefg.html

也可以连用,如               ../../  表示上两级目录。

绝对 URL 也可以使用,如      www.baidu.com/./a.html 等同于  www.baidu.com/a.html

五、 <base>

所有相对 URL 的计算基准。

  • 整张网页只能有一个<base>标签,只能放在<head>里。
  • 它是单独标签,无闭合标签。
  • 它的 href 属性里出基准网址,target 属性为如何打开链接。