一.引言

一.引言
在CTF中往往需要在地址栏中返回某个页面文件,当URL无法返回某些特殊符号时,这个时候就要使用编码了。编码的格式为:一个百分号,后面跟对应字符的ASCII(16进制)码值。

二.实质

二.实质
为什么要转义字符:如果你的表单使用get方法提交,并且提交的参数中有“&”等特殊符的话,如果不做处理,在service端就会将&后面的作为另外一个参数来看待。
例如:
表单的action为list.jsf?L=LOVEYOU&M=FOREVER
提交时通过request.getParameter可以分别取得L和M的值。
如果你的本意是L='LOVEYOU&M=FOREVER’这个字符串,那么为了在服务端拿到L的准确值,你必须对&进行转义。

三.释义

三.解释

特殊含义

ASCII(16进制)

+ 表示空格(在URL中不能使用空格)

%2B

? 分隔实际的URL和参数(查询)

%3F

/ 分隔目录和子目录

%2F

# 表示书签

%23

& URL中指定的参数间的分隔符

%26

= URL中指定的参数的值

%3D

空格

%20

四.实例

四.实例
1.问号(?)
(1)连接作用:

> http://www.xxx.com/Show.asp?id=77&nameid=2905210001&page=1

(2)清除缓存:

http://www.xxxxx.com/index.html 
http://www.xxxxx.com/index.html?test123123

两个url打开的页面一样,但是后面这个有问号,说明不调用缓存的内容,而认为是一个新地址,重新读取。
2.#号
(1)#的涵义
  #代表网页中的一个位置。其右面的字符,就是该位置的标识符。比如,http://www.example.com/index.html#print就代表网页index.html的print位置。浏览器读取这个URL后,会自动将print位置滚动至可视区域。

(2)HTTP请求不包括#
  #是用来指导浏览器动作的,对服务器端完全无用。所以,HTTP请求中不包括#。
比如,访问下面的网址,http://www.example.com/index.html#print,浏览器实际发出的请求是这样的:

GET /index.html HTTP/1.1
Host: www.example.com

(3)#后的字符
  在第一个#后面出现的任何字符,都会被浏览器解读为位置标识符。这意味着,这些字符都不会被发送到服务器端。
比如,下面URL的原意是指定一个颜色值:http://www.example.com/?color=#fff,但是,浏览器实际发出的请求是:

GET /?color= HTTP/1.1
Host: www.example.com

(4)改变#不触发网页重载
  单单改变#后的部分,浏览器只会滚动到相应位置,不会重新加载网页。
比如,从http://www.example.com/index.html#location1改成http://www.example.com/index.html#location2,浏览器不会重新向服务器请求index.html。

(5)改变#会改变浏览器的访问历史
  每一次改变#后的部分,都会在浏览器的访问历史中增加一个记录,使用"后退"按钮,就可以回到上一个位置。这对于ajax应用程序特别有用,可以用不同的#值,表示不同的访问状态,然后向用户给出可以访问某个状态的链接。值得注意的是,上述规则对IE 6和IE 7不成立,它们不会因为#的改变而增加历史记录。