urlencode和rawurlencode的区别:

urlencode 将空格则编码为加号(+)
rawurlencode 将空格则编码为加号(%20)





昨天看UCHome源码的时候,发现有些地方用urlencode,有些地方用rawurlencode。由于对这两个方法的差异不是很清楚,特意写了一段代码来测试。

 

请将下面的代码保存到一个PHP文件中:


[php] view plaincopy

  1. <?php  

  2. test_encode('http://www.baidu.com?a=search&k=eclipse');  

  3. test_encode(':/?= &#');  

  4. test_encode('中文');  

  5. function test_encode($s)  

  6. {  

  7.   echo "<b>urlencode('$s')</b> = [<b>";  

  8.   var_dump(urlencode($s));    

  9.   echo "</b>]<br/>";  

  10.   echo "<b>rawurlencode('$s')</b> = [<b>";  

  11.   var_dump(rawurlencode($s));    

  12.   echo "</b>]<br/>";  

  13. }  


上面代码执行结果如下:


[php] view plaincopy

  1. urlencode('http://www.baidu.com?a=search&k=eclipse') = [string(53) "http%3A%2F%2Fwww.baidu.com%3Fa%3Dsearch%26k%3Declipse" ]  

  2. rawurlencode('http://www.baidu.com?a=search&k=eclipse') = [string(53) "http%3A%2F%2Fwww.baidu.com%3Fa%3Dsearch%26k%3Declipse" ]  

  3. urlencode(':/?= &#') = [string(19) "%3A%2F%3F%3D+%26%23" ]  

  4. rawurlencode(':/?= &#') = [string(21) "%3A%2F%3F%3D%20%26%23" ]  

  5. urlencode('中文') = [string(18) "%E4%B8%AD%E6%96%87" ]  

  6. rawurlencode('中文') = [string(18) "%E4%B8%AD%E6%96%87" ]  


 

从上面的执行结果可以看出,urlencode和rawurlencode两个方法在处理字母数字,特殊符号,中文的时候结果都是一样的,唯一的不同是对空格的处理,urlencode处理成“+”,rawurlencode处理成“%20”。

 

 


 

看看PHP Manual对两个函数的说明:

urlencode:返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+)。此编码与 WWW 表单 POST 数据的编码方式是一样的,同时与 application/x-www-form-urlencoded 的媒体类型编码方式一样。由于历史原因,此编码在将空格编码为加号(+)方面与 RFC1738 编码(参见 rawurlencode())不同。

rawurlencode:返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数。这是在 RFC 1738 中描述的编码,是为了保护原义字符以免其被解释为特殊的 URL 定界符,同时保护 URL 格式以免其被传输媒体(像一些邮件系统)使用字符转换时弄乱。