Javascript
语言用于编码的函数,一共有三个,最古老的一个就是
escape()
。虽然这个函数现在已经不提倡使用了,但是由于历史原因,很多地方还在使用它,所以有必要先从它讲起。
escape 和 unescape
实际上,
escape()
不能直接用于
URL
编码,它的真正作用是返回一个字符的
Unicode
编码值。比如"春节"的返回结果是
%u6625%u8282
,也就是说在Unicode字符集中,"春"是第6625个(十六进制)字符,"节"是第8282个(十六进制)字符。
它的具体规则是,除了
ASCII字母、数字、标点符号"@ * _ + - . /"
以外,对其他所有字符进行编码。在
u0000
到
u00ff
之间的符号被转成
%xx
的形式,其余符号被转成
%uxxxx
的形式。对应的解码函数是
unescape()
。
还有两个地方需要注意。
首先,无论网页的原始编码是什么,一旦被Javascript编码,就都变为
unicode字符
。也就是说,Javascipt函数的输入和输出,默认都是Unicode字符。这一点对下面两个函数也适用。
其次,
escape()不对"+"编码
。但是我们知道,网页在提交表单的时候,如果有空格,则会被转化为+字符。服务器处理数据的时候,会把+号处理成空格。所以,使用的时候要小心。
例如:
编码:
escape('http://www.baidu.com?name=zhang@xiao@jie&order=1')
结果:"http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1"
escape('张')
结果:"%u5F20"
unescape("http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1")
结果:"http://www.baidu.com?name=zhang@xiao@jie&order=1"
unescape("%u5F20")
结果:"张"
encodeURI 和 decodeURI
有效的URI(通用资源标识符)不能包含某些字符,例如空格,那么就需要使用
encodeURI()
和
encodeURIComponent()
对URI进行编码。
encodeURI()
是Javascript中真正用来对
URL
编码的函数。
encodeURI()
不会对本身URI的特殊字符进行编码,例如冒号、正斜杠、问号和井字号。而
encodeURIComponent()
则会对它发现的任何非标准字符进行编码。如下例子:
var uri = 'https://www.baidu.com/a/ value.htm#end'
console.log(encodeURI(uri)) //https://www.baidu.com/a/%20value.htm#end
console.log(encodeURIComponent(uri)) //https%3A%2F%2Fwww.baidu.com%2Fa%2F%20value.htm%23end
encodeURI()
把uri中的空格给编译了,其它的都没有变化,而
encodeURIComponent()
把它发现的任何非标准字符都进行了编码。
总结:
encodeURI()
它着眼于对整个URL进行编码,因此除了常见的符号以外,对其他一些在
网址中有特殊含义
的符号"
; / ? : @ & = + $ , #
",
不进行编码
。编码后,它输出符号的utf-8形式,并且在每个字节前加上%。
它对应的解码函数是
decodeURI()
。
注:需要注意的是,它不对单引号'编码。
encodeURI('http://www.baidu.com?name=zhang@xiao@jie&order=1')
结果:"http://www.baidu.com?name=zhang@xiao@jie&order=1"
decodeURI("http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1")
结果:"http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1"
encodeURIComponent 和 decodeURIComponent
最后一个Javascript编码函数是
encodeURIComponent()
。与
encodeURI()
的区别是,它用于对URL的组成部分进行个别编码,而不用于对整个URL进行编码。
因此,"
; / ? : @ & = + $ , #
",这些在
encodeURI()
中不被编码的符号,在
encodeURIComponent()
中统统会被编码。至于具体的编码方法,两者是一样。
它对应的解码函数是
decodeURIComponent()
。
例如:
编码:
encodeURIComponent('http://www.baidu.com?name=zhang@xiao@jie&order=1')
结果:"http%3A%2F%2Fwww.baidu.com%3Fname%3Dzhang%40xiao%40jie%26order%3D1"
decodeURIComponent("http%3A%2F%2Fwww.baidu.com%3Fname%3Dzhang%40xiao%40jie%26order%3D1")
"http://www.baidu.com?name=zhang@xiao@jie&order=1"
参考地址:
阮一峰:关于URL编码