escape、encodeURI 和encodeURIComponent 的區別

escape(), encodeURI()和encodeURIComponent()是在Javascript中用於編碼字符串的三個常用的方法,而他們之間的異同卻困擾了很多的Javascript初學者,今天我就在這裏對這三個方法詳細地分析與比較一下。

escape() 方法

MSDN JScript Reference中如是說:

The escape method returns a string value (in Unicode format) that contains the contents of [the argument]. All spaces, punctuation, accented characters, and any other non-ASCII characters are replaced with %xx encoding, where xx is equivalent to the hexadecimal number representing the character. For example, a space is returned as "%20."

鄙人 譯:escape方法以Unicode格式返回一個包含傳入參數內容的string類型的值。 Escape方法會將傳入參數中所有的空格、標點符號、重音字符以及其它任何非ASCII字符替換為%xx的編碼形式,其中xx與其所表示的字符的16進 制數表示形式相同。如空格字符的16進制表示形式為0x20,則此時xx應為20,即escape(‘ ’) 返回“%20”。

Mozilla Developer Core Javascript Guide中如是說:

The escape and unescape functions let you encode and decode strings. The escape function returns the hexadecimal encoding of an argument in the ISO Latin character set. The unescape function returns the ASCII string for the specified hexadecimal encoding value.

鄙人譯:escape和unescape方法能夠幫助你編碼和解碼字符串。escape方法對於ISO Latin字符集中的字符組成的參數,返回其16進制編碼。相對應的,unescape方法則能將16進制編碼形式的參數轉化成為其ASCII碼形式。


MSDN JScript Reference中如是說:

The encodeURI method returns an encoded URI. If you pass the result to decodeURI, the original string is returned. The encodeURI method does not encode the following characters: ":", "/", ";", and "?". Use encodeURIComponent to encode these characters.

鄙人譯:encodeURI方法返回 一個經過編碼的URI。如果將encodeURI方法的編碼結果傳遞給decodeURI方法作參數,則能得到原始的未編碼的字符串。需要註意到是 encodeURI方法不編碼如下字符":", "/", ";", and "?"。如果想要編碼這些字符,請使用encodeURIComponent方法。

Mozilla Developer Core Javascript Guide中如是說:

Encodes a Uniform Resource Identifier (URI) by replacing each instance of certain characters by one, two, or three escape sequences representing the UTF-8 encoding of the character.

鄙人譯:通過將每個屬於特定的字符集合的字符替換為一個、 兩個或者三個(為什麽是“一個、兩個或者三個”本人也沒有搞懂,望高人賜教)使用UTF-8編碼來表示這個字符的escape序列來編碼一個URI。如 ~!@#$%^&*(){}[]=:/,;?+\‘"\\ 將被替換為 ~!@#$%25%5E&*()%7B%7D%5B%5D=:/,;?+‘%22%5C


MSDN JScript Reference中如是說:

The encodeURIComponent method returns an encoded URI. If you pass the result to decodeURIComponent, the original string is returned. Because the encodeURIComponent method encodes all characters, be careful if the string represents a path such as /folder1/folder2/default.html. The slash characters will be encoded and will not be valid if sent as a request to a web server. Use the encodeURI method if the string contains more than a single URI component.

鄙人譯:encodeURIComponent方法返回一個編 碼過的URI。如果將encodeURIComponent方法的編碼結果傳遞給 encodeURIComponent方法作參數,則能得到原始的未編碼的字符串。因為encodeURIComponent方法會編碼所有的字符,所以 如果待編碼的字符串是用來表示一個路徑(如/dir1/dir2/index.htm)時,就一定要小心使用了。‘/’符號會被其編碼之後,將不再是一個 有效的路徑標識符,所以不能被web服務器正確地識別。當字符串包含一個單獨的URI component(指?後面的請求參數)的時候,請使用此方法。

Mozilla Developer Core Javascript Guide中如是說:

Encodes a Uniform Resource Identifier (URI) component by replacing each instance of certain characters by one, two, or three escape sequences representing the UTF-8 encoding of the character.



通過上面的介紹可以看出,MS的文檔明顯要比Mozilla詳細、易懂一些,但是它們表達的都是一個意思。但是escape(), encodeURI()和 encodeURIComponent()有什麽異同,它們分別適用於那種特定的情況呢?

escape 方法並不編碼字符+。而我們知道,在用戶提交的表單字段中,如果有空格,則會被轉化為+字符,而服務器解析的時候則會認為+號代表空格。由於這個缺 陷,escape方法並不能正確地處理所有的非ASCII字符,你應當盡量避免使用escape方法,取而代之,你最好選擇 encodeURIComponent()方法。



encodeURI() 不編碼的字符: ~!@#@{content}*()=:/,;?+‘


encodeURIComponent()不編碼的字符: ~!*()‘
