java 轉義字元
中轉義字元:
1.八進位制轉義序列:\ + 1到3位5數字;範圍'\000'~'\377'
\0:空字元
2.Unicode轉義字元:\u + 四個十六進位制數字;0~65535
\u0000:空字元
3.特殊字元:就3個
\":雙引號
\':單引號
\\:反斜線
4.控制字元:5個
\' 單引號字元
\\ 反斜槓字元
\r 回車
\n 換行
\f 走紙換頁
\t 橫向跳格
\b 退格
點的轉義:. ==> u002E
美元符號的轉義:$ ==> u0024
乘方符號的轉義:^ ==> u005E
左大括號的轉義:{ ==> u007B
左方括號的轉義:[ ==> u005B
左圓括號的轉義:( ==> u0028
豎線的轉義:| ==> u007C
右圓括號的轉義:) ==> u0029
星號的轉義:* ==> u002A
加號的轉義:+ ==> u002B
問號的轉義:? ==> u003F
反斜槓的轉義: ==> u005C
======================================================================
下面的程式使用了兩個Unicode的轉義字元,它們是用其十六進位制程式碼來表示Unicode字元。那麼,這個程式會列印什麼呢?
Java程式碼
public class
EscapeRout{
public static void main(String[]
args){
// \u0022
是雙引號的Unicode轉義字元
System.out.println("a\u0022.length()
+\u0022b".length());
}
}
public class EscapeRout{
public static void main(String[] args){
// \u0022 是雙引號的Unicode轉義字元
System.out.println("a\u0022.length()
+\u0022b".length());
}
}
對該程式的一種很膚淺的分析會認為它應該打印出26,因為在由兩個雙引號"a\u0022.length()+\u0022b"標識的字串之間總共
有26個字元。
稍微深入一點的分析會認為該程式應該列印16,因為兩個Unicode轉義字元每一個在原始檔中都需要用6個字元來表示,但是它們
只表示字串中 的一個字元。因此這個字串應該比它的外表看其來要短10個字元。 如果你執行這個程式,就會發現事情遠不
是這麼回事。它列印的既不是26也不是16,而是2。
理解這個謎題的關鍵是要知道:Java對在字串字面常量中的Unicode轉義字元沒有提供任何特殊處理。編譯器在將程式解析成
各種符號之前, 先將Unicode轉義字元轉換成為它們所表示的字元[JLS 3.2]。因此,程式中的第一個Unicode轉義字元將作為一
個單字元字串字面常量("a")的結束引號,而第二個Unicode轉義字元將作為另一 個單字元字串字面常量("b")的開始引
號。程式列印的是表示式"a".length()+"b".length(),即2。
如果該程式的作者確實希望得到這種行為,那麼下面的語句將要清楚得多:
Java程式碼
System.out.println("a".length()+"b".length());
更有可能的情況是該作者希望將兩個雙引號字元置於字串字面常量的內部。使用Unicode轉義字元你是不能實現這一點的,但
是你可以使用轉義字 符序列來實現[JLS 3.10.6]。表示一個雙引號的轉義字元序列是一個反斜槓後面緊跟著一個雙引號(\”)
。如果將最初的程式中的Unicode轉義字元用轉義字元序列來 替換,那麼它將打印出所期望的16(錯誤,應該是14,不知道是怎
麼會出來16):
Java程式碼
System.out.println("a\".length()+\"b".length());
許多字元都有相應的轉義字元序列,包括單引號(\')、換行(\n)、製表符(\t)和反斜線(\\)。你可以在字元字面常量和
字串字面常量中使用轉義字元序列。
實際上,你可以通過使用被稱為八進位制轉義字元的特殊型別的轉義字元序列,將任何ASCII字元置於一個字串字面常量或一個
字元字面常量中,但是最好是儘可能地使用普通的轉義字元序列。
普通的轉義字元序列和八進位制轉義字元都比Unicode轉義字元要好得多,因為與Unicode轉義字元不同,轉義字元序列是在程式被
解析為各種符號之後被處理的。
ASCII是字符集的最小公共特性集,它只有128個字元,但是Unicode有超過65,000個字元。一個Unicode轉義字元可以被用來在只
使用ASCII字元的程式中插入一個Unicode字元。一個Unicode轉義字元精確地等價於它所表示的字元。
Unicode轉義字元被設計為用於在程式設計師需要插入一個不能用原始檔字符集表示的字元的情況。它們主要用於將非ASCII字元置於
識別符號、字元 串字面常量、字元字面常量以及註釋中。偶爾地,Unicode轉義字元也被用來在看起來頗為相似的數個字元中明確
地標識其中的某一個,從而增加程式的清晰 度。
總之,在字串和字元字面常量中要優先選擇的是轉義字元序列,而不是Unicode轉義字元。Unicode轉義字元可能會因為它們在
編譯序列中 被處理得過早而引起混亂。不要使用Unicode轉義字元來表示ASCII字元。在字串和字元字面常量中,應該使用轉
義字元序列;對於除這些字面常量之 外的情況,應該直接將ASCII字元插入到原始檔中。
轉義序列 含義
\n 回車(\u000a)
\t 水平製表符(\u0009)
\b 空格(\u0008)
\r 換行(\u000d)
\f 換頁(\u000c)
\' 單引號(\u0027)
\" 雙引號(\u0022)
\\ 反斜槓(\u005c)
\ddd 三位八進位制
\udddd 四位十六進位制
JAVA中轉義字元:
1.八進位制轉義序列:
\ + 1到3位5數字;範圍'\000'~'\377'
\0:空字元
2.Unicode轉義字元:
\u + 四個十六進位制數字;0~65535
\u0000:空字元
八進位制的是1到3個數字並且注意數值範圍,如果超了範圍也會編譯錯誤的,而十六進位制的轉義必須是4個十六進位制數字,而且有
一些無法轉義,如'\u000a',無法轉移,會出現編譯錯誤,而且相當多的數字沒有對應的字元,只會轉義成問號 而對於數字的
轉義,只要不超過範圍既可以了。
3.特殊字元:就3個 \":雙引號 \':單引號 \\:反斜線
4.控制字元:5個 \' 單引號字元 \\ 反斜槓字元 \r 回車 \n 換行 \f 走紙換頁 \t 橫向跳格 \b
退格
點的轉義:. ==> u002E
美元符號的轉義:$ ==> u0024
乘方符號的轉義:^ ==> u005E
左大括號的轉義:{ ==> u007B
左方括號的轉義:[ ==> u005B
左圓括號的轉義:( ==> u0028
豎線的轉義:| ==> u007C
右圓括號的轉義:) ==> u0029
星號的轉義:* ==> u002A
加號的轉義:+ ==> u002B
問號的轉義:? ==> u003F
反斜槓的轉義: ==> u005C
2正則表示式:
1 |
private static void m2()
{ |
2 |
System.out.println( "a\\c" ); //a\c |
3 |
System.out.println( "a\\c" .replaceAll( "\\\\" , "*" )); //a*c |
4 |
System.out.println( "a|c" .replaceAll( "\\|" , "*" )); //a*c |
5 |
System.out.println( "a234c" .replaceAll( "\\d" , "*" )); //a***c |
6 |
} |
我的理解:
1.轉義字元:如果要列印i am “mark”這個字串的話,就必須將”進行轉義,之後才能列印“。
2.正則表示式:\d,\D等是預定義的字元,要在程式碼裡面使用必須轉義所以是\\d
\\d(原始)--->\d(編譯)--->數字
4個\匹配一個\ “\\\\”(原始字串)—>”\\”(編譯)--->”\“(正則表示式)