1. 程式人生 > 其它 >【正則表示式】 - 匹配中文字元

【正則表示式】 - 匹配中文字元

\w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下

匹配中文字元的正則表示式: [\u4e00-\u9fa5]

匹配中文,英文字母和數字及_:

^[\u4e00-\u9fa5_a-zA-Z0-9]+$

同時判斷輸入長度:·

[\u4e00-\u9fa5_a-zA-Z0-9_]{4,10}

^[\w\u4E00-\u9FA5\uF900-\uFA2D]*$

1、一個正則表示式,只含有漢字、數字、字母、下劃線不能以下劃線開頭和結尾:

^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$

或許你也需要匹配雙位元組字元,中文也是雙位元組的字元

匹配雙位元組字元(包括漢字在內):[^\x00-\xff]

其中:

^ 與字串開始的地方匹配

(?!_)  不能以_開頭

(?!.*?_$)  不能以_結尾

[a-zA-Z0-9_\u4e00-\u9fa5]+  至少一個漢字、數字、字母、下劃線

$  與字串結束的地方匹配

放在程式裡前面加@,否則需要\\進行轉義 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$"

(或者:@"^(?!_)\w*(?<!_)$" 或者 @" ^[\u4E00-\u9FA50-9a-zA-Z_]+$ " )

2、只含有漢字、數字、字母、下劃線,下劃線位置不限:

^[a-zA-Z0-9_\u4e00-\u9fa5]+$

3、由數字、26個英文字母或者下劃線組成的字串

^\w+$

4、2~4個漢字

@"^[\u4E00-\u9FA5]{2,4}$";

5、

//code from http://caibaojian.com/zhongwen-regexp.html
^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$