1. 程式人生 > >中文字元,全形字元的正則表示式

中文字元,全形字元的正則表示式

http://www.cnblogs.com/dongzhiquan/archive/2009/09/13/1994736.html

經過測試其中匹配雙位元組字元(包括漢字在內):[^\x00-\xff]非常好用推薦一下

這個傢伙收錄的正則很多,呵呵

關鍵字:正則表示式 模式匹配 Javascript

摘要:收集一些常用的正則表示式。

正則表示式用於字串處理,表單驗證等場合,實用高效,但用到時總是不太把握,以致往往要上網查一番。我將一些常用的表示式收藏在這裡,作備忘之用。本貼隨時會更新。

匹配中文字元的正則表示式: [\u4e00-\u9fa5]

匹配雙位元組字元(包括漢字在內):[^\x00-\xff]

應用:計算字串的長度(一個雙位元組字元長度計2,ASCII字元計1)

String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}

匹配空行的正則表示式:\n[\s| ]*\r

匹配HTML標記的正則表示式:/<(.*)>.*<\/\1>|<(.*) \/>/

匹配首尾空格的正則表示式:(^\s*)|(\s*$)

String.prototype.trim = function()
{
return this.replace(/(^\s*)|(\s*$)/g, "");
}

利用正則表示式分解和轉換IP地址:

下面是利用正則表示式匹配IP地址,並將IP地址轉換成對應數值的Javascript程式:

function IP2V(ip)
{
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正則表示式
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error("Not a valid IP address!")
}
}

不過上面的程式如果不用正則表示式,而直接用split函式來分解可能更簡單,程式如下:

var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))

匹配Email地址的正則表示式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

匹配網址URL的正則表示式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?

利用正則表示式去除字串中重複的字元的演算法程式:[注:此程式不正確,原因見本貼回覆]

var s="abacabefgeeii"
var s1=s.replace(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //結果為:abcefgi

我原來在CSDN上發貼尋求一個表示式來實現去除重複字元的方法,最終沒有找到,這是我能想到的最簡單的實現方法。思路是使用後向引用取出包括重複的字元,再以重複的字元建立第二個表示式,取到不重複的字元,兩者串連。這個方法對於字元順序有要求的字串可能不適用。

得用正則表示式從URL地址中提取檔名的javascript程式,如下結果為page1

s="http://www.9499.net/page1.htm"
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")
alert(s)

利用正則表示式限制網頁表單裡的文字框輸入內容:

用正則表示式限制只能輸入中 文:onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"

用正則表示式限制只能輸入全形字元: onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"

用正則表示式限制只能輸入數 字:onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

用正則表示式限制只能輸入數字和英 文:onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

應用:javascript中沒有像vbscript那樣的trim函式,我們就可以利用這個表示式來實現,如下:

判斷日文的正則表示式

1. GBK (GB2312/GB18030)
\x00-\xff GBK雙位元組編碼範圍
\x20-\x7f ASCII
\xa1-\xff 中文
\x80-\xff 中文

2. UTF-8 (Unicode)
\u4e00-\u9fa5 (中文)
\x3130-\x318F (韓文
\xAC00-\xD7A3 (韓文)
\u0800-\u4e00 (日文)
ps: 韓文是大於[\u9fa5]的字元