中文字元,全形字元的正則表示式
http://www.cnblogs.com/dongzhiquan/archive/2009/09/13/1994736.html
經過測試其中匹配雙位元組字元(包括漢字在內):[^\x00-\xff]非常好用推薦一下
這個傢伙收錄的正則很多,呵呵
關鍵字:正則表示式 模式匹配 Javascript
摘要:收集一些常用的正則表示式。
正則表示式用於字串處理,表單驗證等場合,實用高效,但用到時總是不太把握,以致往往要上網查一番。我將一些常用的表示式收藏在這裡,作備忘之用。本貼隨時會更新。
匹配中文字元的正則表示式: [\u4e00-\u9fa5]
匹配雙位元組字元(包括漢字在內):[^\x00-\xff]
應用:計算字串的長度(一個雙位元組字元長度計2,ASCII字元計1)
String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}
匹配空行的正則表示式:\n[\s| ]*\r
匹配HTML標記的正則表示式:/<(.*)>.*<\/\1>|<(.*) \/>/
匹配首尾空格的正則表示式:(^\s*)|(\s*$)
String.prototype.trim = function()
{
return this.replace(/(^\s*)|(\s*$)/g, "");
}
利用正則表示式分解和轉換IP地址:
下面是利用正則表示式匹配IP地址,並將IP地址轉換成對應數值的Javascript程式:
function IP2V(ip)
{
re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正則表示式
if(re.test(ip))
{
return RegExp.$1*Math.pow(255,3))+RegExp.$2*Math.pow(255,2))+RegExp.$3*255+RegExp.$4*1
}
else
{
throw new Error("Not a valid IP address!")
}
}
不過上面的程式如果不用正則表示式,而直接用split函式來分解可能更簡單,程式如下:
var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))
匹配Email地址的正則表示式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配網址URL的正則表示式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?
利用正則表示式去除字串中重複的字元的演算法程式:[注:此程式不正確,原因見本貼回覆]
var s="abacabefgeeii"
var s1=s.replace(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //結果為:abcefgi
我原來在CSDN上發貼尋求一個表示式來實現去除重複字元的方法,最終沒有找到,這是我能想到的最簡單的實現方法。思路是使用後向引用取出包括重複的字元,再以重複的字元建立第二個表示式,取到不重複的字元,兩者串連。這個方法對於字元順序有要求的字串可能不適用。
得用正則表示式從URL地址中提取檔名的javascript程式,如下結果為page1
s="http://www.9499.net/page1.htm"
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")
alert(s)
利用正則表示式限制網頁表單裡的文字框輸入內容:
用正則表示式限制只能輸入中 文:onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"
用正則表示式限制只能輸入全形字元: onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"
用正則表示式限制只能輸入數 字:onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"
用正則表示式限制只能輸入數字和英 文:onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"
應用:javascript中沒有像vbscript那樣的trim函式,我們就可以利用這個表示式來實現,如下:判斷日文的正則表示式
1. GBK (GB2312/GB18030)
\x00-\xff GBK雙位元組編碼範圍
\x20-\x7f ASCII
\xa1-\xff 中文
\x80-\xff 中文
2. UTF-8 (Unicode)
\u4e00-\u9fa5 (中文)
\x3130-\x318F (韓文
\xAC00-\xD7A3 (韓文)
\u0800-\u4e00 (日文)
ps: 韓文是大於[\u9fa5]的字元