正則匹配任意字元（常用正則表示式的書寫）

阿新 • • 發佈：2018-12-11

http://www.unibetter.com/deerchao/zhengzhe-biaodashi-jiaocheng-se.htm 正則教程（注：元字元包括\ | ( ) [ ] { } ^ $ * + ? . ) 匹配中文字元的正則表示式： [\u4e00-\u9fa5] 評註：匹配中文還真是個頭疼的事，有了這個表示式就好辦了匹配雙位元組字元(包括漢字在內)：[^\x00-\xff] 評註：可以用來計算字串的長度（一個雙位元組字元長度計2，ASCII字元計1）匹配空白行的正則表示式：\n\s*\r 評註：可以用來刪除空白行匹配HTML標記的正則表示式：]*>.*?| 評註：網上流傳的版本太糟糕，上面這個也僅僅能匹配部分，對於複雜的巢狀標記依舊無能為力匹配首尾空白字元的正則表示式：^\s*|\s*$ 評註：可以用來刪除行首行尾的空白字元(包括空格、製表符、換頁符等等)，非常有用的表示式匹配Email地址的正則表示式：\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* 評註：表單驗證時很實用匹配網址URL的正則表示式：[a-zA-z]+://[^\s]* 評註：網上流傳的版本功能很有限，上面這個基本可以滿足需求匹配帳號是否合法(字母開頭，允許5-16位元組，允許字母數字下劃線)：^[a-zA-Z][a-zA-Z0-9_]$ 評註：表單驗證時很實用匹配國內電話號碼：\d-\d|\d-\d 評註：匹配形式如 0511-4405222 或 021-87888822 匹配騰訊QQ號：[1-9][0-9] 評註：騰訊QQ號從10000開始匹配中國郵政編碼：[1-9]\d(?!\d) 評註：中國郵政編碼為6位數字匹配身份證：\d|\d 評註：中國的身份證為15位或18位匹配ip地址：\d+\.\d+\.\d+\.\d+ 評註：提取ip地址時有用匹配特定數字： ^[1-9]\d*$　　 //匹配正整數 ^-[1-9]\d*$ 　 //匹配負整數 ^-?[1-9]\d*$　　 //匹配整數 ^[1-9]\d*|0$　 //匹配非負整數（正整數 + 0） ^-[1-9]\d*|0$　　 //匹配非正整數（負整數 + 0） ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$　　 //匹配正浮點數 ^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$　 //匹配負浮點數 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$　 //匹配浮點數 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$　　 //匹配非負浮點數（正浮點數 + 0） ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$　　//匹配非正浮點數（負浮點數 + 0）評註：處理大量資料時有用，具體應用時注意修正匹配特定字串： ^[A-Za-z]+$　　//匹配由26個英文字母組成的字串 ^[A-Z]+$　　//匹配由26個英文字母的大寫組成的字串 ^[a-z]+$　　//匹配由26個英文字母的小寫組成的字串 ^[A-Za-z0-9]+$　　//匹配由數字和26個英文字母組成的字串 ^\w+$　　//匹配由數字、26個英文字母或者下劃線組成的字串評註：最基本也是最常用的一些表示式今天在Java中想使用正則表示式來獲取一段文字中的任意字元。於是很隨意得就寫出如下匹配規則： (.*) 結果執行之後才發現，無法獲得換行之後的文字。於是查了一下手冊，才發現正則表示式中，“.”(點符號)匹配的是除了換行符“\n”以外的所有字元。同時，手冊上還有一句話：要匹配包括 '\n' 在內的任何字元，請使用像 '[.\n]' 的模式。於是我將正則表示式的匹配規則修改如下： ([.\n]*)，當然，如果是在java程式中直接寫到話，需要改為([.\\n]*) 結果再次執行程式，發現什麼內容也取不到了。我百思不得其解，又將其修改為如下規則： ([.|\n]*) 以及 ([\n.]*) 結果還是不行，什麼內容都取不到。看來點符號和換行符卯上勁了～然後上網一查，雖然沒有查出上述規則到底是什麼地方出問題了，但是查出了一個解決辦法，經過一試，果然可以匹配包括換行符在內的任意字元，以下為正確的正則表示式匹配規則： ([\s\S]*) 同時，也可以用 “([\d\D]*)”、“([\w\W]*)” 來表示。本文可以自由轉載，轉載時請保留全文並註明出處：轉載自仲子說 [ http://www.wangzhongyuan.com/ ] 原文連結：http://www.wangzhongyuan.com/archives/640.html 正則表示式可以讓使用者通過使用一系列的特殊字元構建匹配模式，然後把匹配模式與資料檔案、程式輸入以及WEB頁面的表單輸入等目標物件進行比較，根據比較物件中是否包含匹配模式，執行相應的程式。舉例來說，正則表示式的一個最為普遍的應用就是用於驗證使用者線上輸入的郵件地址的格式是否正確。如果通過正則表示式驗證使用者郵件地址的格式正確，使用者所填寫的表單資訊將會被正常處理；反之，如果使用者輸入的郵件地址與正則表達的模式不匹配，將會彈出提示資訊，要求使用者重新輸入正確的郵件地址。由此可見正則表示式在WEB應用的邏輯判斷中具有舉足輕重的作用。基本語法在對正則表示式的功能和作用有了初步的瞭解之後，我們就來具體看一下正則表示式的語法格式。正則表示式的形式一般如下：　　/love/ 　　其中位於“/”定界符之間的部分就是將要在目標物件中進行匹配的模式。使用者只要把希望查詢匹配物件的模式內容放入“ /”定界符之間即可。為了能夠使使用者更加靈活的定製模式內容，正則表示式提供了專門的“元字元”。所謂元字元就是指那些在正則表示式中具有特殊意義的專用字元，可以用來規定其前導字元（即位於元字元前面的字元）在目標物件中的出現模式。　　較為常用的元字元包括： “+”， “*”，以及 “?”。其中，“+”元字元規定其前導字元必須在目標物件中連續出現一次或多次，“*”元字元規定其前導字元必須在目標物件中出現零次或連續多次，而“?”元字元規定其前導物件必須在目標對象中連續出現零次或一次。　　下面，就讓我們來看一下正則表示式元字元的具體應用。　　/fo+/ 　　因為上述正則表示式中包含“+”元字元，表示可以與目標物件中的 “fool”, “fo”, 或者 “football”等在字母f後面連續出現一個或多個字母o的字串相匹配。　　/eg*/ 　　因為上述正則表示式中包含“*”元字元，表示可以與目標物件中的 “easy”, “ego”, 或者 “egg”等在字母e後面連續出現零個或多個字母g的字串相匹配。　　/Wil?/ 　　因為上述正則表示式中包含“？”元字元，表示可以與目標物件中的 “Win”, 或者 “Wilson”,等在字母i後面連續出現零個或一個字母l的字串相匹配。　　除了元字元之外，使用者還可以精確指定模式在匹配物件中出現的頻率。例如，　　 /jim{2,6}/ 　　上述正則表示式規定字元m可以在匹配物件中連續出現2-6次，因此，上述正則表示式可以同jimmy或jimmmmmy等字串相匹配。　　在對如何使用正則表示式有了初步瞭解之後，我們來看一下其它幾個重要的元字元的使用方式。　　 \s：用於匹配單個空格符，包括tab鍵和換行符；　　 \S：用於匹配除單個空格符之外的所有字元；　　 \d：用於匹配從0到9的數字；　　 \w：用於匹配字母，數字或下劃線字元；　　 \W：用於匹配所有與\w不匹配的字元；　　 . ：用於匹配除換行符之外的所有字元。　　（說明：我們可以把\s和\S以及\w和\W看作互為逆運算）　　下面，我們就通過例項看一下如何在正則表示式中使用上述元字元。　　 /\s+/ 　　上述正則表示式可以用於匹配目標物件中的一個或多個空格字元。　　 /\d000/ 　　如果我們手中有一份複雜的財務報表，那麼我們可以通過上述正則表示式輕而易舉的查詢到所有總額達千元的款項。　　除了我們以上所介紹的元字元之外，正則表示式中還具有另外一種較為獨特的專用字元，即定位符。定位符用於規定匹配模式在目標物件中的出現位置。　　較為常用的定位符包括： “^”, “$”, “\b” 以及 “\B”。其中，“^”定位符規定匹配模式必須出現在目標字元串的開頭，“$”定位符規定匹配模式必須出現在目標物件的結尾，\b定位符規定匹配模式必須出現在目標字串的開頭或結尾 --------------------- 本文來自 zhangtaozaqaq 的CSDN 部落格，全文地址請點選：https://blog.csdn.net/ZHANGTAOZAQaq/article/details/28420109?utm_source=copy

正則匹配任意字元（常用正則表示式的書寫）

正則匹配任意字元（常用正則表示式的書寫）

PHP中關於正則表示式匹配任意字元（包括換行符）的寫法

正則表示式匹配任意字元（包括換行符）的寫法

關於正則表示式匹配任意字元

正則表示式匹配任意字元包含換行符的寫法！！！

day19——常用正則表達式、re正則對象和正則匹配效率比較、編譯正則對象

JS正則對象 RegExp（有變量的時候使用），用來匹配搜索關鍵字（標紅）

原生js正則匹配特殊字元

java_正則簡單介紹，正則匹配頁面時經常會遇見各種不匹配，下面是我copy過來的一些正則語法嘗試和一些常用正則表示式

python 正則匹配中文字元

javaScript正則（常用_不定時更新）

python五十六課——正則表達式（常用函數之findall）

l1範數最小化求解係數方程_正交匹配追蹤法（orthogonal matching pursuit）

常用算法3 - 字符串查找/模式匹配算法（BF & KMP算法）

2018《哈佛商業評論》正刊與增刊點評（截至8月17日）

APP內跳轉到系統設定任意條目（常用於讓使用者開啟定位等許可權的跳轉）

iOS 關於啟動app循環播放視頻功能（常用於登錄時）

vector向量容器（常用的使用方法總結）

Struts標籤（常用標籤的基本使用）

LeetCode 717. 1位元與2位元字元（C、C++、python）

正則匹配任意字元（常用正則表示式的書寫）

相關推薦