1. 程式人生 > >正則表示式-速記理解技巧

正則表示式-速記理解技巧

. [ ] ^ $
四個字元是所有語言都支援的正則表示式,所以這個四個是基礎的正則表示式。正則難理解因為裡面有一個等價的概念,這個概念大大增加了理解難度,讓很多初學者看起來會蒙,如果把等價都恢復成原始寫法,自己書寫正則就超級簡單了,就像說話一樣去寫你的正則了:
  等價:
  ?,*,+,\d,\w 都是等價字元
  ?等價於匹配長度{0,1}
  *等價於匹配長度{0,}
  +等價於匹配長度{1,}
  \d等價於[0-9]
  \w等價於[A-Za-z_0-9]。 常用運算子與表示式:
  
^ 開始
  () 域段
  [] 包含,預設是一個字元長度
  [^] 不包含,預設是一個字元長度
  {n,m} 匹配長度
  . 任何單個字元(\. 字元點)
  | 或
  \ 轉義
  $ 結尾
  [A-Z] 26個大寫字母
  [a-z] 26個小寫字母
  [0-9] 0至9數字 [A-Za-z0-9] 26個大寫字母、26個小寫字母和0至9數字
  , 分割
  .
  
  分割語法:

  [A,H,T,W] 包含A或H或T或W字母
  [a,h,t,w] 包含a或h或t或w字母
  [0,3,6,8] 包含0或3或6或8數字
  語法與釋義:
  
基礎語法 "^([]{})([]{})([]{})$"
  正則字串 = "開始([包含內容]{長度})([包含內容]{長度})([包含內容]{長度})結束"
  
  ?,*,+,\d,\w 這些都是簡寫的,完全可以用[]和{}代替,在(?:)(?=)(?!)(?<=)(?<!)(?i)(*?)(+?)這種特殊組合情況下除外。
  初學者可以忽略?,*,+,\d,\w一些簡寫標示符,學會了基礎使用再按表自己去等價替換
  
  例項:

  字串;tel:086-0666-88810009999
  原始正則:"^tel:[0-9]{1,3}-[0][0-9]{2,3}-[0-9]{8,11}$"
  速記理解:開始 "tel:普通文字"[0-9數字]{1至3位}"-普通文字"[0數字][0-9數字]{2至3位}"-普通文字"[0-9數字]{8至11位} 結束"
  等價簡寫後正則寫法:"^tel:\d{1,3}-[0]\d{2,3}-\d{8,11}$" ,簡寫語法不是所有語言都支援。