bash萬用字元 shell正則表示式

阿新 • • 發佈：2019-01-03

在linux中

萬用字元是系統命令使用，一般用來匹配檔名或者什麼的用在系統命令中。
萬用字元是系統級別的，萬用字元多用在檔名上，比如查詢find，ls，cp，rm

正則表示式是操作字串，以行尾單位來匹配字串使用的。

正則表示式需要相關工具的支援例如： egrep, awk, vi, perl。
在文字過濾工具裡，都是用正則表示式，比如像awk，sed等，是針對檔案的內容的

還有一點需要注意的是：*在萬用字元和正則表示式中有其不一樣的地方，在萬用字元中*可以匹配任意的0個或多個字元，而在正則表示式中他是重複之前的一個或者多個字元，不能獨立使用的。
比如萬用字元可以用*來匹配任意字元，而正則表示式不行，他只匹配任意長度的前面的字元。

1.萬用字元

[a-z]或[12]：匹配方括號中指定範圍內的單個字元或方括號列出的其中一個字元。 [!9]：不匹配方括號中所列字元或指定範圍內的單個字元。 * ：匹配0個字元或多個字元。 ？：匹配任何單個字元，且不能為空字元。

特別1和2中 * 的用法

2.基礎的正則表示式特殊字元彙整如下：

RE 字元	意義與範例
^word	意義：待搜尋的字串(word)在行首！範例：搜尋行首為 # 開始的那一行，並列出行號 grep -n '^#' regular_express.txt
word$	意義：待搜尋的字串(word)在行尾！範例：將行尾為 ! 的那一行列印出來，並列出行號 grep -n '!$' regular_express.txt
.	意義：代表『一定有一個任意位元組』的字元！範例：搜尋的字串可以是 (eve) (eae) (eee) (e e)，但不能僅有 (ee) ！亦即 e 與 e 中間『一定』僅有一個位元組，而空白位元組也是位元組！ grep -n 'e.e' regular_express.txt
\	意義：跳脫字元，將特殊符號的特殊意義去除！範例：搜尋含有單引號 ' 的那一行！ grep -n \' regular_express.txt
*	意義：重複零個到無窮多個的前一個 RE 字元 ab* 匹配a開頭，後面有0個b、1個b、2個b……的字串 ab.* 匹配ab開頭，後面有任意數量（包括0）、任意字元的字元範例：找出含有 (es) (ess) (esss) 等等的字串，注意，因為 * 可以是 0 個，所以 es 也是符合帶搜尋字串。 grep -n 'ess*' regular_express.txt
[list]	意義：位元組集合的 RE 字元，裡面列出想要擷取的位元組！需要特別留意的是，在 [] 當中謹代表一個待搜尋的位元組，例如『 a[afl]y 』代表搜尋的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f 或 l 的意思！範例：搜尋含有 (gl) 或 (gd) 的那一行， grep -n 'g[ld]' regular_express.txt
[n1-n2]	意義：位元組集合的 RE 字元，裡面列出想要擷取的位元組範圍！在位元組集合 [] 中的減號 - 是有特殊意義的，他代表兩個位元組之間的所有連續位元組！但這個連續與否與 ASCII 編碼有關，因此，你的編碼需要配置正確(在 bash 當中，需要確定 LANG 與 LANGUAGE 的變數是否正確！) 例如所有大寫字母則為 [A-Z] 小寫字母 [a-z] 數字[0-9] 三者結合起來 [A-Za-z0-9] 範例：搜尋含有任意數字的那一行 grep -n '[0-9]' regular_express.txt
[^list]	意義：位元組集合的 RE 字元，裡面列出不要的字串或範圍！那個 ^ 在 [] 內時，代表的意義是『反向選擇』的意思。例如，我不要大寫位元組，則為 [^A-Z]。但是，需要特別注意的是，如果以 grep -n [^A-Z] regular_express.txt 來搜尋，卻發現該檔案內的所有行都被列出，為什麼？因為這個 [^A-Z] 是『非大寫位元組』的意思，因為每一行均有非大寫位元組，例如第一行的 "Open Source" 就有 p,e,n,o.... 等等的小寫字範例：搜尋的字串可以是 (oog) (ood) 但不能是 (oot) ， grep -n 'oo[^t]' regular_express.txt
\{n,m\}	意義：連續 n 到 m 個的『前一個 RE 字元』意義：若為 \{n\} 則是連續 n 個的前一個 RE 字元，意義：若是 \{n,\} 則是連續 n 個以上的前一個 RE 字元！範例：在 g 與 g 之間有 2 個到 3 個的 o 存在的字串，亦即 (goog)(gooog) grep -n 'go\{2,3\}g' regular_express.txt

RE 字元	意義與範例
+	意義：重複『一個或一個以上』的前一個 RE 字元範例：搜尋 (god) (good) (goood)... 等等的字串。那個 o+ 代表『一個以上的 o 』所以，底下的執行成果會將第 1, 9, 13 行列出來。 egrep -n 'go+d' regular_express.txt
?	意義：『零個或一個』的前一個 RE 字元範例：搜尋 (gd) (god) 這兩個字串。那個 o? 代表『空的或 1 個 o 』所以，上面的執行成果會將第 13, 14 行列出來。有沒有發現到，這兩個案例( 'go+d' 與 'go?d' )的結果集合與 'go*d' 相同？想想看，這是為什麼喔！ ^_^ egrep -n 'go?d' regular_express.txt
\|	意義：用或( or )的方式找出數個字串範例：搜尋 gd 或 good 這兩個字串，注意，是『或』！所以，第 1,9,14 這三行都可以被列印出來喔！那如果還想要找出 dog 呢？ egrep -n 'gd\|good' regular_express.txt egrep -n 'gd\|good\|dog' regular_express.txt
()	意義：找出『群組』字串範例：搜尋 (glad) 或 (good) 這兩個字串，因為 g 與 d 是重複的，所以，我就可以將 la 與 oo 列於 ( ) 當中，並以 \| 來分隔開來，就可以啦！ egrep -n 'g(la\|oo)d' regular_express.txt
()+	意義：多個重複群組的判別範例：將『AxyzxyzxyzxyzC』用 echo 叫出，然後再使用如下的方法搜尋一下！ echo 'AxyzxyzxyzxyzC' \| egrep 'A(xyz)+C' 上面的例子意思是說，我要找開頭是 A 結尾是 C ，中間有一個以上的 "xyz" 字串的意思～

RE 字元	意義與範例
^word	意義：待搜尋的字串(word)在行首！範例：搜尋行首為 # 開始的那一行，並列出行號 grep -n '^#' regular_express.txt
word$	意義：待搜尋的字串(word)在行尾！範例：將行尾為 ! 的那一行列印出來，並列出行號 grep -n '!$' regular_express.txt
.	意義：代表『一定有一個任意位元組』的字元！範例：搜尋的字串可以是 (eve) (eae) (eee) (e e)，但不能僅有 (ee) ！亦即 e 與 e 中間『一定』僅有一個位元組，而空白位元組也是位元組！ grep -n 'e.e' regular_express.txt
\	意義：跳脫字元，將特殊符號的特殊意義去除！範例：搜尋含有單引號 ' 的那一行！ grep -n \' regular_express.txt
*	意義：重複零個到無窮多個的前一個 RE 字元範例：找出含有 (es) (ess) (esss) 等等的字串，注意，因為 * 可以是 0 個，所以 es 也是符合帶搜尋字串。另外，因為 * 為重複『前一個 RE 字元』的符號，因此，在 * 之前必須要緊接著一個 RE 字元喔！例如任意位元組則為『.』！ grep -n 'ess' regular_express.txt
[list]	意義：位元組集合的 RE 字元，裡面列出想要擷取的位元組！範例：搜尋含有 (gl) 或 (gd) 的那一行，需要特別留意的是，在 [] 當中『謹代表一個待搜尋的位元組』，例如『 a[afl]y 』代表搜尋的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f 或 l 的意思！ grep -n 'g[ld]' regular_express.txt
[n1-n2]	意義：位元組集合的 RE 字元，裡面列出想要擷取的位元組範圍！範例：搜尋含有任意數字的那一行！需特別留意，在位元組集合 [] 中的減號 - 是有特殊意義的，他代表兩個位元組之間的所有連續位元組！但這個連續與否與 ASCII 編碼有關，因此，你的編碼需要配置正確(在 bash 當中，需要確定 LANG 與 LANGUAGE 的變數是否正確！) 例如所有大寫位元組則為 [A-Z] grep -n '[A-Z]' regular_express.txt
[^list]	意義：位元組集合的 RE 字元，裡面列出不要的字串或範圍！範例：搜尋的字串可以是 (oog) (ood) 但不能是 (oot) ，那個 ^ 在 [] 內時，代表的意義是『反向選擇』的意思。例如，我不要大寫位元組，則為 [^A-Z]。但是，需要特別注意的是，如果以 grep -n [^A-Z] regular_express.txt 來搜尋，卻發現該檔案內的所有行都被列出，為什麼？因為這個 [^A-Z] 是『非大寫位元組』的意思，因為每一行均有非大寫位元組，例如第一行的 "Open Source" 就有 p,e,n,o.... 等等的小寫字 grep -n 'oo[^t]' regular_express.txt
\{n,m\}	意義：連續 n 到 m 個的『前一個 RE 字元』意義：若為 \{n\} 則是連續 n 個的前一個 RE 字元，意義：若是 \{n,\} 則是連續 n 個以上的前一個 RE 字元！範例：在 g 與 g 之間有 2 個到 3 個的 o 存在的字串，亦即 (goog)(gooog) grep -n 'go\{2,3\}g' regular_express.txt

RE 字元	意義與範例
^word	意義：待搜尋的字串(word)在行首！範例：搜尋行首為 # 開始的那一行，並列出行號 grep -n '^#' regular_express.txt
word$	意義：待搜尋的字串(word)在行尾！範例：將行尾為 ! 的那一行列印出來，並列出行號 grep -n '!$' regular_express.txt
.	意義：代表『一定有一個任意位元組』的字元！範例：搜尋的字串可以是 (eve) (eae) (eee) (e e)，但不能僅有 (ee) ！亦即 e 與 e 中間『一定』僅有一個位元組，而空白位元組也是位元組！ grep -n 'e.e' regular_express.txt
\	意義：跳脫字元，將特殊符號的特殊意義去除！範例：搜尋含有單引號 ' 的那一行！ grep -n \' regular_express.txt
*	意義：重複零個到無窮多個的前一個 RE 字元 ab* 匹配a開頭，後面有0個b、1個b、2個b……的字串 ab.* 匹配ab開頭，後面有任意數量（包括0）、任意字元的字元範例：找出含有 (es) (ess) (esss) 等等的字串，注意，因為 * 可以是 0 個，所以 es 也是符合帶搜尋字串。 grep -n 'ess*' regular_express.txt
[list]	意義：位元組集合的 RE 字元，裡面列出想要擷取的位元組！需要特別留意的是，在 [] 當中謹代表一個待搜尋的位元組，例如『 a[afl]y 』代表搜尋的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f 或 l 的意思！範例：搜尋含有 (gl) 或 (gd) 的那一行， grep -n 'g[ld]' regular_express.txt
[n1-n2]	意義：位元組集合的 RE 字元，裡面列出想要擷取的位元組範圍！在位元組集合 [] 中的減號 - 是有特殊意義的，他代表兩個位元組之間的所有連續位元組！但這個連續與否與 ASCII 編碼有關，因此，你的編碼需要配置正確(在 bash 當中，需要確定 LANG 與 LANGUAGE 的變數是否正確！) 例如所有大寫字母則為 [A-Z] 小寫字母 [a-z] 數字[0-9] 三者結合起來 [A-Za-z0-9] 範例：搜尋含有任意數字的那一行 grep -n '[0-9]' regular_express.txt
[^list]	意義：位元組集合的 RE 字元，裡面列出不要的字串或範圍！那個 ^ 在 [] 內時，代表的意義是『反向選擇』的意思。例如，我不要大寫位元組，則為 [^A-Z]。但是，需要特別注意的是，如果以 grep -n [^A-Z] regular_express.txt 來搜尋，卻發現該檔案內的所有行都被列出，為什麼？因為這個 [^A-Z] 是『非大寫位元組』的意思，因為每一行均有非大寫位元組，例如第一行的 "Open Source" 就有 p,e,n,o.... 等等的小寫字範例：搜尋的字串可以是 (oog) (ood) 但不能是 (oot) ， grep -n 'oo[^t]' regular_express.txt
\{n,m\}	意義：連續 n 到 m 個的『前一個 RE 字元』意義：若為 \{n\} 則是連續 n 個的前一個 RE 字元，意義：若是 \{n,\} 則是連續 n 個以上的前一個 RE 字元！範例：在 g 與 g 之間有 2 個到 3 個的 o 存在的字串，亦即 (goog)(gooog) grep -n 'go\{2,3\}g' regular_express.txt

RE 字元	意義與範例
+	意義：重複『一個或一個以上』的前一個 RE 字元範例：搜尋 (god) (good) (goood)... 等等的字串。那個 o+ 代表『一個以上的 o 』所以，底下的執行成果會將第 1, 9, 13 行列出來。 egrep -n 'go+d' regular_express.txt
?	意義：『零個或一個』的前一個 RE 字元範例：搜尋 (gd) (god) 這兩個字串。那個 o? 代表『空的或 1 個 o 』所以，上面的執行成果會將第 13, 14 行列出來。有沒有發現到，這兩個案例( 'go+d' 與 'go?d' )的結果集合與 'go*d' 相同？想想看，這是為什麼喔！ ^_^ egrep -n 'go?d' regular_express.txt
\|	意義：用或( or )的方式找出數個字串範例：搜尋 gd 或 good 這兩個字串，注意，是『或』！所以，第 1,9,14 這三行都可以被列印出來喔！那如果還想要找出 dog 呢？ egrep -n 'gd\|good' regular_express.txt egrep -n 'gd\|good\|dog' regular_express.txt
()	意義：找出『群組』字串範例：搜尋 (glad) 或 (good) 這兩個字串，因為 g 與 d 是重複的，所以，我就可以將 la 與 oo 列於 ( ) 當中，並以 \| 來分隔開來，就可以啦！ egrep -n 'g(la\|oo)d' regular_express.txt
()+	意義：多個重複群組的判別範例：將『AxyzxyzxyzxyzC』用 echo 叫出，然後再使用如下的方法搜尋一下！ echo 'AxyzxyzxyzxyzC' \| egrep 'A(xyz)+C' 上面的例子意思是說，我要找開頭是 A 結尾是 C ，中間有一個以上的 "xyz" 字串的意思～

RE 字元	意義與範例
^word	意義：待搜尋的字串(word)在行首！範例：搜尋行首為 # 開始的那一行，並列出行號 grep -n '^#' regular_express.txt
word$	意義：待搜尋的字串(word)在行尾！範例：將行尾為 ! 的那一行列印出來，並列出行號 grep -n '!$' regular_express.txt
.	意義：代表『一定有一個任意位元組』的字元！範例：搜尋的字串可以是 (eve) (eae) (eee) (e e)，但不能僅有 (ee) ！亦即 e 與 e 中間『一定』僅有一個位元組，而空白位元組也是位元組！ grep -n 'e.e' regular_express.txt
\	意義：跳脫字元，將特殊符號的特殊意義去除！範例：搜尋含有單引號 ' 的那一行！ grep -n \' regular_express.txt
*	意義：重複零個到無窮多個的前一個 RE 字元範例：找出含有 (es) (ess) (esss) 等等的字串，注意，因為 * 可以是 0 個，所以 es 也是符合帶搜尋字串。另外，因為 * 為重複『前一個 RE 字元』的符號，因此，在 * 之前必須要緊接著一個 RE 字元喔！例如任意位元組則為『.』！ grep -n 'ess' regular_express.txt
[list]	意義：位元組集合的 RE 字元，裡面列出想要擷取的位元組！範例：搜尋含有 (gl) 或 (gd) 的那一行，需要特別留意的是，在 [] 當中『謹代表一個待搜尋的位元組』，例如『 a[afl]y 』代表搜尋的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f 或 l 的意思！ grep -n 'g[ld]' regular_express.txt
[n1-n2]	意義：位元組集合的 RE 字元，裡面列出想要擷取的位元組範圍！範例：搜尋含有任意數字的那一行！需特別留意，在位元組集合 [] 中的減號 - 是有特殊意義的，他代表兩個位元組之間的所有連續位元組！但這個連續與否與 ASCII 編碼有關，因此，你的編碼需要配置正確(在 bash 當中，需要確定 LANG 與 LANGUAGE 的變數是否正確！) 例如所有大寫位元組則為 [A-Z] grep -n '[A-Z]' regular_express.txt
[^list]	意義：位元組集合的 RE 字元，裡面列出不要的字串或範圍！範例：搜尋的字串可以是 (oog) (ood) 但不能是 (oot) ，那個 ^ 在 [] 內時，代表的意義是『反向選擇』的意思。例如，我不要大寫位元組，則為 [^A-Z]。但是，需要特別注意的是，如果以 grep -n [^A-Z] regular_express.txt 來搜尋，卻發現該檔案內的所有行都被列出，為什麼？因為這個 [^A-Z] 是『非大寫位元組』的意思，因為每一行均有非大寫位元組，例如第一行的 "Open Source" 就有 p,e,n,o.... 等等的小寫字 grep -n 'oo[^t]' regular_express.txt
\{n,m\}	意義：連續 n 到 m 個的『前一個 RE 字元』意義：若為 \{n\} 則是連續 n 個的前一個 RE 字元，意義：若是 \{n,\} 則是連續 n 個以上的前一個 RE 字元！範例：在 g 與 g 之間有 2 個到 3 個的 o 存在的字串，亦即 (goog)(gooog) grep -n 'go\{2,3\}g' regular_express.txt

bash萬用字元 shell正則表示式

bash萬用字元 shell正則表示式

Linux Shell的萬用字元與正則表示式

Elasticsearch中的萬用字元及正則表示式查詢

elasticsearch-wildcard、regexp萬用字元與正則表示式查詢

Linux中的萬用字元和正則表示式

萬用字元與正則表示式（過濾手機號，ip地址）

萬用字元和正則表示式聯絡和區別

Linux中萬用字元和正則表示式的區別

linux萬用字元和正則表示式

萬用字元與正則表示式的關係

萬用字元和正則表示式

Linux 萬用字元與正則表示式的區別與詳解

【轉載】萬用字元與正則表示式

Search Everything 利用操作符、萬用字元及正則表示式搜尋

Linux(七)輸入輸出重定向結合crontab，萬用字元，正則表示式

Elasticsearch-字首、萬用字元、正則、模糊搜尋詳解

Linux 下用bash shell正則表示式批量處理檔案的應用例項

用Requests和正則表示式爬取豆瓣圖書TOP250

用Requests和正則表示式爬取貓眼電影(TOP100+最受期待榜）

Shell正則表示式 & Grep正則表示式 & shell字串處理

bash萬用字元 shell正則表示式

相關推薦