1. 程式人生 > >linux命令---grep命令

linux命令---grep命令

 

簡介

  grep (global search regular expression(RE) and print out the line,全面搜尋正則表示式並把行打印出來)是一種強大的文字搜尋工具,它能使用正則表示式搜尋文字,並把匹配的行打印出來。

  Unix的grep家族包括grep、egrep和fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的擴充套件,支援更多的re元字元, fgrep就是fixed grep或fast grep,它們把所有的字母都看作單詞,也就是說,正則表示式中的元字元表示回其自身的字面意義,不再特殊。linux使用GNU版本的grep。它功能更強,可以通過-G、-E、-F命令列選項來使用egrep和fgrep的功能。

  grep的工作方式是這樣的,它在一個或多個檔案中搜索字串模板。如果模板包括空格,則必須被引用,模板後的所有字串被看作檔名。搜尋的結果被送到標準輸出,不影響原檔案內容。grep可用於shell指令碼,因為grep通過返回一個狀態值來說明搜尋的狀態,如果模板搜尋成功,則返回0,如果搜尋不成功,則返回1,如果搜尋的檔案不存在,則返回2。我們利用這些返回值就可進行一些自動化的文字處理工作。

 

命令格式:grep [option] pattern file

複製程式碼

grep的常用選項:

-V: 列印grep的版本號

-E: 解釋PATTERN作為擴充套件正則表示式,也就相當於使用egrep。 或操作

-F :   解釋PATTERN作為固定字串的列表,由換行符分隔,其中任何一個都要匹配。也就相當於使用fgrep。

-G:   將範本樣式視為普通的表示法來使用。這是預設值。加不加都是使用grep。

匹配控制選項:

-e : 使用PATTERN作為模式。這可以用於指定多個搜尋模式,或保護以連字元( - )開頭的圖案。指定字串做為查詢檔案內容的樣式。 -f : 指定規則檔案,其內容含有一個或多個規則樣式,讓grep查詢符合規則條件的檔案內容,格式為每行一個規則樣式。 -i : 搜尋時候忽略大小寫 -v: 反轉匹配,選擇沒有被匹配到的內容。 -w:匹配整詞,精確地單詞,單詞的兩邊必須是非字元符號(即不能是字母數字或下劃線) -x:僅選擇與整行完全匹配的匹配項。精確匹配整行內容(包括行首行尾那些看不到的空格內容都要完全匹配) -y:此引數的效果和指定“-i”引數相同。 一般輸出控制選項:
-c: 抑制正常輸出;而是為每個輸入檔案列印匹配線的計數。 --color [= WHEN]:讓關鍵字高亮顯示,如--color=auto -L:列出檔案內容不符合指定的範本樣式的檔名稱 -l : 列出檔案內容符合指定的範本樣式的檔名稱。 -m num:當匹配內容的行數達到num行後,grep停止搜尋,並輸出停止前搜尋到的匹配內容 -o: 只輸出匹配的具體字串,匹配行中其他內容不會輸出 -q:安靜模式,不會有任何輸出內容,查詢到匹配內容會返回0,未查詢到匹配內容就返回非0 -s:不會輸出查詢過程中出現的任何錯誤訊息,-q和-s選項因為與其他系統的grep有相容問題,shell指令碼應該避免使用-q和-s,並且應該將標準和錯誤輸出重定向到/dev/null 代替。 輸出線字首控制: -b:輸出每一個匹配行(或匹配的字串)時在其前附加上偏移量(從檔案第一個字元到該匹配內容之間的位元組數) -H:在每一個匹配行之前加上檔名一起輸出(針對於查詢單個檔案),當查詢多個檔案時預設就會輸出檔名 -h:禁止輸出上的檔名的字首。無論查詢幾個檔案都不會在匹配內容前輸出檔名 --label = LABEL:顯示實際來自標準輸入的輸入作為來自檔案LABEL的輸入。這是特別在實現zgrep等工具時非常有用,例如gzip -cd foo.gz | grep --label = foo -H的東西。看到 也是-H選項。 -n:輸出匹配內容的同時輸出其所在行號。 -T:初始標籤確保實際行內容的第一個字元位於製表位上,以便對齊標籤看起來很正常。在匹配資訊和其前的附加資訊之間加入tab以使格式整齊。 上下文線控制選項: -A num:匹配到搜尋到的行以及該行下面的num行 -B num:匹配到搜尋到的行以及該行上面的num行 -C num:匹配到搜尋到的行以及上下各num行 檔案和目錄選擇選項: -a: 處理二進位制檔案,就像它是文字;這相當於--binary-files = text選項。不忽略二進位制的資料。 --binary-files = TYPE:如果檔案的前幾個位元組指示檔案包含二進位制資料,則假定該檔案為型別TYPE。預設情況下,TYPE是二進位制的,grep通常輸出一行訊息二進位制檔案匹配,或者如果沒有匹配則沒有訊息。如果TYPE不匹配,grep假定二進位制檔案不匹配;這相當於-I選項。如果TYPE是文字,則grep處理a二進位制檔案,如果它是文字;這相當於-a選項。警告:grep --binary-files = text可能會輸出二進位制的垃圾,如果輸出是一個終端和如果可能有討厭的副作用終端驅動程式將其中的一些解釋為命令。 -D:如果輸入檔案是裝置,FIFO或套接字,請使用ACTION處理。預設情況下,讀取ACTION,這意味著裝置被讀取,就像它們是普通檔案一樣。如果跳過ACTION,裝置為 默默地跳過。 -d: 如果輸入檔案是目錄,請使用ACTION處理它。預設情況下,ACTION是讀的,這意味著目錄被讀取,就像它們是普通檔案一樣。如果跳過ACTION,目錄將靜默跳過。如果ACTION是recurse,grep將遞迴讀取每個目錄下的所有檔案;這是相當於-r選項。 --exclude=GLOB:跳過基本名稱與GLOB匹配的檔案(使用萬用字元匹配)。檔名glob可以使用*,?和[...]作為萬用字元,和\引用萬用字元或反斜槓字元。搜尋其檔名和GLOB萬用字元相匹配的檔案的內容來查詢匹配使用方法:grep -H --exclude=c* "old" ./* c*是通配檔名的萬用字元./* 指定需要先通配檔名的檔案的範圍,必須要給*,不然就匹配不出內容,(如果不給*,帶上-r選項也可以匹配) --exclude-from = FILE:在檔案中編寫通配方案,grep將不會到匹配方案中檔名的檔案去查詢匹配內容 --exclude-dir = DIR:匹配一個目錄下的很多內容同時還要讓一些子目錄不接受匹配,就使用此選項。 --include = GLOB:僅搜尋其基本名稱與GLOB匹配的檔案(使用--exclude下所述的萬用字元匹配)。 -R ,-r :以遞迴方式讀取每個目錄下的所有檔案; 這相當於-d recurse選項。 其他選項: --line-buffered: 在輸出上使用行緩衝。這可能會導致效能損失。 --mmap:啟用mmap系統呼叫代替read系統呼叫 -U:將檔案視為二進位制。 -z:將輸入視為一組行,每一行由一個零位元組(ASCII NUL字元)而不是a終止新隊。與-Z或--null選項一樣,此選項可以與排序-z等命令一起使用來處理任意檔名。

複製程式碼

 

簡述

複製程式碼

 
-a   --text   #不要忽略二進位制的資料。 將 binary 檔案以 text 檔案的方式搜尋資料 
-A<顯示行數>   --after-context=<顯示行數>   #除了顯示符合範本樣式的那一列之外,並顯示該行之後的內容。   
-b   --byte-offset   #在顯示符合樣式的那一行之前,標示出該行第一個字元的編號。   
-B<顯示行數>   --before-context=<顯示行數>   #除了顯示符合樣式的那一行之外,並顯示該行之前的內容。   
-c    --count   #計算符合樣式的行數。   
-C<顯示行數>    --context=<顯示行數>或-<顯示行數>   #除了顯示符合樣式的那一行之外,並顯示該行之前後的內容。   
-d <動作>      --directories=<動作>   #當指定要查詢的是目錄而非檔案時,必須使用這項引數,否則grep指令將回報資訊並停止動作。   
-e<範本樣式>  --regexp=<範本樣式>   #指定字串做為查詢檔案內容的樣式。   
-E      --extended-regexp   #將樣式為延伸的普通表示法來使用。   
-f<規則檔案>  --file=<規則檔案>   #指定規則檔案,其內容含有一個或多個規則樣式,讓grep查詢符合規則條件的檔案內容,格式為每行一個規則樣式。   
-F   --fixed-regexp   #將樣式視為固定字串的列表。   
-G   --basic-regexp   #將樣式視為普通的表示法來使用。   
-h   --no-filename   #在顯示符合樣式的那一行之前,不標示該行所屬的檔名稱。   
-H   --with-filename   #在顯示符合樣式的那一行之前,表示該行所屬的檔名稱。   
-i    --ignore-case   #忽略字元大小寫的差別。   
-l    --file-with-matches   #列出檔案內容符合指定的樣式的檔名稱。   
-L   --files-without-match   #列出檔案內容不符合指定的樣式的檔名稱。   
-n   --line-number   #在顯示符合樣式的那一行之前,標示出該行的列數編號。   
-q   --quiet或--silent   #不顯示任何資訊。   
-r   --recursive   #此引數的效果和指定“-d recurse”引數相同。   
-s   --no-messages   #不顯示錯誤資訊。   
-v   --revert-match   #顯示不包含匹配文字的所有行。   
-V   --version   #顯示版本資訊。   
-w   --word-regexp   #只顯示全字符合的列。   
-x    --line-regexp   #只顯示全列符合的列。   
-y   #此引數的效果和指定“-i”引數相同。
--color=auto :可以將找到的關鍵詞部分加上顏色的顯示

複製程式碼

 

 

使用例項:

一、常用用法

複製程式碼

grep -i pattern files :不區分大小寫地搜尋。預設情況區分大小寫,
grep -l pattern files :只列出匹配的檔名,
grep -L pattern files :列出不匹配的檔名,
grep -w pattern files :只匹配整個單詞,而不是字串的一部分(如匹配‘magic’,而不是‘magical’),
grep -C number pattern files :匹配的上下文分別顯示[number]行,
grep pattern1 | pattern2 files :顯示匹配 pattern1 或 pattern2 的行,
grep pattern1 files | grep pattern2 :顯示既匹配 pattern1 又匹配 pattern2 的行。

這裡還有些用於搜尋的特殊符號:
< 和 > 分別標註單詞的開始與結尾。
例如:
grep man * 會匹配 ‘Batman’、‘manic’、‘man’等,
grep \'<man\' * 匹配‘manic’和‘man’,但不是‘Batman’,
grep \'<man>\' 只匹配‘man’,而不是‘Batman’或‘manic’等其他的字串。
\'^\':指匹配的字串在行首,
\'$\':指匹配的字串在行尾,
如果您不習慣命令列引數,可以試試圖形介面的‘grep’,如 reXgrep 。這個軟體提供 AND、OR、NOT 等語法,還有漂亮的按鈕 :-) 。如果您只是需要更清楚的輸出,不妨試試 fungrep 。

.grep 搜尋字串
命令格式:
grep string filename
尋找字串的方法很多,比如說我想找所有以M開頭的行.此時必須引進pattern的觀
念.以下是一些簡單的□例,以及說明:
^M 以M開頭的行,^表示開始的意思
M$ 以M結尾的行,$表示結束的意思
^[0-9] 以數字開始的行,[]內可列舉字母
^[124ab] 以1,2,4,a,或b開頭的行
^b.503 句點表示任一字母
* 星號表示0個以上的字母(可以沒有)
+ 加號表示1個以上的字母
. 斜線可以去掉特殊意義
<eg> cat passwd | grep ^b 列出大學部有申請帳號者名單
cat passwd | grep ^s 列出交換學生申請帳號者名單
cat passwd | grep \'^b.503\' 列出電機系各年級...
grep \'^.\' myfile.txt 列出所有以句點開頭的行

複製程式碼

 

1、查詢指定程序

命令:ps -ef|grep java

 

2、查詢指定程序個數

命令:ps -ef|grep -c java

或ps -ef|grep java -c

 

3、從檔案中讀取關鍵詞進行搜尋,預設是顯示的是行 

命令1:cat test.txt | grep -f test2.txt

命令2(顯示行號):cat test.txt | grep -nf test2.txt

作用:輸出test.txt檔案中含有從test2.txt檔案中讀取出的關鍵詞的內容行,可用於按指定關鍵詞(放到一個檔案中)搜尋日誌檔案。

 

另一種用法:將多個檔案之間相同的行輸出來

# cd /etc/sysconfig/network-scripts/

# grep  "IPADDR" ifcfg-eth0  ifcfg-lo      #預設不加引數指定過濾關鍵字,外加多個檔案,只是將多個檔案裡面有匹配的行輸出

ifcfg-eth0:IPADDR=192.168.1.108

ifcfg-lo:IPADDR=127.0.0.1

# grep -f ifcfg-eth0  ifcfg-lo  #grep -f 檔案1 檔案2 ,會將多個檔案之間相同的行輸出出來

ONBOOT=yes

 

-o:只顯示被模式匹配到的字串,而不是整個行

命令:grep -o "you" ab.log 

 

# grep "root"  /etc/passwd  #先看下正常的過濾,會將整個一行過濾出來

root:x:0:0:root:/root:/bin/bash

operator:x:11:0:operator:/root:/sbin/nologin

# grep -o "root" /etc/passwd  #加o之後的操作,只過濾關鍵字出來

root

root

root

root

# grep -o "root:.*0" /etc/passwd    #加上正則表示式,這樣才是正確的用法,不用輸出一整行,只是輸出一小段

root:x:0:0

# grep -o "root" -b   /etc/passwd  

-b和-o一般是配合使用的,一行中字串的字元是從該行的第一個字元開始計算,起始值為0。這裡左邊的數字就是此關鍵字在此檔案中的起始位置,第一個root出現在0位置,然後字元字母有一個算一個,你就一個個的向右數吧,下一個root出現在11位置以此類推。

0:root

11:root

17:root

414:root

 

4、從檔案中查詢關鍵詞,忽略大小寫,預設情況區分大小寫

命令1:grep 'linux' test.txt

命令2(從多個檔案中查詢):grep 'linux' test.txt test2.txt

  多檔案時,輸出查詢到的資訊內容行時,會把檔案的命名在行最前面輸出並且加上":"作為標示符

命令3(忽略大小寫):grep -i  'linux' test.txt

命令:find . -name ".log" | grep -i error | grep -vi "info"

1)使用find -name 來列出所有log檔案,重定向給grep
2)使用grep -i 來查詢包含error的行
3)使用grep -vi 來查詢不包含info的行

 

5、grep不顯示本身

命令:

ps aux|grep \[s]sh

ps aux | grep ssh | grep -v "grep"      #不包含grep ssh這條命令

grep -v root /etc/passwd | grep -v nologin  #將/etc/passwd,將沒有出現 root 和nologin的行取出來

 

6、-r 遞迴查詢子目錄
 查詢當前目錄及其子目錄下面包含匹配字元的檔案

複製程式碼

# grep ‘ab’ * #在當前目錄搜尋帶'ab'行的檔案
# grep -r ‘ab’ * #在當前目錄及其子目錄下搜尋'ab'行的檔案
# grep -l -r ‘ab’ * #在當前目錄及其子目錄下搜尋'ab'行的檔案,但是不顯示匹配的行,只顯示匹配的檔案
# grep -nr BLOG* . # 查詢子目錄,匹配後輸出行號,這裡的點表示當前目錄
# grep -lr BLOG* . #查詢子目錄,匹配後只輸出文件名

複製程式碼

查詢不包含某個目錄

#grep -R --exclude-dir=node_modules 'some pattern' /path/to/search   #不包含txt目錄 

 

7、列出關鍵字所在行的前幾行與後幾行也一起顯示

  -A -B -C

很多時候,我們並關心匹配行而是關心匹配行的上下文。這時候-A -B -C就有用了
-A n 後n行,A記憶為(After)
-B n 前n行,B記憶為(Before)
-C n 前n行,後n行,C記憶為(Center)

複製程式碼

[root@www ~]# dmesg | grep -n -A3 -B2 --color=auto 'eth'
245-PCI: setting IRQ 10 as level-triggered
246-ACPI: PCI Interrupt 0000:00:0e.0[A] -> Link [LNKB] ...
247:eth0: RealTek RTL8139 at 0xee846000, 00:90:cc:a6:34:84, IRQ 10
248:eth0: Identified 8139 chip type 'RTL-8139C'
249-input: PC Speaker as /class/input/input2
250-ACPI: PCI Interrupt 0000:00:01.4[B] -> Link [LNKB] ...
251-hdb: ATAPI 48X DVD-ROM DVD-R-RAM CD-R/RW drive, 2048kB Cache, UDMA(66)
# 如上所示,你會發現關鍵字 247 所在的前兩行及 248 後三行也都被顯示出來!

複製程式碼

8、--line-buffered 開啟buffering 模式

有一個檔案是動態的,它不斷地新增資訊到檔案的尾部,而你想要輸出包含某些資訊的行。即持續的grep一個動態的流

 

9、e與E區別

grep想同時過濾多個條件或操作

錯誤寫法:

# netstat -an|grep "ESTABLISHED|WAIT"      #預設grep不支援多條件匹配    

正確寫法:

# netstat -an|grep -E "ESTABLISHED|WAIT"     #加上-E 多條件用""包起來,然後多條件之間用|管道符分開

tcp        0     52 192.168.1.108:22            192.168.1.104:54127         ESTABLISHED 

# ps -aux|grep -e udevd -e master|awk {'print $(NF-1)'}|sort|uniq    #而-e呢不用""包起來,-e 指定一個匹配條件

/sbin/udevd

/usr/bin/salt-master

 

  grep -E '123|abc' filename  // 找出檔案(filename)中包含123或者包含abc的行
  egrep '123|abc' filename    // 用egrep同樣可以實現
  awk '/123|abc/' filename   // awk 的實現方式

 

與操作

 grep pattern1 files | grep pattern2 :顯示既匹配 pattern1 又匹配 pattern2 的行。

 

10、-c 統計行數

# grep -i "abc" test.txt|wc -l  #不分大小寫。test.txt裡面包含abc過濾條件的為2行

2

# grep -yc "abc" test.txt  #-c呢,就是不顯示行的內容,直接顯示有幾行

2

# cat  /etc/passwd|wc -l 

55

# grep  -c "^.*$" /etc/passwd  #那麼我們除了wc -l用來統一一個檔案有多少行以外,又多了一種統計檔案多少行的方法

55

 

11、 -m的使用

# cat test2.txt  #這是測試檔案

abc 1

abc 2

abc 3

abc 4

abc 5

# grep -m 3 "abc" test2.txt  #只匹配到了第三行就退出了

abc 1

abc 2

abc 3

 

二、與正則表示式結合

複製程式碼

grep的規則表示式:
\     反義字元:如"\"\""表示匹配""
[ - ] 匹配一個範圍,[0-9a-zA-Z]匹配所有數字和字母
* 所有字元,長度可為0
+ 前面的字元出現了一次或者多次
^  #匹配行的開始 如:'^grep'匹配所有以grep開頭的行。    
$  #匹配行的結束 如:'grep$'匹配所有以grep結尾的行。    
.  #匹配一個非換行符的字元 如:'gr.p'匹配gr後接一個任意字元,然後是p。    
*  #匹配零個或多個先前字元 如:'*grep'匹配所有一個或多個空格後緊跟grep的行。    
.*   #一起用代表任意字元。   
[]   #匹配一個指定範圍內的字元,如'[Gg]rep'匹配Grep和grep。    
[^]  #匹配一個不在指定範圍內的字元,如:'[^A-FH-Z]rep'匹配不包含A-R和T-Z的一個字母開頭,緊跟rep的行。    
\(..\)  #標記匹配字元,如'\(love\)',love被標記為1。    
\<      #到匹配正則表示式的行開始,如:'\<grep'匹配包含以grep開頭的單詞的行。    
\>      #到匹配正則表示式的行結束,如'grep\>'匹配包含以grep結尾的單詞的行。    
x\{m\}  #重複字元x,m次,如:'0\{5\}'匹配包含5個o的行。    
x\{m,\}  #重複字元x,至少m次,如:'o\{5,\}'匹配至少有5個o的行。    
x\{m,n\}  #重複字元x,至少m次,不多於n次,如:'o\{5,10\}'匹配5--10個o的行。   
\w    #匹配文字和數字字元,也就是[A-Za-z0-9],如:'G\w*p'匹配以G後跟零個或多個文字或數字字元,然後是p。   
\W    #\w的反置形式,匹配一個或多個非單詞字元,如點號句號等。   
\b    #單詞鎖定符,如: '\bgrep\b'只匹配grep。  

POSIX字元:
為了在不同國家的字元編碼中保持一至,POSIX(The Portable Operating System Interface)增加了特殊的字元類,如[:alnum:]是[A-Za-z0-9]的另一個寫法。要把它們放到[]號內才能成為正則表示式,如[A- Za-z0-9]或[[:alnum:]]。在linux下的grep除fgrep外,都支援POSIX的字元類。
[:alnum:]    #文字數字字元   
[:alpha:]    #文字字元   
[:digit:]    #數字字元   
[:graph:]    #非空字元(非空格、控制字元)   
[:lower:]    #小寫字元   
[:cntrl:]    #控制字元   
[:print:]    #非空字元(包括空格)   
[:punct:]    #標點符號   
[:space:]    #所有空白字元(新行,空格,製表符)   
[:upper:]    #大寫字元   
[:xdigit:]   #十六進位制數字(0-9,a-f,A-F)

複製程式碼

 

例:通過管道過濾ls -l輸出的內容,只顯示以a開頭的行。

首與行尾位元組 ^ $,^ 符號,在字元類符號(括號[])之內與之外是不同的! 在 [] 內代表『反向選擇』,在 [] 之外則代表定位在行首的意義!

$ ls -l | grep \'^a\'

$ ls -l | grep  ^a

$ ls -l | grep  ^[^a]      #輸出非a開頭的行,反向選擇

$ grep -n '^$' express.txt      #找出空白行,因為只有行首跟行尾 (^$)

 

例:顯示所有以d開頭的檔案中包含test的行。

$ grep \'test\' d*

 

例:輸出以hat結尾的行內容

$ cat test.txt |grep hat$

 

例:顯示在aa,bb,cc檔案中匹配test的行。

$ grep \'test\' aa bb cc

 

例:顯示所有包含每個字串至少有5個連續小寫字元的字串的行。

在一組集合位元組中,如果該位元組組是連續的,例如大寫英文/小寫英文/數字等等,就可以使用[a-z],[A-Z],[0-9]等方式來書寫,那麼如果我們的要求字串是數字與英文呢?就將他全部寫在一起,變成:[a-zA-Z0-9]。

$ grep \'[a-z]{5}\' aa

$ grep -n '[0-9]' regular_express.txt    #取得有數字的那一行

$ grep -n '^[a-z]' regular_express.txt    #只輸出開頭是小寫字母的那一行

$ grep -n '^[^a-zA-Z]' regular_express.txt   #不輸出開頭是英文的

$ grep -n '\.$' regular_express.txt        #只輸出行尾結束為小數點 (.) 的那一行

注意:小數點具有其他意義,所以必須要使用轉義字元(\)來加以解除其特殊意義!

 

例:顯示包含ed或者at字元的內容行

命令:cat test.txt |grep -E "ed|at"

 

例:如果west被匹配,則es就被儲存到記憶體中,並標記為1,然後搜尋任意個字元(.*),這些字元後面緊跟著另外一個es(1),找到就顯示該行。如果用egrep或grep -E,就不用""號進行轉義,直接寫成\'w(es)t.*1\'就可以了。

$ grep \'w(es)t.*1\' aa

 

例:顯示當前目錄下面以.txt 結尾的檔案中的所有包含每個字串至少有7個連續小寫字元的字串的行

命令:grep '[a-z]\{7\}' *.txt

 

例:查詢IP地址、郵箱、手機號

這裡用到了-o和-P命令
man grep檢視
-o, --only-matching:
              Show only the part of a matching line that matches PATTERN.
-P, --perl-regexp:
              Interpret PATTERN as a Perl regular expression.

也就是說-o,只顯示匹配行中匹配正則表示式的那部分,-P,作為Perl正則匹配

192.168.0.1

[email protected]

匹配ABC類IP地址即 1.0.0.1---223.255.255.254

命令(IP):grep -oP "([0-9]{1,3}\.){3}[0-9]{1,3}" file.txt

或grep -E --color "\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-1][0-9]|22[0-3])\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])\>" file.txt

 

郵箱是任意長度數字字母@任意長度數字字母

命令(郵箱):grep -oP "[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+" file.txt

手機號碼是1[3|4|5|8]後面接9位數字的

命令(手機號):grep -E "\<1[3|4|5|8][0-9]{9}\>"  file.txt

 

例:任意一個位元組 . 與重複位元組 *

. (小數點):代表『一定有一個任意位元組』的意思;
* (星號):代表『重複前一個字元, 0 到無窮多次』的意思,為組合形態

$ grep -n '[0-9][0-9]*' regular_express.txt     #找出『任意數字』的行

$ grep -n 'g.*g' regular_express.txt       #找出以g行首與行尾的行,當中的字元可有可無

這個 .* 的 RE 表示任意字元是很常見的.

 

例:限定連續 RE 字元範圍 {}

利用 . 與 RE 字元及 * 來配置 0 個到無限多個重複位元組

打算找出兩個到五個 o 的連續字串,該如何作?這時候就得要使用到限定範圍的字元 {} 了。 但因為 { 與 } 的符號在 shell 是有特殊意義的,因此, 我們必須要使用字元   \ 來讓他失去特殊意義才行。 

$ grep -n 'o\{2\}' regular_express.txt

$ grep -n 'go\{2,5\}g' regular_express.txt  #要找出 g 後面接 2 到 5 個 o ,然後再接一個 g 的字串

$ grep -n 'go\{2,\}g' regular_express.txt    #想要的是 2 個 o 以上的 goooo....g 呢?除了可以是 gooo*g 

 

 

 

參考資料:

grep命令詳解

grep 用法小結:請點選直接檢視大圖