Linux Shell指令碼之正則表示式

阿新 • • 發佈：2022-05-10

正則表示式RE

重要的文字處理工具：vim sed awk grep

1.什麼是正則表示式？

正則表示式（regular expression，RE）是一種字元模式，用於在查詢過程中匹配指定的字元。

在大多數程式裡，正則表示式都被置於兩個斜槓之間；例如/l[oO]ve/就是由正斜槓界定的正則表示式。

它將匹配被查詢的行中任何位置出現的相同模式，在正則表示式中，元字元是重要的概念

匹配數字：¹+$ ^：以xxx開頭，+前面的物件出現一個或多個，$是以xxx結尾，[]裡面的是匹配的模式

匹配mail：[a-z0-9_][email protected][a-z0-9]+\.[a-z]+

匹配ip：[ 
0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}
	   或
	   [[:digit:]]{1,3}\.[[:digit:]]{1,3}\.[[:digit:]]{1,3}\.[[:digit:]]{1,3}

[[email protected] ~]# egrep '[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}' /etc/sysconfig/network-scripts/ifcfg-ens33
IPADDR=192.168.81.250
NETMASK=255.255.255.0
GATEWAY=192.168.81.2
DNS1 
=192.168.81.2

或：
[[email protected] ~]# egrep '[[:digit:]]{1,3}\.[[:digit:]]{1,3}\.[[:digit:]]{1,3}\.[[:digit:]]{1,3}' /etc/sysconfig/network-scripts/ifcfg-ens33
IPADDR=192.168.81.250
NETMASK=255.255.255.0
GATEWAY=192.168.81.2
DNS1=192.168.81.2

2.元字元

定義：元字元是這樣一類字元，他們表達的是不同於字面本身的含義

shell元字元（也稱為萬用字元）由shell來解析，如rm -rf *.pdf，元字元星號*shell將其解析為任意多個字元

正則表示式元字元由各種執行模式匹配操作的程式來解析，比如vim、grep、sed、awk、python

例子：

[[email protected] d09_shell_re_zzbds]# rm -rf *.ps		表示刪除所有以.ps結束的檔案
[[email protected] d09_shell_re_zzbds]# grep 'c*' /etc/passwd		這個不在是shell來解析，這一點會讓人誤以為是c開頭包含任意字元的行，其實不是，會輸出所有行，這裡由grep來解析，表示c出現0次或多次也就是c可以不出現，那麼不匹配c的行也會出現，顯然不是我們想要的，可以使用grep 'c\+' /etc/passwd來完成匹配或者egrep 'c+' /etc/passwd

vim例項：

:1,$ s/tom/TOM/g		這裡的1,$等同於%都表示全文假如有Tom字元或者tomorrow那麼也會被改變不太合理，可以使用正則
:1,$ s/\<[tT]om\>/TOM/g		這裡利用詞首和詞尾定位符鎖定只能是tom單詞才會被更改

2.1正則表示式元字元

=基於正則表示式元字元

匹配模式中嚴格區分大小寫

  元字元 							功能        								示例      

	^		行首定位符				grep '^root' /etc/passwd /etc/shadow

	$		行尾定位符     			grep 'bash$' /etc/passwd /etc/shadow

	.  		匹配單個字元    			grep 'r.t' /etc/passwd   grep '^r..t' /etc/passwd 

	*   	匹配前導符0次或多次		  grep 'ro*t' /etc/passwd

	.*		任意多個字元				grep 'r.*t' /etc/passwd

	[]		匹配指定範圍內的一個字元	grep '[rR]oot' /etc/passwd

	[ - ]	匹配指定範圍內的一個字元	grep'[a-z0-9]oot' /etc/passwd,如果要去大小寫a-z的話可以這麼寫[a-zA-Z]或者[a-Z]

	[ ^ ]	匹配不在指定組內的字元		grep '[^a-z0-9]oot' /etc/passwd 過濾不包含a-z0-9的oot的字元
	\		用來轉義元字元			   grep 'love\.' love.txt
	\<		詞首定位符				grep '\<root' /etc/passwd
    \>		詞尾定位符				grep 'root\>' /etc/passwd
    \(..\)	匹配稍後使用的字元的標籤只適用於替換，在bash不支援   %s /(\192.168.81.\)250/\1251/g
    x\{m\}	字元x重複出現m次			grep 'o\{5\}' /etc/passwd
    x\{m,\}	字元x重複出現m次以上		   grep 'o\{5,\}' /etc/passwd
    x\{m,n\}	字元x重複出現m到n次		grep 'o{2,5\}' /etc/passwd
	
	==================================幾個例子==================================
grep '\<root\>' /etc/passwd             //限制詞首和詞尾都是root的單詞
grep '^\<root\>' /etc/passwd            //僅是以root單詞開頭的行

%s/192.168.81.250/192.168.81.251/g              //正常情況在vim中要改一個字元
%s/\(192.168.81.\)250/\1251/g                   //利用正則\(..\)來改，這種情況在：如果要改的字元前一部分跟之前一樣，可以使用\(\)在括號中把相同的部分在括號中寫好，然後>在使用\1呼叫第一個括號中的內容，如果是定義了兩個括號就使用\2呼叫第二個括號中的內容
%s#\(192.168.81\).250#\1.251#g                  //這個原理和上調命令一致，#等同於/
%s#\(192.\)\(168.\)\(81.\)250#\1\2\3251#g               //多括號
%s/\(192\).\(168\).\(81\).250/\1.\2.\3.251/g
3,8 s/\(.*\)/#\1                        //3-8行在每行前面加一個#

egrep 'ro*' /etc/passwd //匹配o出現0或多次
egrep 'ro{2}' /etc/passwd       //匹配o出現2次
egrep 'ro{2,}' /etc/passwd      //匹配o出現2次以上
egrep 'ro{2,5}' /etc/passwd     //匹配o出現兩次到五次

grep 'ro*' /etc/passwd  //匹配o出現0或多次
grep 'ro\{2\}' /etc/passwd      //匹配o出現2次
grep 'ro\{2,\}' /etc/passwd     //匹配o出現2次以上
grep 'ro\{2,5\}' /etc/passwd    //匹配o出現兩次到五次

2.2擴充套件正則表示式元字元

擴充套件元字元的意思和基礎的一致，就是省略了一些特殊符號用egrep來進行匹配

+		匹配一個或多個前導字元		[a-z]+ove
?		匹配0個或1個前導字元		  lo?ve
a|b		匹配a或b				love|hate
()		組字元					loveable|rs	love(able|rs)ov+ ov+(ov)+	組字元也就是匹配括號中的內容，ov+是v一個或多個，(ov)+是ov兩個字元一個或多個
    (..)(..)\1\2	標籤匹配字元		(love)able\1er和基礎元字元一樣
x{m}	字元x重複m次		o{5}
x{m,}	字元x重複至少m次	o{5,}
x{m,n}	字元x重複m到n次	o{5,10}
=========================例子========================
egrep 'ro+t' /etc/passwd        //o出現1次或多次
egrep 'ro?t' /etc/passwd        //o出現0次或1次
egrep 'root|jxl' /etc/passwd    //匹配root或者jxl的行
netstat -lnpt -an | egrep ':80|:22\>'   //匹配80或者22號埠
egrep 'ro(ot|or)' /etc/passwd           //組字元，匹配ot或者or
egrep 'r(o)+t' /etc/passwd              //組字元o出現多次

2.3.POSIX字元類

這種型別類似於系統的環境變數，由系統定義好的，我們來用就行

表示式					功能							例項

[:alnum:]			字母與數字字元					[[:alnum:]]+	//字母和數字出現多次

[:alpha:]			字母字元（包括大小寫字母）		[[:alpha:]]{4}		//字母字元出現四次

[:blank:]			空格與製表符					 [[:blank:]]*	//出現0次到多次

[:digit:]			數字字母					  [[:digit:]]?	//出現0次或1次

[:lower:]			小寫字母				      [[:lower:]]{5,}		//出現5次以上

[:upper:]			大寫字母				      [[:upper:]]+		//出現一次或多次

[:punct:]			標點符號				      [[:punct:]]

[:space:]			包括換行符，回車等在內的所有空白  [[:space:]]+

3.正則匹配例項：vim

/love/				//匹配love的行
/^love/			//以love開頭的行
/love$/			//以love結尾的行
/l.ve/				//l後面任意一個字元ove的行
/lo*ve/			//o可以出現0次到多次
/[Ll]ove/			//L或者l任意其中一個
/love[a-z]/		//love後面跟一個a-z字元的行
/love[^a-zA-Z0-9]			//除去a-zA-Z0-9的行


/.*/			//任意多個字元表示一行
/^$/			//空行，有一個回車
/^[A-Z]..$/			//以大寫A-Z開頭再跟後面有兩個字元的行
/^[A-Z][a-z]*3[0-5]/		//以大寫字母A-Z開頭在跟a-z出現0次或多次再跟3在跟一個0-5的數字
/[a-z]*\./			//a-z出現0次到多次後面在跟個點
/^ *[A-Z][a-z][a-z]$/	//以0個到多個空行開頭在跟一個包含A-Z的在跟一個包含在跟一個a-z的包含a-z結尾的行
/^[A-Za-z]*[^,][A_Za-z]*$/		//以A-Z或者a-z開頭0個到多個在跟一個非逗號在跟一個A-Z或a-z0到多個結尾的
/\<fourth\>			//匹配一個單詞
/\<f.*th/>			//匹配一個f開頭th結尾的單詞
\5{2}2{3}\./ 		//5出現2次，2出現3次在跟一個點


空行
/^$/		//空行
/^[ \t]*$/		//0到多個空格或tab鍵開頭或結尾的


註釋行
/^#/	//#開頭的行
/^[ \t]*#/		//以空格或tab鍵開頭的0到多個在跟一個#

:1,$/\([Oo]ccur\)ence/\1rence/		//全文搜尋O或者occurence的行找到後利用標籤\1呼叫第一個括號後面在跟上rence
:1,$/(square\)and\(fair\)/\2 and \1/		//就是將第二個標籤的內容與第一個標籤的內容換了個位置

0-9 ↩︎

Linux Shell指令碼之正則表示式

正則表示式RE 重要的文字處理工具：vim sed awk grep 1.什麼是正則表示式？正則表示式（regular expression，RE）是一種字元模式，用於在查詢過程中匹配指定的字元。

Shell指令碼之——正則表示式的詳解

一、正則表示式 1.1 什麼是正則表示式正則表示式(regular expression)描述了一種字串匹配的模式（pattern），可以用來檢查一個串是否含有某種子串、將匹配的子串替換或者從某個串中取出符合某個條件的子串等。在Li

Linux shell如何用正則表示式匹配分組資料

方法兩種方法：grep和sed echo "libgcc-4.8.5-4.h5.x86_64.rpm" | grep -Eo "[0-9]+\\.[0-9]+.*x86_64"

shell指令碼(14)-正則表示式

一、正則表示式介紹正則表示式是一種文字模式匹配，包括普通字元(a...z)和特殊字元(元字元)。

Linux之正則表示式

什麼是正則表示式？簡單地說，正則表示式就是處理字串的方法，它以行為單位來進行字串的處理操作，正則表示式通過一些特殊符號的輔助，可以讓使用者輕易地完成【查詢、刪除、替換】某特定字串的處理過程。

shell指令碼指令碼中正則表示式和sed的使用

技術標籤：字串linux正則表示式shell ** 1、正則表示式的使用 ** 1.1、概念：正則表示式（或稱Regular Expression，簡稱RE），是用於描述字元排列和匹配模式的一種語法規則。它主要用於字串的分割，匹配、査找及

Linux sed之正則表示式：sed替換字串時，使用正則表示式的注意事項

一、元字符集 ^ 　　錨定行的開始如：/^sed/匹配所有以sed開頭的行。 $ 　　錨定行的結束如：/sed$/匹配所有以sed結尾的行。

Python 學習筆記之——正則表示式

0. 常用匹配規則 ^ 匹配字串的開頭 $ 匹配字串的結尾 [...] 匹配一組字元，比如 [abc] 表示匹配小寫字母 a 或者 b 或者 c，[a-z] 表示匹配所有的小寫字母，[0-3] 表示匹配數字 0,1,2,3

iOS開發之正則表示式

正則表示式就是用“字串”來描述一種規則特徵，然後去驗證另一個字串是否符合這個特徵。比如：驗證手機號碼是否符合規則，驗證身份證號碼是否符合規則，驗證郵箱是否符合規則等。

Java新手入門學習之正則表示式

一、概述 1、概念：符合一定規則的表示式。 2、作用：用於專門操作字串。 3、特點：用於一些特定的符號來表示一些程式碼操作，這樣就可以簡化程式碼書寫。

JS之正則表示式

概述 1、什麼是正則表示式，有什麼用？正則表示式：Regular Expression。在編寫處理字串的程式或網頁時，經常會有查詢符合某些複雜規則的字串的需要。正則表示式就是用於描述這些規則的工具。換句話說，正則表示式就

UNIX命令之正則表示式

正則表示式 1.檔案操作2.1搜尋有the的行,並輸出行號。 grep -n ‘the’ 1.txt 搜尋沒有the的行,並輸出行號。 grep -vn ‘the’ 1.txt

javaScript之正則表示式

javaScript之正則表示式正則表示式是一個描述字元模式的物件。 1、字元類字元類是指用於匹配字元的組合。

python正則表示式處理文字內容_Rust 文字處理之正則表示式 Rust 實踐指南

技術標籤：python正則表示式處理文字內容正則表示式多重標籤匹配正則表示式，又稱規則表示式。(英語：Regular Expression，在程式碼中常簡寫為regex、regexp或RE)，電腦科學的一個概念。正則表示式通常被用

shell函式及其正則表示式

技術標籤：shell 1、shell函式 linux shell 可以使用者定義函式，然後在shell指令碼中可以隨便呼叫.

Java高階進修之正則表示式

技術標籤：Javajava正則表示式正則表示式 1 正則表示式2 正則表示式的符號3 匹配功能4 切割功能5 替換功能6 獲取

JavaScript基礎之正則表示式

技術標籤：Javascriptjavascript 1.概念正則表示式（Regular Expression）是用於描述一組字串特徵的模式，用來匹配特定的字串。通過特殊字元+普通字元來進行模式描述，從而達到文字匹配目的工具。

Leetcode之正則表示式匹配

技術標籤：leetcode和機試題leetcode 題目：請實現一個函式用來匹配包含\'. \'和\'*\'的正則表示式。模式中的字元\'.\'表示任意一個字元，而\'*\'表示它前面的字元可以出現任意次（含0次）。在本題中，匹配是指

Linux/Unix工具與正則表示式的POSIX規範(轉載)

對正則表示式有基本瞭解的讀者，一定不會陌生『\\d』、『[a-z]+』之類的表示式，前者匹配一個數字字元，後者匹配一個以上的小寫英文字母。但是如果你用過vi、grep、awk、sed之類Linux/Unix下的工具或許會發現，這些

python網路爬蟲精解之正則表示式的使用說明

目錄一、常見的匹配規則二、常見的匹配方法1、match（）2、search（）3、findall（）4、sub（）5、compile（）一、常見的匹配規則

Linux Shell指令碼之正則表示式

正則表示式RE

1.什麼是正則表示式？

2.元字元

2.1正則表示式元字元

2.2擴充套件正則表示式元字元

2.3.POSIX字元類

3.正則匹配例項：vim

相關推薦