玩轉LINUX之sed命令詳解
sed可依照script的指令,來處理、編輯文本文件。
Sed主要用來自動編輯一個或多個文件;簡化對文件的反復操作;編寫轉換程序等。
執行時,sed會從文件或者標準輸入中讀取一行,將其復制到緩沖區,對文本編輯完成之後,讀取下一行直到所有的文本行都編輯完畢。
所以sed命令處理時只會改變緩沖區中文本的副本,如果想要直接編輯原文件,可以使用-i選項或者將結果重定向到新的文件中。
sed命令的基本語法如下:
# sed [options] commands [inputfile...]
options表示sed命令的一些選項,常見的選項如下表:
-n 取消默認輸出
-e 多點編輯,可以執行多個子命令
-f 從腳本文件中讀取命令(sed操作可以事先寫入腳本,然後通過-f讀取並執行)
-i 直接編輯原文件
-l 指定行的長度
-r 在腳本中使用擴展表達式
應用場景
sed命令比較適用於大的文本文件,用普通文本編輯器難以勝任的情況。下面分別介紹直接打印、插入、刪除、替換等編輯操作。
實驗用文件內容
#===================test1.txt======================
letitia
mail
uuencode
1003605091
01566
(1)行打印,輸出緩沖區內容,使用sed的p子命令
sed ‘1,3 p‘ test1.txt echo "=====================" sed -n ‘1,3 p‘ test1.txt #輸出結果 letitia letitia mail mail uuencode uuencode 1003605091 01566 ===================== letitia mail uuencode
p子命令代表print,可以打印出sed緩沖區內的內容。
sed命令中,直接采用數字代表某個特定的文本行:‘1 p‘代表打印第一行;‘1,3 p‘代表打印1到3行;特別的,最後一行的行號為$。
觀察輸出結果,不使用-n選項時,sed命令把1到3行輸出了兩次。這是因為不使用-n時,sed首先讀取一行,並默認將緩沖區內的文本輸出出來,之後p子命令再次輸出。使用-n時,默認輸出取消,只有p子命令的輸出結果。
sed -n ‘/^ma/,5 p‘ test1.txt
#輸出結果
mail
uuencode
1003605091
01566
sed命令支持正則表達式定位。語法為/re/,re表示正則表達式。
本例表示打印出從匹配正則表達式的地方到第5行,也就是從匹配以ma開頭的文本行處開始。
sed -n ‘1~2 p‘ test1.txt
#輸出結果
letitia
uuencode
01566
1~2表示從第一行開始,行號遞增2輸出,即輸出奇數行。語法格式為first~step。
(2)插入文本行,追加文本行
這兩種情況很類似。插入文本使用i子命令,表示在指定位置前面插入文本;追加文本使用a子命令,表示在指定位置之後插入文本。觀察一下兩個的區別:
sed -n -e ‘2 i insert‘ -e ‘1,4 p‘ test1.txt
#-e選項表示多個子命令,本例執行i子命令之後執行了p子命令
#輸出結果
letitia
insert
mail
uuencode
1003605091
sed -n -e ‘2 a insert‘ -e ‘1,4 p‘ test1.txt
#輸出結果
letitia
mail
insert
uuencode
1003605091
(3)刪除文本行,使用d子命令
sed -n -e ‘2 d‘ -e ‘1,$ p‘ test1.txt
#輸出結果
letitia
uuencode
1003605091
01566
(4)替換文本行,使用c子命令
sed -n -e ‘2 c newmail‘ -e ‘1,$ p‘ test1.txt
#輸出結果
letitia
newmail
uuencode
1003605091
01566
【註】以上均未使用-i選項,所以更改的只是副本。
(5)替換指定文本,使用s子命令
這一個命令實用性很廣,並且靈活。語法也比之上面特別一些:
sed ‘位置參數 s/pattern/replaced/[flag]‘
pattern為要替換的文本,支持正則表達式,replaced表示用來替換的一般字符串(不支持正則表達式)。
flag是替換標誌,用來影響匹配替換的規則:
3. 其他註意事項
以上都是采用了文件輸入做實驗,也可以采用其他方式,例如
sed -i "s/letitia/hello world/g" `grep "letitia" -rl test1.txt`
將grep的結果作為輸入,註意要用反引號括起來,將括號內部分解釋為linux命令。
當用戶的編輯操作比較復雜時,建議使用sed腳本文件。
同正則表達式一樣,匹配元字符時要用轉義。使用基本正則表達式時,{}等也要轉義。
------------------END-------------------------
玩轉LINUX之sed命令詳解