1. 程式人生 > 實用技巧 >Shell工具 cut sed awk sort

Shell工具 cut sed awk sort

cut

cut的工作就是“剪”,具體的說就是在檔案中負責剪下資料用的。cut 命令從檔案的每一行剪下位元組、字元和欄位並將這些位元組、字元和欄位輸出。

1.基本用法
cut [選項引數]  filename
說明:預設分隔符是製表符
2.選項引數說明
-f    列號,提取第幾列
-d    分隔符,按照指定分隔符分割列
-c    指定具體的字元
3.案例實操
(0)資料準備
[atguigu@hadoop101 datas]$ touch cut.txt
[atguigu@hadoop101 datas]$ vim cut.txt
dong shen
guan zhen
wo  wo
lai  lai
le  le
(
1)切割cut.txt第一列 [atguigu@hadoop101 datas]$ cut -d " " -f 1 cut.txt dong guan wo lai le (2)切割cut.txt第二、三列 [atguigu@hadoop101 datas]$ cut -d " " -f 2,3 cut.txt shen zhen wo lai le (3)在cut.txt檔案中切割出guan [atguigu@hadoop101 datas]$ cat cut.txt | grep "guan" | cut -d " " -f 1 guan (4)選取系統PATH變數值,第2個“:”開始後的所有路徑: [atguigu@hadoop101 datas]$ echo $PATH
/usr/lib64/qt-3.3/bin:/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/home/atguigu/bin [atguigu@hadoop102 datas]$ echo $PATH | cut -d: -f 2- /usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/home/atguigu/bin (5)切割ifconfig 後列印的IP地址 [atguigu@hadoop101 datas]$ ifconfig eth0 | grep "inet addr" | cut -d: -f 2 | cut -d"
" -f1 192.168.1.102

sed

sed是一種流編輯器,它一次處理一行內容。處理時,把當前處理的行儲存在臨時緩衝區中,稱為“模式空間”,接著用sed命令處理緩衝區中的內容,處理完成後,把緩衝區的內容送往螢幕。接著處理下一行,這樣不斷重複,直到檔案末尾。檔案內容並沒有改變,除非你使用重定向儲存輸出。

1.基本用法
sed [選項引數]  ‘command’  filename

2.選項引數說明
-e    直接在指令列模式上進行sed的動作編輯。
-i    直接編輯檔案

3.命令功能描述

a     新增,a的後面可以接字串,在下一行出現
d    刪除
s    查詢並替換 

4.案例實操
(0)資料準備
[atguigu@hadoop102 datas]$ touch sed.txt
[atguigu@hadoop102 datas]$ vim sed.txt
dong shen
guan zhen
wo  wo
lai  lai

le  le
(1)將“mei nv”這個單詞插入到sed.txt第二行下,列印。
[atguigu@hadoop102 datas]$ sed '2a mei nv' sed.txt 
dong shen
guan zhen
mei nv
wo  wo
lai  lai

le  le
[atguigu@hadoop102 datas]$ cat sed.txt 
dong shen
guan zhen
wo  wo
lai  lai

le  le
注意:檔案並沒有改變
(2)刪除sed.txt檔案所有包含wo的行
[atguigu@hadoop102 datas]$ sed '/wo/d' sed.txt
dong shen
guan zhen
lai  lai

le  le
(3)將sed.txt檔案中wo替換為ni
[atguigu@hadoop102 datas]$ sed 's/wo/ni/g' sed.txt 
dong shen
guan zhen
ni  ni
lai  lai

le  le
注意:‘g’表示global,全部替換
(4)將sed.txt檔案中的第二行刪除並將wo替換為ni
[atguigu@hadoop102 datas]$ sed -e '2d' -e 's/wo/ni/g' sed.txt 
dong shen
ni  ni
lai  lai

le  le

awk

一個強大的文字分析工具,把檔案逐行的讀入,以空格為預設分隔符將每行切片,切開的部分再進行分析處理。

1.基本用法
awk [選項引數] ‘pattern1{action1}  pattern2{action2}...’ filename
pattern:表示AWK在資料中查詢的內容,就是匹配模式
action:在找到匹配內容時所執行的一系列命令

2.選項引數說明
-F    指定輸入檔案折分隔符
-v    賦值一個使用者定義變數

3.案例實操
(0)資料準備
[atguigu@hadoop102 datas]$ sudo cp /etc/passwd ./1)搜尋passwd檔案以root關鍵字開頭的所有行,並輸出該行的第7列。
[atguigu@hadoop102 datas]$ awk -F: '/^root/{print $7}' passwd 
/bin/bash
(2)搜尋passwd檔案以root關鍵字開頭的所有行,並輸出該行的第1列和第7列,中間以“,”號分割。
[atguigu@hadoop102 datas]$ awk -F: '/^root/{print $1","$7}' passwd 
root,/bin/bash
注意:只有匹配了pattern的行才會執行action
(3)只顯示/etc/passwd的第一列和第七列,以逗號分割,且在所有行前面新增列名user,shell在最後一行新增"dahaige,/bin/zuishuai"。
[atguigu@hadoop102 datas]$ awk -F : 'BEGIN{print "user, shell"} {print $1","$7} END{print "dahaige,/bin/zuishuai"}' passwd
user, shell
root,/bin/bash
bin,/sbin/nologin
。。。
atguigu,/bin/bash
dahaige,/bin/zuishuai
注意:BEGIN 在所有資料讀取行之前執行;END 在所有資料執行之後執行。
(4)將passwd檔案中的使用者id增加數值1並輸出
[atguigu@hadoop102 datas]$ awk -v i=1 -F: '{print $3+i}' passwd
1
2
3
4

4.awk的內建變數
FILENAME    檔名
NR    已讀的記錄數
NF    瀏覽記錄的域的個數(切割後,列的個數)

5.案例實操
(1)統計passwd檔名,每行的行號,每行的列數
[atguigu@hadoop102 datas]$ awk -F: '{print "filename:"  FILENAME ", linenumber:" NR  ",columns:" NF}' passwd 
filename:passwd, linenumber:1,columns:7
filename:passwd, linenumber:2,columns:7
filename:passwd, linenumber:3,columns:72)切割IP
[atguigu@hadoop102 datas]$ ifconfig eth0 | grep "inet addr" | awk -F: '{print $2}' | awk -F " " '{print $1}' 
192.168.1.1023)查詢sed.txt中空行所在的行號
[atguigu@hadoop102 datas]$ awk '/^$/{print NR}' sed.txt 
5

sort

sort命令是在Linux裡非常有用,它將檔案進行排序,並將排序結果標準輸出。

1.基本語法
sort(選項)(引數)
-n    依照數值的大小排序
-r    以相反的順序來排序
-t    設定排序時所用的分隔字元
-k    指定需要排序的列
引數:指定待排序的檔案列表

2. 案例實操
(0)資料準備
[atguigu@hadoop102 datas]$ touch sort.sh
[atguigu@hadoop102 datas]$ vim sort.sh 
bb:40:5.4
bd:20:4.2
xz:50:2.3
cls:10:3.5
ss:30:1.61)按照“:”分割後的第三列倒序排序。
[atguigu@hadoop102 datas]$ sort -t : -nrk 3  sort.sh 
bb:40:5.4
bd:20:4.2
cls:10:3.5
xz:50:2.3
ss:30:1.6

練習

問題1:使用Linux命令查詢file1中空行所在的行號
答案:

[root@hadoop102 datas]$ awk '/^$/{print NR}' sed.txt 
5

問題2:有檔案chengji.txt內容如下:
張三 40
李四 50
王五 60
使用Linux命令計算第二列的和並輸出

[atguigu@hadoop102 datas]$ cat chengji.txt | awk -F " " '{sum+=$2} END{print sum}'
150

問題1:Shell腳本里如何檢查一個檔案是否存在?如果不存在該如何處理?

#!/bin/bash

if [ -f file.txt ]; then
   echo "檔案存在!"
else
   echo "檔案不存在!"
fi

問題1:用shell寫一個指令碼,對文字中無序的一列數字排序

[root@CentOS6-2 ~]# cat test.txt
9
8
7
6
5
4
3
2
10
1
[root@CentOS6-2 ~]# sort -n test.txt|awk '{a+=$0;print $0}END{print "SUM="a}'
1
2
3
4
5
6
7
8
9
10
SUM=55

問題1:請用shell指令碼寫出查詢當前資料夾(/home)下所有的文字檔案內容中包含有字元”shen”的檔名稱

[root@hadoop102 datas]$ grep -r "shen" /home | cut -d ":" -f 1
/home/atguigu/datas/sed.txt
/home/atguigu/datas/cut.txt