linux常用文字處理命令
sort命令
sort命令的作用:
sort將檔案的每一行作為一個單位,相互比較,比較原則是從首字元向後,依次按ASCII碼值進行比較,最後將他們按升序輸出。
語法格式:
sort [引數] [檔案]
引數說明
-n :按照數值的大小排序
-r :取反的順序排序
-t :指定排序是所用的欄位分隔符
-k :指定某一列來排序
案例
將以下日期以天的大小從大到小進行排序
使用 -t 使用'-'進行分割槽,然後使用-k 發現天數是在第三區,在使用-n與-r引數進行數值從大到小驚醒排序
uniq命令
uniq命令的作用:
uniq命令用於去除文本當中連續重複的行列,如果是多個重複的行列,但是沒有連續uniq命令就刪除不了了
所以我們在使用uniq命令的同時會搭配sort命令一起使用
語法格式:
uniq [引數] [檔案]
引數:
-c或--count :在每列旁邊顯示該行重複出現的次數。
-d或--repeated :只顯示重複出現的行列。
-u或--unique :只顯示沒有重複的行列。
案例
將以下檔案內容中重複的內容去除
如果單純的使用uniq命令刪除重複的內容,我們會發現還是會存在相同內容的行列,
這時候我們就需要搭配sort排序命令來將重複的內容進行排序然後去重了
cut命令
cut命令的作用:
cut命令主要是用來顯示檔案內容中指定的部分
語法格式:
cut [引數] [檔案]
引數說明
-d :自定義分隔符,預設為製表符‘TAB’
-f :顯示指定欄位的內容,需要與-d一起使用
-c :以字元為單位分割,僅顯示字元範圍內的內容
案例1
僅顯示以下第一列的內容
使用cut -c1 1.txt
案例2
將以下學生資訊的成績內容打印出來
我們可以看到該每個內容都有分隔符;所以我們可以使用-d 與-f引數來取出內容
tr命令
tr命令的作用:
tr的英文全稱是“ transform ”,即轉換的意思。該命令的作用是一種可將字元進行替換、壓縮、刪除,他可以將一組字元轉換成另一組字元
語法格式:
tr [引數] [字元1] [字元2] < [檔案]
引數
沒有引數:將字元1替換成字元2
-d :刪除字元1中出現所有字元
案例1
將檔案裡所有的11替換成6
案例2
將檔案裡所有的33刪除
使用 tr -d 命令可以刪除文本里的內容
wc命令
wc命令的作用:
wc命令主要用於統計指定檔案中的位元組數、字數、行數,並將統計結果顯示輸出。
語法格式:
wc [引數] [檔案]
引數
-w :統計指定檔案的字數並顯示 (一個字被定義為由空白、跳格或換行字元分隔的字串)
-l : 統計指定檔案的行數並顯示
-c:統計指定檔案的位元組數並顯示
沒有引數:顯示指定檔案的總統計數
案例
統計1.txt檔案的字數,行數,位元組數