1. 程式人生 > 其它 >sort-uniq-tr-cut命令 對檔案處理相關操作

sort-uniq-tr-cut命令 對檔案處理相關操作

目錄:

一、sort命令

二、uniq命令

三、tr命令

四、cut命令

五、eval命令

一、sort命令

以行為單位對檔案內容進行排序,也可以根據不同的資料型別來排序

語法格式

sort [選項] 引數

cat file | sort 選項

常用選項

-f: 忽略大小寫,會將小寫字母都轉換為大寫字母來進行比較

-b: 忽略每行前面的空格

-n: 按照數字進行排序

-r: 反向排序

-u: 等同於uniq,表示相同的資料僅顯示一行

-t: 指定欄位分隔符,預設使用[Tab]鍵分隔

-k: 指定排序欄位

-o<輸出檔案>: 將排序後的結果轉存至指定檔案
sort -n testfile2 

sort -t ':' -k 3 -n /etc/passwd

du -a | sort -nr -o du.txt

二、uniq命令

用於報告或者忽略檔案中連續的重複行,常與sort命令結合使用

語法格式

uniq [選項] 引數
cat file | uniq 選項

常用選項

-C:  進行計數,並刪除檔案中重複出現的行

-d:  僅顯示連續的重複行

-U:  僅顯示出現一次的行
uniq testfile3 
sort -n testfile3 | unig -C


三、tr命令

常用來對來自標準輸入的字元進行替換、壓縮和刪除

語法格式

tr [選項] [引數]

常用選項

-C: 保留字符集1的字元,其他的字元( 包括換行符\n)用字符集2替換

-d: 刪除所有屬於字符集1的字元

-s: 將重複出現的字串壓縮為一個字串:用字符集2替換字符集1

-t: 字符集2替換字符集1,不加選項同結果

引數:

  • 字符集1:指定要轉換或刪除的原字符集。當執行轉換操作時,必須使用引數“字符集2”指定轉換的目標字符集。但執行刪除操作時,不需要引數“字符集2”
  • 字符集2:指定要轉換成的目標字符集
echo "abc" | tr 'a-z' 'A-Z'
echo -e "abc\ncabcdab" | tr -c "ab\n" "0"
echo -e " abc\ncabcdab"| tr -c "ab" "O"
echo 'hello world' | tr -d 'od'
echo "thissss is a text linnnnnnne." | tr -s 'sn'

刪除空行

echo -e "aa\n\n\n\n\nbb" | tr -s "\n"
cat testfile5 | tr -s "\n"

把路徑變數中的冒號 “:”,替換成換行符 “\n”

echo $PATH | tr -s ":" "\n"
echo -e "aa\n\n\n\n\nbb" | tr -s "\n" ":"

1 echo ${array[*]} | tr ' ' '\n'| sort-n > file
2 
3 a=0
4 for i in $(cat file)
5 do
6 array[$a]=$i
7 let a++
8 #array+=($i)
9 done

四、cut 命令

顯示行中的指定部分,刪除檔案中指定欄位

語法格式

cut 選項 引數
cat file | cut 選項

常用選項

-f: 通過指定哪一個欄位進行提取。cut命令使用“TAB"作為預設的欄位分隔符

-d: “TAB”是預設的分隔符,使用此選項可以更改為其他的分隔符

--complement :此選項用於排除所指定的欄位

--output-delimiter :更改輸出內容的分隔符

五、eval命令

前加上eval時,shell就會在執行命令之前掃描它兩次。eval命令將首先會先掃描命令列進行所有的置換,然後再執行該命令。該命令適用於那些一次掃描無法實現其功能的變數。該命令對變數進行兩次掃描。