1. 程式人生 > >[Linux]結合awk列舉大於指定容量大小所有檔案目錄

[Linux]結合awk列舉大於指定容量大小所有檔案目錄

業務背景

/home/pms目錄是工作目錄,現在該目錄佔用硬碟空間過大,需要清理,現在需要列舉該目錄中所有大於200MB的子檔案目錄,以及該子檔案目錄的佔用空間

指令碼實現

du -h --max-depth=10 /home/pms/* | awk '{ if($1 ~ /M/){split($1, arr, "M")}; if(($1 ~ /G/) || ($1 ~ /M/ && arr[1]>200)) {printf "%-10s %s\n", $1, $2} }' | sort -n -r

其中

du -h --max-depth=10 /home/pms/*

結果如下

$ du -h --max-depth=10
/home/pms/* 0 /home/pms/addressCountMap 12K /home/pms/bigDataEngine/conf 1.7M /home/pms/bigDataEngine/analysis/warning 33M /home/pms/bigDataEngine/analysis/log ...

下面這個awk語句,作用是判斷第一個引數,進行字串匹配,如果是M的話,按字元M進行擷取

if($1 ~ /M/){split($1, arr, "M")};

下面這個awk語句,作用是判斷第一個引數,進行字串匹配:

  • M,判斷容量是否大於200MB,是則直接輸出引數1和引數2

  • G,直接輸出引數1和引數2

if(($1 ~ /G/) || ($1 ~ /M/ && arr[1]>200)) {printf "%-10s %s\n", $1, $2}

輸出結果

$ du -h --max-depth=10 /home/pms/* | awk '{ if($1 ~ /M/){split($1, arr, "M")}; if(($1 ~ /G/) || ($1 ~ /M/ && arr[1]>200)) {printf "%-10s %s\n", $1, $2} }' | sort -n -r 
1018M      /home/pms/recsys/algorithm/schedule/project/mixproduct
948M       /home/pms/recsys/algorithm/schedule/project/contentbasedrelatedproduct
940M       /home/pms/recsys/algorithm/schedule/project/view_after_viewing/cf
922M       /home/pms/new_product_import
913M       /home/pms/db_engine
903M       /home/pms/recsys/algorithm/schedule/project/campus
862M       /home/pms/recsys/algorithm/schedule/project/company/user
...