1. 程式人生 > >Linux 下清空或刪除大檔案/大量檔案的幾種方法

Linux 下清空或刪除大檔案/大量檔案的幾種方法

快速刪除大檔案

1. 通過重定向到 Null 來清空檔案內容清空或者讓一個檔案成為空白的最簡單方式,是像下面那樣,通過 shell 重定向 null (不存在的事物)到該檔案:

# > access.log

2.使用 : 符號

使用 : 符號,它是 shell 的一個內建命令,等同於 true 命令,它可被用來作為一個 no-op(即不進行任何操作)。另一種清空檔案的方法是將 : 或者 true 內建命令的輸出重定向到檔案中,具體如下:

# : > access.log # true > access.log

3.使用 cat/cp/dd 實用工具及 /dev/null 裝置來清空檔案

在 Linux 中, null 裝置基本上被用來丟棄某個程序不再需要的輸出流,或者作為某個輸入流的空白檔案,這些通常可以利用重定向機制來達到,所以 /dev/null 裝置檔案是一個特殊的檔案,它將清空送到它這裡來的所有輸入,而它的輸出則可被視為一個空檔案。另外,你可以通過使用 cat命令 顯示 /dev/null 的內容然後重定向輸出到某個檔案,以此來達到清空該檔案的目的。

# cat /dev/null > access.log

下面,我們將使用 cp命令 複製 /dev/null 的內容到某個檔案來達到清空該檔案的目的,具體如下所示:

# cp /dev/null access.log

而下面的命令中, if 代表輸入檔案,of 代表輸出檔案。

# dd if=/dev/null of=access.log

4. 使用 echo 命令清空檔案

在這裡,你可以使用 echo命令 將空字串的內容重定向到檔案中,具體如下:

# echo "" > access.log 或者 # echo > access.log

注意:你應該記住空字串並不等同於 null 。字串表明它是一個具體的事物,只不過它的內容可能是空的,但 null 則意味著某個事物並不存在。基於這個原因,當你將 echo命令 的輸出作為輸入重定向到檔案後,使用cat命令來檢視該檔案的內容時,你將看到一個空白行(即一個空字串)。要將 null 做為輸出輸入到檔案中,你應該使用 -n 選項,這個選項將告訴 echo 不再像上面的那個命令那樣輸出結尾的那個新行。

# echo -n "" > access.log

5. 使用 truncate 命令來清空檔案內容

truncate 可被用來將一個檔案縮小或者擴充套件到某個給定的大小。你可以利用它和 -s 引數來特別指定檔案的大小。要清空檔案的內容,則在下面的命令中將檔案的大小設定為 0:

# truncate -s 0 access.log

我要介紹的就是這麼多了。在本文中,我們介紹了幾種通過使用一些簡單的命令列工具和 shell 重定向機制來清除或清空檔案內容的方法。

6.使用rsync命令

假如你有一些特別大的檔案要刪除,比如nohup.out這樣的實時更新的檔案,動輒都是幾十個G上百G的,也可以用rsync來清空大檔案,而且效率比較高。

1)建立空檔案

# touch/data/blank.txt

2)用rsync清空檔案

# rsync -a --delete-before --progress --stats /root/blank.txt /root/nohup.out

快速刪除大量檔案

假如你要在linux下刪除大量檔案,比如100萬、1000萬,像/var/spool/clientmqueue/的mail郵件,/usr/local/nginx/proxy_temp的nginx快取等,那麼rm -rf *可能就不好使了。 rsync 可以用來清空目錄或檔案,如下:

1)先建立一個空目錄# mkdir/data/blank

2)用rsync刪除目標目錄

# rsync --delete-before -d /data/blank/ /var/spool/clientmqueue/

這樣目標目錄很快就被清空了

注:其中--delete-before 接收者在傳輸之前進行刪除操作

為什麼rsync能夠快速刪除大檔案?

1rm命令大量呼叫了lstat64和unlink,可以推測刪除每個檔案前都從檔案系統中做過一次lstat操作。過程:正式刪除工作的第一階段,需要通過getdirentries64呼叫,分批讀取目錄(每次大約為4K),在記憶體中建立rm的檔案列表;第二階段,lstat64確定所有檔案的狀態;第三階段,通過unlink執行實際刪除。這三個階段都有比較多的系統呼叫和檔案系統操作。

2rsync所做的系統呼叫很少沒有針對單個檔案做lstat和unlink操作。命令執行前期,rsync開啟了一片共享記憶體,通過mmap方式載入目錄資訊。只做目錄同步,不需要針對單個檔案做unlink。另外,在其他人的評測裡,rm的上下文切換比較多,會造成System CPU佔用較多——對於檔案系統的操作,簡單增加併發數並不總能提升操作速度。 總結:頻繁做減法不如直接從頭來過把檔案系統的目錄與書籍的目錄做類比,rm刪除內容時,將目錄的每一個條目逐個刪除(unlink),需要迴圈重複操作很多次;rsync刪除內容時,建立好新的空目錄,替換掉老目錄,基本沒開銷。

參考:https://blog.csdn.net/liuxiao723846/article/details/51626305