大日誌分割的幾種方法

阿新 • • 發佈：2018-11-26

當日志容量上G的時候，用vi檢視具體內容效率就會變得特別低，這個時候就需要將大日誌進行分割。
為了比較各種分割方法的效果，我選取的測試日誌基本資訊如下：

# ls -lrth test.log
-rw-r--r-- 1 root root 645M 5月  30 20:42 test.log
# wc -l test.log
8856340 test.log
  
   1
   2
   3
   4

1. split方法分割

split命令專門用來將一個大檔案分割成很多個小檔案，我把split命令的選項做一個簡要說明

選項	含義
-b	分割後的文件大小，單位是byte
-C	分割後的文件，單行最大byte數
-d	使用數字作為字尾，同時使用-a length指定字尾長度
-l	分割後文檔的行數

為了儘量保證日誌的可讀性，我們按行分割大日誌檔案，並且指定分割後的檔案的字首和字尾

#字尾是數字，佔兩位，字首是test.log
split -l 1000000 test.log -d -a 2 test.log
#分割之後的結果 

ls -lrth
總用量 1.3G
-rw-r--r-- 1 root root 645M 5月  30 20:42 test.log
-rw-r--r-- 1 root root  73M 5月  30 20:55 test.log00
-rw-r--r-- 1 root root  73M 5月  30 20:55 test.log01
-rw-r--r-- 1 root root  73M 5月  30 20:55 test.log02
-rw-r--r-- 1 root root  73M 5月  30 20:55 test.log03
-rw-r--r-- 1 root root  73M 5月  30 20:55 
 test.log04
-rw-r--r-- 1 root root  73M 5月  30 20:55 test.log05
-rw-r--r-- 1 root root  73M 5月  30 20:55 test.log06
-rw-r--r-- 1 root root  73M 5月  30 20:55 test.log07
-rw-r--r-- 1 root root  64M 5月  30 20:55 test.log08
  
   1
   2
   3
   4
   5
   6
   7
   8
   9
   10
   11
   12
   13
   14
   15

2. dd分割

dd bs=1M count=300 if=test.log of=newlog.1
dd bs=1M count=300 if=test.log of=newlog.2 skip=300
dd bs=1M count=300 if=test.log of=newlog.3 skip=600
  
   1
   2
   3

分割後的效果

ls -lrth
總用量 1.3G
-rw-r--r-- 1 root root 645M 5月  30 20:42 test.log
-rw-r--r-- 1 root root 300M 5月  30 21:07 newlog.1
-rw-r--r-- 1 root root 300M 5月  30 21:07 newlog.2
-rw-r--r-- 1 root root  45M 5月  30 21:07 newlog.3
  
   1
   2
   3
   4
   5
   6

在上面使用的命令中，bs代表資料塊的大小，count表示複製的塊數，if表示輸入檔案，of表示輸出檔案。
這個命令不能一下就把檔案分割到我們想要的狀態，而且很有可能一行日誌被分到兩個檔案中。

3. head+tail分割

用這兩個命令獲取檔案部分內容，然後重定向就能實現檔案分割，但是限制也挺多，只能把檔案分成兩部分，如果檔案特別大，想要達到預期的效果，就要一直分割下去。
head/tail -n $行數 test.log > newlog
因為這兩個命令都比較熟悉，不再多講。

4. sed實現分割

實現原理就是用sed擷取特定行之間的內容，然後進行重定向。

sed -n '1,2000000p' test.log > test.log.1
sed -n '2000001,4000000p' test.log > test.log.2
sed -n '4000001,6000000p' test.log > test.log.3
sed -n '6000001,8000000p' test.log > test.log.4
sed -n '8000001,$p' test.log > test.log.5
  
   1
   2
   3
   4
   5

$表示最後一行，這個如果分割過多，也需要一個迴圈。

5. awk實現分割

實現原理和sed差不多，因為使用awk不多，這裡只舉一個小例子：

awk ‘{if (NR<120000) print $0}’ test.log > a.txt
awk ‘{if (NR>=120000) print $0}’ test.log > b.txt
  
   1
   2

還是split用得舒服。

參考部落格：http://blog.csdn.net/wind0513/article/details/5871293

來源：https://blog.csdn.net/u012949658/article/details/72812236

python找出字典中value最大值的幾種方法

假設定義一字典，m = {"a":3,"e":6,"b":2,"g":7,"f":7,"c":1,"d":5}，在不知道key的情況下如何找出字典中value最大的所有key-value對？下面討論幾種方法。 1）通過m.values()和max()函式第一步，通過max()函式找到字典中的value最

大日誌分割的幾種方法

當日志容量上G的時候，用vi檢視具體內容效率就會變得特別低，這個時候就需要將大日誌進行分割。為了比較各種分割方法的效果，我選取的測試日誌基本資訊如下： # ls -lrth test.log -rw-r--r-- 1 root root 645M 5月 30 20:

對於大日誌分割的幾種方法

對於大日誌分割的幾種方法當日志容量上G的時候，用vi檢視具體內容效率就會變得特別低，這個時候就需要將大日誌進行分割。為了比較各種分割方法的效果，我選取的測試日誌基本資訊如下： # ls -lrth test.log -rw-r--r-- 1 root root 645M 5

查詢資料庫中第二大的記錄的幾種方法

在學習過程中，遇到一個問題，查詢最大的資料時十分容易，使用MAX函式語句即可，但是如何查詢第二大的記錄呢，抱著這個問題我開始查詢資料首先建表語句，我建立了一個employee的表，屬性有id，name和age，其中id為int 自增主鍵，name為char(5)，age為int型，建立及插入資料語句略去首

查詢數據庫中第二大的記錄的幾種方法

大數過程 tmp where eve style desc 如何定義在學習過程中，遇到一個問題，查詢最大的數據時十分容易，使用MAX函數語句即可，但是如何查詢第二大的記錄呢，抱著這個問題我開始查找資料首先建表語句，我建立了一個employee的表，屬性有id，nam

asp.net分割字串的幾種方法

在編寫程式中，經常要用到分割的方法來處理一些字串。這裡總結了幾種常用的分割方法：下面一一介紹一下： 1、最簡單最常用的方法，以一個指定的字元進行的分割 string s="abcdeabcdeabcde"; string[] sArray=s.Split

結構化大資料計算的幾種方法（一）

任何資料都要通過計算來產生價值才有意義，大資料也一樣。結構化大資料的計算能力的高低決定了大資料的實用性。我總結了幾種常見的計算方法：API 、Script、SQL、類SQL。 1、 API：這是指沒有使用JDBC或OD

分割平面的幾種方法

(1) n條直線最多分平面問題題目大致如:n條直線，最多可以把平面分為多少個區域。析:可能你以前就見過這題目，這充其量是一道初中的思考題。但一個型別的題目還是從簡單的入手，

Linux 下清空或刪除大檔案/大量檔案的幾種方法

快速刪除大檔案1. 通過重定向到 Null 來清空檔案內容清空或者讓一個檔案成為空白的最簡單方式，是像下面那樣，通過 shell 重定向 null （不存在的事物）到該檔案：# > access.log2.使用 : 符號使用 : 符號，它是 shell 的一個內建命令，

linux 命令列分割字串的幾種方法

使用xargs echo '[email protected]@33' | xargs -d '@' -n 1 echo | sed '$d' 使用awk echo '[emai

線程同步的幾種方法

並且 word 進行 void 等待輸出結果每次 wait 無法訪問用什麽關鍵字修飾同步方法 ? 用synchronized關鍵字修飾同步方法同步有幾種實現方法,都是什麽?分別是synchronized,wait與notify wait():使一個線程處於等待狀

SQL Server遍歷表的幾種方法

都是遍歷 lec delet -s rop itl 想要 temp 　在數據庫開發過程中，我們經常會碰到要遍歷數據表的情形，一提到遍歷表，我們第一印象可能就想到使用遊標，使用遊標雖然直觀易懂，但是它不符合面向集合操作的原則，而且性能也比面向集合低。當然，從面向集合操作的角

Html中嵌套其他HTML文件的幾種方法（轉）

java mar net rip gin bsp ace wid style 給大家整理了3個方法，一個是HTML的iframe標簽，別兩個是JS引用。比如要在arr.html文件裏引用index.html文件，方法如下。 HTML引用方法： <iframe na

將HTML5封裝成android應用APK文件的幾種方法

android作為下一代的網頁語言，HTML5擁有很多讓人期待已久的新特性。HTML5的優勢之一在於能夠實現跨平臺遊戲編碼移植，現在已經有很多公司在移動設備上使用HTML5技術。隨著HTML5跨平臺支持的不斷增強和智能手機的迅速普，HTML5技術有著非常好的發展前景，甚至有人預言HTML5將引燃移動平臺遊

C#多線程的幾種方法

task start invoke 數組 erl method 並行計算 bsp nbsp 1、Theard2、TheardPool 線程池3、Task 在Theard上做了優化和改進，建議使用 .start();4、Task.Factory.Start(method)

Java中創建數組的幾種方法

java false 三種數組下標 [1] [] 判斷 color str Java中創建數組的幾種方法 public static void main(String[] args) { //創建數組的第一種方法 int[] arr=new int[6]; int

克隆對象的幾種方法

克隆 type sharp class 以及 each pcl 反射 tor 　　克隆對象在開發過程中經常會遇到，有些時候需要淺克隆，有些時候需要深克隆，具體它們之間有什麽區別，以及實現方式有哪些，在這裏總結一下。　　實現深克隆有以下幾種方法。手動代碼如下：

windows系統字體安裝使用的幾種方法

windows ps 字體簡易安裝方法：1、打開系統盤的 windows 下的 fonts 文件夾；2、用另一個窗口打開字體存放的文件夾；3、在存放字體的文件夾中選擇要安裝的字體（部分選或全選均可）；4、用鼠標右鍵將所選字體拖到windows 下的 fonts 文件夾上，松開鼠標，在彈出的提示框上選擇

liunx下獲取網卡地址的幾種方法

liunx下獲取網卡地址的幾種方法CentOS Linux release 7.2.1511 (Core)系統獲取網卡ipifconfig em1|awk ‘NR==2 {print $2}‘ifconfig em1|sed -n ‘2p‘|cut -d ‘ ‘ -f 10ifconfig em1|sed -

(轉)Unity3D中移動物體位置的幾種方法

多種方式移動 2.4 包括簡介調用在外 blank targe 1. 簡介在unity3d中，有多種方式可以改變物體的坐標，實現移動的目的，其本質是每幀修改物體的position。 2. 通過Transform組件移動物體 Transform 組件

大日誌分割的幾種方法

1. split方法分割

2. dd分割

3. head+tail分割

4. sed實現分割

5. awk實現分割

相關推薦