關於“grep”、“awk”的伺服器日誌分析命令

阿新 • • 發佈：2018-12-28

1、檢視有多少IP

awk '{print $1}' log_file|sort|uniq|wc -l

2、檢視某一個頁面被訪問的次數：

grep "/index.php" log_file | wc -l

3、檢視每一個IP訪問了多少個頁面：

awk '{++S[$1]} END {for (a in S) print a,S[a]}' log_file > log.txt

4、將每個IP訪問的頁面數進行從小到大排序：

awk '{++S[$1]} END {for (a in S) print S[a],a}' log_file | sort -n

5、檢視某一個IP訪問了哪些頁面：

grep ^111.111.111.111 log_file| awk '{print $1,$7}'

6、去掉搜尋引擎統計的頁面：

awk '{print $12,$1}' log_file | grep ^\"Mozilla | awk '{print $2}' |sort | uniq | wc -l

7、檢視2015年8月16日14時這一個小時內有多少IP訪問:

awk '{print $4,$1}' log_file | grep 16/Aug/2015:14 | awk '{print $2}'| sort | uniq | wc -l

8、檢視訪問前十個ip地址

awk '{print $1}' |sort|uniq -c|sort -nr |head -10 access_log

uniq -c 相當於分組統計並把統計數放在最前面

cat access.log|awk '{print $1}'|sort|uniq -c|sort -nr|head -10
cat access.log|awk '{counts[$(11)]+=1}; END {for(url in counts) print counts[url], url}

9、訪問次數最多的10個檔案或頁面

cat log_file|awk '{print $11}'|sort|uniq -c|sort -nr | head -10

cat log_file|awk '{print $11}'|sort|uniq -c|sort -nr|head -20

awk '{print $1}' log_file |sort -n -r |uniq -c | sort -n -r | head -20

10、通過子域名訪問次數，依據referer來計算，稍有不準

cat access.log | awk '{print $11}' | sed -e ' s/http:\/\///' -e ' s/\/.*//' | sort | uniq -c | sort -rn | head -20

11、列出傳輸大小最大的幾個檔案

cat www.access.log |awk '($7~/\.php/){print $10 " " $1 " " $4 " " $7}'|sort -nr|head -100

12、列出輸出大於200000byte(約200kb)的頁面以及對應頁面發生次數

cat www.access.log |awk '($10 > 200000 && $7~/\.php/){print $7}'|sort -n|uniq -c|sort -nr|head -100

13、如果日誌最後一列記錄的是頁面檔案傳輸時間，則有列出到客戶端最耗時的頁面

cat www.access.log |awk '($7~/\.php/){print $NF " " $1 " " $4 " " $7}'|sort -nr|head -100

14、列出最最耗時的頁面(超過60秒的)的以及對應頁面發生次數

cat www.access.log |awk '($NF > 60 && $7~/\.php/){print $7}'|sort -n|uniq -c|sort -nr|head -100

15、列出傳輸時間超過 30 秒的檔案

cat www.access.log |awk '($NF > 30){print $7}'|sort -n|uniq -c|sort -nr|head -20

16、列出當前伺服器每一程序執行的數量，倒序排列

ps -ef | awk -F ' ' '{print $8 " " $9}' |sort | uniq -c |sort -nr |head -20

關於“grep”、“awk”的伺服器日誌分析命令

1、檢視有多少IP awk '{print $1}' log_file|sort|uniq|wc -l 2、檢視某一個頁面被訪問的次數： grep "/index.php" log_file | wc -l 3、檢視每一個IP訪問了多少個頁面： awk '{++S[$

nginx日誌分析之 grep、awk、sort、uniq命令使用

nginx日誌分析對於線上業務排錯有很大的幫助，運用合適的命令能夠快速、準確定位出問題。主要涉及awk、sort、uniq這三個命令的使用。 sort 參　　數： -b 忽略每行前面開始出的空格字元。 -c 檢查檔案是否已經按照順序排序。 -d 排序時，處理英文

日誌分析命令awk基礎用法

pri 取出 http 我只修飾符日誌自動文本處理工具 ssi awk awk是一個很好用的文本處理工具，相對於sed常用用作一整行的處理，awk則比較擅長將一行分成數個字段來處理。而在我們性能測試中，可以awk可以幫助我們造數，也可以幫助我們分析日誌。簡單來說

grep、awk、sed命令詳解2

sed -n 10個 \n 命令時間 his jpg acc log grep、awk、sed命令詳解上一篇對grep、awk、sed命令的基本參數做了介紹，這一篇寫一些例子。 1.分析access.log日誌內，當天訪問次數最多的10個頁面，並且按降序排列。 # ca

linux命令小記（grep、awk、sed）

grep grep 標準 egrep 擴充套件grep，支援基本和正則，執行效果與grep -E相似 fgrep 快速grep，允許查詢字串而不是一個模式常用引數 -c 只輸出匹配的行的總數（count） -C 加引數num表示，顯示匹配的行，及其

分析伺服器日誌常用命令

1、檢視有多少個IP訪問：awk '{print $1}' log_file|sort|uniq|wc -l2、檢視某一個頁面被訪問的次數：grep "/index.php" log_file | wc -l3、檢視每一個IP訪問了多少個頁面：awk '{++S[$1]} E

linux命令--查詢與統計（grep、awk、sort、uniq、wc）

在做日誌分析時或者配置分析時，通常會遇到查找出符合某一條件的行，並統計，主要應用的就是grep、awk、sort、uniq、wc五個命令 1. grep命令 grep（global search regular expression(RE) and print out th

sed、grep、awk -- 三劍客筆記記錄

left 操作筆記 str config rep strong 提取文件 awk cat sed常用操作筆記 1.刪除文件最後一行： sed -i ‘$d‘ filename 2.遞歸替換內容：sed -i ‘s/內容A/內容B/g‘ filename　　　　sed -

Linux中的cut、grep、awk、sed

1、grep 可以使用grep 命令可以進行過濾搜尋 aaa.txt 的內容 2018-11-26 hello world! hadoop01 bigdata 192.168.136.138 2018-09-21 2018-09-12 spar

【hadoop】1、MapReduce進行日誌分析，並排序統計結果

1.網上很多關於搭建Hadoop叢集的知識，這裡不多做敘述，並且本機執行Hadoop程式是不需要hdfs叢集的，我們本機執行只做個demo樣式，當真的需要執行大資料的時候，才需要真正的叢集 2.還有就是詞頻統計的知識，不論是官方文件，還是網上的知識，基本都能隨意百度個幾百篇出來但是我找半天，確實是沒有找

【Hadoop】基於Hadoop/Hbase/Hive的小型離線伺服器日誌分析應用

1、專案簡介本專案主要設計一個基於Hadoop的日誌分析系統。其中的日誌資料主要來自於某系統開發測試期間的伺服器訪問日誌資料（Tomcat），通過對這些日誌資料利用正則表示式等技術手段進行處理，提取出匹配到的目標資料資訊，將其進行歸類化處理，而對日誌分

大資料視覺化之Nginx伺服器日誌分析及視覺化展示（Nginx+flume+HDFS+Spark+Highcharts）

專案說明：本專案為一個web程式，能夠利用大資料技術，對nginx伺服器的訪問日誌進行圖形化展示。當訪問此程式時，可以看到nginx日誌中統計出來的全天分時網站點選量等資訊的圖表展示。每條Nginx日誌的平均大小為250位元組左右，假設每天產生1億條訪問日誌

SHELL文字處理三劍客（sed、grep、awk）

一、grep文字過濾器 1. 基本介紹 Global search regular expression and print out theline 全面搜尋研究正則表示式並顯示出來 grep命令是一種強大的文字搜尋工具根據使用者指定的

Oracle Archivelog、檢視及日誌分析

編寫時間：2015年4月16日星期四編寫人：蝸牛 QQ 295013648 說明Archivelog，也就是我們通常所說的歸檔，那什麼是歸檔，歸檔是怎麼產生的，其作用又是什麼，歸檔檔案中到底存在什麼樣的內容，這些都是作為資料庫管理員的我們應該知道，並且能夠應用到工作

Mosquitto伺服器日誌分析總結

Mosquitto是一款實現了訊息推送協議MQTT v3.1的開源訊息代理軟體，提供輕量級的，支援可釋出/可訂閱的的訊息推送模式，使裝置對裝置之間的短訊息通訊變得簡單，比如現在應用廣泛的低功耗感測器，手機、嵌入式計算機、微型控制器等移動裝置。客戶端連線日誌1403334375

Linux三劍客grep、awk和sed

grep，sed 和 awk是Linux/Unix 系統中常用的三個文字處理的命令列工具，稱為文字處理三劍客。本文將簡要介紹這三個命令並給出基本用法。 # 管道在介紹這兩個命令之前，有必要介紹一下Unix/Linux中管道（pipe）的概念。管道將一個命令/程式/程序的輸出傳送到另一個命令/程式/程序，

grep、sed和awk命令的簡單使用

grep、sed和awk命令的簡單使用 grep 命令選項意義-c匹配行的數量-i忽略大小寫-h查詢多文件時不顯示文件名-l只列出匹配的文件名，不列匹配行-n列出匹配行，並列出行號-s不顯示不存在或無匹配的錯誤信息-v顯示不包含匹配文本的所有行-w匹配整詞-r遞歸

Day08_固化命令、grep、sed及awk命令

記錄輸出 print option cnblogs 失敗 ron logs -o 一. 固化命令 shell登陸 /etc/profile /etc/bashrc /root/.bashrc /root/.bash_profile /etc/profile.d

伺服器維護，日誌分析常用命令

一、檢視埠檢視某個名稱的程序狀況： ps -aux|grep tomcat(name)/pid 檢視所有程序及埠的使用情況： netstat apn 檢視某個埠： netstat -anp|grep 8080 二、日誌分析 1) Cat、mor

shell指令碼之正則表示式、函式、grep、sed、awk、printf等基本命令配置詳解

一、正則表示式簡介：正則表示式（或稱Regular Expression，簡稱RE）就是由普通字元（例如字元 a 到 z）以及特殊字元（稱為元字元）組成的文字模式。該模式描述在查詢文字主體時待匹配的一個或多個字串。正則表示式作為一個模板，將某個字元模式與所搜尋的字串進

關於“grep”、“awk”的伺服器日誌分析命令

相關推薦