linux運維故障定位彙總
linux 運維常用shell命令
export LANG=zh_CN.UTF8
export LANG=zh_CN.GB18030
source /etc/profile
讓Linux在終端支援中文顯示
dmidecode -t processor | grep Socket (物理cpu個數)
dmidecode | grep Size | grep MB | awk '{a+=$2}END{print a}' (實體記憶體大小MB)
dmidecode | grep Size | grep MB | wc -l (實體記憶體個數)
ps -eo pid,lstart,etime | grep 26871 (程序執行時間)
26871 Thu Sep 26 17:08:55 2013 00:19
iotop -o (檢視那個程序最磨磁碟)
lsof -p 10412 (檢視程序開啟的檔案10412是PID)
dstat -acdgilmnprstTfy (檢視網絡卡流量)
1.刪除0位元組檔案
find -type f -size 0 -exec rm -rf {} \;
2.檢視程序
按記憶體從大到小排列
ps -e -o "%C : %p : %z : %a"|sort -k5 -nr
3.按cpu利用率從大到小排列
ps -e -o "%C : %p : %z : %a"|sort -nr
4.列印說cache裡的URL
grep -r -a jpg /data/cache/* | strings | grep "http:" | awk -F'http:' '{print "http:"$2;}'
5.檢視http的併發請求數及其TCP連線狀態:
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'
6. sed -i '/Root/s/no/yes/' /etc/ssh/sshd_config (sed在這個文裡Root的一行,匹配Root一行,將no替換成yes.)
7..如何殺掉mysql程序:
ps aux |grep mysql |grep -v grep |awk '{print $2}' |xargs kill -9 (從中瞭解到awk的用途)
killall -TERM mysqld
kill -9 `cat /usr/local/apache2/logs/httpd.pid` 試試查殺程序PID
8.顯示執行3級別開啟的服務:
ls /etc/rc3.d/S* |cut -c 15- (從中瞭解到cut的用途,擷取資料)
9.如何在編寫SHELL顯示多個資訊,用EOF
cat << EOF
+--------------------------------------------------------------+
| === Welcome to Tunoff services === |
+--------------------------------------------------------------+
EOF
10. for 的巧用(如給mysql建軟連結)
cd /usr/local/mysql/bin
for i in *
do ln /usr/local/mysql/bin/$i /usr/bin/$i
done
11. 取IP地址:
ifconfig eth0 |grep "inet addr:" |awk '{print $2}'|cut -c 6- 或者
ifconfig | grep 'inet addr:'| grep -v '127.0.0.1' | cut -d: -f2 | awk '{ print $1}'
12.記憶體的大小:
free -m |grep "Mem" | awk '{print $2}'
13. 檢視80埠的連線數
netstat -an -t | grep ":80" | grep ESTABLISHED | awk '{printf "%s %s\n",$5,$6}' | sort
14 .檢視Apache的併發請求數及其TCP連線狀態:
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'
15.因為同事要統計一下伺服器下面所有的jpg的檔案的大小,寫了個shell給他來統計.原來用xargs實現,但他一次處理一部分,搞的有多個總和....,下面的命令就能解決啦.
find / -name *.jpg -exec wc -c {} \;|awk '{print $1}'|awk '{a+=$1}END{print a}'
CPU的數量(多核算多個CPU,cat /proc/cpuinfo |grep -c processor)越多,系統負載越低,每秒能處理的請求數也越多。
---------------------------------------------------------------------------------------
16 CPU負載 # cat /proc/loadavg
檢查前三個輸出值是否超過了系統邏輯CPU的4倍。
18 CPU負載 #mpstat 1 1
檢查%idle是否過低(比如小於5%)
19 記憶體空間 # free
檢查free值是否過低 也可以用 # cat /proc/meminfo
20 swap空間 # free
檢查swap used值是否過高 如果swap used值過高,進一步檢查swap動作是否頻繁:
# vmstat 1 5
觀察si和so值是否較大
21 磁碟空間 # df -h
檢查是否有分割槽使用率(Use%)過高(比如超過90%) 如發現某個分割槽空間接近用盡,可以進入該分割槽的掛載點,用以下命令找出佔用空間最多的檔案或目錄:
# du -cks * | sort -rn | head -n 10
22 磁碟I/O負載 # iostat -x 1 2
檢查I/O使用率(%util)是否超過100%
23 網路負載 # sar -n DEV
檢查網路流量(rxbyt/s, txbyt/s)是否過高
24 網路錯誤 # netstat -i
檢查是否有網路錯誤(drop fifo colls carrier) 也可以用命令:# cat /proc/net/dev
25 網路連線數目 # netstat -an | grep -E "^(tcp)" | cut -c 68- | sort | uniq -c | sort -n
26 程序總數 # ps aux | wc -l
檢查程序個數是否正常 (比如超過250)
27 可執行程序數目 # vmwtat 1 5
列給出的是可執行程序的數目,檢查其是否超過系統邏輯CPU的4倍
28 程序 # top -id 1
觀察是否有異常程序出現
29 網路狀態 檢查DNS, 閘道器等是否可以正常連通
30 使用者 # who | wc -l
檢查登入使用者是否過多 (比如超過50個) 也可以用命令:# uptime
31 系統日誌 # cat /var/log/rflogview/*errors
檢查是否有異常錯誤記錄 也可以搜尋一些異常關鍵字,例如:
# grep -i error /var/log/messages
# grep -i fail /var/log/messages
32 核心日誌 # dmesg
檢查是否有異常錯誤記錄
33 系統時間 # date
檢查系統時間是否正確
34 開啟檔案數目 # lsof | wc -l
檢查開啟檔案總數是否過多
35 日誌 # logwatch –print 配置/etc/log.d/logwatch.conf,將 Mailto 設定為自己的email 地址,啟動mail服務 (sendmail或者postfix),這樣就可以每天收到日誌報告了。
預設logwatch只報告昨天的日誌,可以用# logwatch –print –range all 獲得所有的日誌分析結果。
可以用# logwatch –print –detail high 獲得更具體的日誌分析結果(而不僅僅是出錯日誌)。
36.殺掉80埠相關的程序
lsof -i :80|grep -v "PID"|awk '{print "kill -9",$2}'|sh
37.清除僵死程序。
ps -eal | awk '{ if ($2 == "Z") {print $4}}' | kill -9
38.tcpdump 抓包 ,用來防止80埠被人攻擊時可以分析資料
# tcpdump -c 10000 -i eth0 -n dst port 80 > /root/pkts
39.然後檢查IP的重複數 並從小到大排序 注意 "-t\ +0" 中間是兩個空格
# less pkts | awk {'printf $3"\n"'} | cut -d. -f 1-4 | sort | uniq -c | awk {'printf $1" "$2"\n"'} | sort -n -t\ +0
40.檢視有多少個活動的php-cgi程序
netstat -anp | grep php-cgi | grep ^tcp | wc -l
chkconfig --list | awk '{if ($5=="3:on") print $1}'
41,列出最常用的十條命令
history | awk '{a[$4]++}END{for(i in a){print a[$i] " " i}}' | sort -rn | head
42,批量重新命名
find . -type f -name '*.a' |sed 's/^\(.*\)\.a$/mv & \1.b/'|sh
for i in *.a;do mv $i `echo $i | sed 's#a#b#g'`;done
for file in *.gz;do mv $file `basename $file .gz`.zip;done
43,快速備份檔案
mv aaa.a{,.bak}
44,指令碼修改密碼的方法
echo -e "password\npassword" |passwd username#!/bin/bash
useradd aaa
u()
{
passwd aaa
}
u <<eof
12345678
12345678
eof
echo 12345678 >>a.pass
echo 12345678 >>a.pass
u < a.pass
45,查詢伺服器型號/序列號
dmidecode | grep -A 4 "System Information" | sed -n '3p;$p'
46,刪除空目錄
find . -type d -empty | xargs rm -rf
47,找出當前目錄下2K以上的檔案移到/tmp目錄
find . -type f -size +2k|xargs -i mv {} /tmp
48,netstat命令只顯示80埠
netstat -ntpl|grep ":80[[:space:]]"
49,遞迴建目錄
mkdir -p {0..255}/{0..255}
50,shell求1到100和的問題
seq 1 100 | awk '{sum+=$0}END{print sum}'
51,awk匹配範圍時可以條件選擇
awk '/start1/||/start2/,/end/' file
52,我想往每個資料夾裡複製同一個檔案有什麼好方法嗎?
find dir -type d -mindepth 1 | xargs -i echo "cp a" {} | sh
53,檢視程序,按記憶體從大到小排列?
ps -e -o "%C : %p : %z : %a"|sort -k5 -nr
54,檢視程序,按cpu利用率從大到小排列?
ps -e -o "%C : %p : %z : %a"|sort -nr
55,檢視http的併發請求數及其TCP連線狀態
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'
56,如何殺掉mysql程序?
ps aux|grep mysql|grep -v grep|awk '{print $2}'|xargs kill -9
57,for 的巧用(如給mysql建軟連結)
cd /usr/local/mysql/bin
for i in *
do ln /usr/local/mysql/bin/$i /usr/bin/$i
done
58,取IP地址
ifconfig eth0 |grep "inet addr:" |awk '{print $2}'|cut -c 6-
或者:
ifconfig | grep 'inet addr:'| grep -v '127.0.0.1' | cut -d: -f2 | awk '{ print $1}'
59,檢視Apache的併發請求數及其TCP連線狀態
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'
60,殺掉80埠相關的程序
lsof -i :80|grep -v "PID"|awk '{print "kill -9",$2}'
61,清除僵死程序
ps -eal | awk '{ if ($2 == "Z") {print $4}}' | kill -9
62,將整列合併成兩行
cat test
192.168.110.171
00:1F:D0:D4:DD:47
192.168.110.172
00:1D:7D:D6:E3:2E
192.168.110.174
00:1F:D0:D4:DD:38
192.168.110.177
00:1D:7D:4C:73:DF
xargs -n 2 < test
sed 'N;s/\n/ /' test
192.168.110.171 00:1F:D0:D4:DD:47
192.168.110.172 00:1D:7D:D6:E3:2E
192.168.110.174 00:1F:D0:D4:DD:38
192.168.110.177 00:1D:7D:4C:73:DF
63,shell 語句記錄,列印時間 每隔10秒
awk 'BEGIN{for(i=0;i<=36000;i+=10) printf "%02d:%02d:%02d\n",i/3600+8,i/60%60,i%60}'
64, 查詢一個目錄下的檔案個數 (包括字目錄)
find . -type f -printf %h"\n"|sort|uniq -c
65,查詢一個程序已經運行了多長時間
ps -eo comm,etime | grep syslogd | awk '{print $2}'
66,將數字1234567890 從後往前每隔3位 加一個逗號
echo 1234567890|rev|sed 's/.\{3\}/&,/g'|rev|sed -r 's/^,//'
echo 1234567890|sed -r 's/[0-9]{3}$/,&/;:a;s/([0-9]+)([0-9]{3}),/\1,\2,/;ta'
echo "1234567890" |perl -pe "s/(?<=\d)(?=(?:\d\d\d)+$)/,/g"
67,將lettet文字的 每個英語單詞 首字母變成大寫
echo "aaaaaaaa">>letter
sed 's/\<[a-z]/\U&/g' letter
68,如何在編寫SHELL顯示多個資訊,用
cat << EOF
+--------------------------------------------------------------+
| === Welcome to Tunoff services === |
+--------------------------------------------------------------+
EOF
69,使檔案中前2列和後3列完全一樣的行只保留1行(任取一行保留)
aa b test asfa??fff dd
test2
test3
aa b test4 hjks fff dd
aa b test5 hjks fff dd
變成
aa b test asfa??fff dd
test2
test3
cat file | sort | awk ‘!($1$2 in a){a[$1$2];print}’
70,恢復MYSQL密碼!
(1)、關閉Mysql: 如果 MySQL 正在執行,首先殺之 killall -TERM mysqld
(2)、另外的方法啟動 MySQL :/usr/local/mysql/bin/mysqld_safe --skip-grant-tables & mysql -u root -p
(3)、可以不需要密碼就進入 MySQL 了。
然後就是 #mysql
>use mysql
>update user set password=password("Sailor#[email protected]@") where user="root";
>flush privileges;
74、重新殺 MySQL ,用正常方法啟動 MySQL
75:去除linux文字中#和空行的命令
1.cat /etc/1.txt | grep -Ev (^#|^$)
2.cat /etc/1.txt | grep -v ^# | grep -v ^$
75.顯示消耗記憶體/CPU最多的10個程序
ps aux | sort -nk +4 | tail
ps aux | sort -nk +3 | tail
——————————————————————————————————————————
76.檢視Apache的併發請求數及其TCP連線狀態
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'
——————————————————————————————————————————
77.找出自己最常用的10條命令及使用次數(或求訪問最多的ip數)
sed -e 's/| /\n/g' ~/.bash_history |cut -d ' ' -f 1 | sort | uniq -c | sort -nr | head
——————————————————————————————————————————
78.日誌中第10個欄位表示連線時間,求平均連線時間
cat access_log |grep “connect cbp” |awk ‘BEGIN{sum=0;count=0;}{sum+=$10;count++;}END{printf(“sum=%d,count=%d,avg=%f\n”,sum,count,
sum/count)}’
——————————————————————————————————————————
78.lsof命令
lsof abc.txt 顯示開啟檔案abc.txt的程序
lsof -i :22 知道22埠現在執行什麼程式
lsof -c abc 顯示abc程序現在開啟的檔案
lsof -p 12 看程序號為12的程序打開了哪些檔案
——————————————————————————————————————————
79.殺掉一個程式的所有程序