1. 程式人生 > >linux運維故障定位彙總

linux運維故障定位彙總

linux 運維常用shell命令

export LANG=zh_CN.UTF8

export LANG=zh_CN.GB18030

source /etc/profile

讓Linux在終端支援中文顯示

dmidecode -t processor | grep Socket (物理cpu個數)

dmidecode | grep Size | grep MB | awk '{a+=$2}END{print a}' (實體記憶體大小MB)

dmidecode | grep Size | grep MB | wc -l (實體記憶體個數)

ps -eo pid,lstart,etime | grep 26871 (程序執行時間)

26871 Thu Sep 26 17:08:55 2013 00:19

iotop -o (檢視那個程序最磨磁碟)

lsof -p 10412 (檢視程序開啟的檔案10412是PID)

dstat -acdgilmnprstTfy (檢視網絡卡流量)

1.刪除0位元組檔案

find -type f -size 0 -exec rm -rf {} \;

2.檢視程序

按記憶體從大到小排列

ps -e -o "%C : %p : %z : %a"|sort -k5 -nr

3.按cpu利用率從大到小排列

ps -e -o "%C : %p : %z : %a"|sort -nr

4.列印說cache裡的URL

grep -r -a jpg /data/cache/* | strings | grep "http:" | awk -F'http:' '{print "http:"$2;}'

5.檢視http的併發請求數及其TCP連線狀態:

netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'

6. sed -i '/Root/s/no/yes/' /etc/ssh/sshd_config (sed在這個文裡Root的一行,匹配Root一行,將no替換成yes.)

7..如何殺掉mysql程序:

ps aux |grep mysql |grep -v grep |awk '{print $2}' |xargs kill -9 (從中瞭解到awk的用途)

killall -TERM mysqld

kill -9 `cat /usr/local/apache2/logs/httpd.pid` 試試查殺程序PID

8.顯示執行3級別開啟的服務:

ls /etc/rc3.d/S* |cut -c 15- (從中瞭解到cut的用途,擷取資料)

9.如何在編寫SHELL顯示多個資訊,用EOF

cat << EOF

+--------------------------------------------------------------+

| === Welcome to Tunoff services === |

+--------------------------------------------------------------+

EOF

10. for 的巧用(如給mysql建軟連結)

cd /usr/local/mysql/bin

for i in *

do ln /usr/local/mysql/bin/$i /usr/bin/$i

done

11. 取IP地址:

ifconfig eth0 |grep "inet addr:" |awk '{print $2}'|cut -c 6- 或者

ifconfig | grep 'inet addr:'| grep -v '127.0.0.1' | cut -d: -f2 | awk '{ print $1}'

12.記憶體的大小:

free -m |grep "Mem" | awk '{print $2}'

13. 檢視80埠的連線數

netstat -an -t | grep ":80" | grep ESTABLISHED | awk '{printf "%s %s\n",$5,$6}' | sort

14 .檢視Apache的併發請求數及其TCP連線狀態:

netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'

15.因為同事要統計一下伺服器下面所有的jpg的檔案的大小,寫了個shell給他來統計.原來用xargs實現,但他一次處理一部分,搞的有多個總和....,下面的命令就能解決啦.

find / -name *.jpg -exec wc -c {} \;|awk '{print $1}'|awk '{a+=$1}END{print a}'

CPU的數量(多核算多個CPU,cat /proc/cpuinfo |grep -c processor)越多,系統負載越低,每秒能處理的請求數也越多。

---------------------------------------------------------------------------------------

16 CPU負載 # cat /proc/loadavg

檢查前三個輸出值是否超過了系統邏輯CPU的4倍。

18 CPU負載 #mpstat 1 1

檢查%idle是否過低(比如小於5%)

19 記憶體空間 # free

檢查free值是否過低 也可以用 # cat /proc/meminfo

20 swap空間 # free

檢查swap used值是否過高 如果swap used值過高,進一步檢查swap動作是否頻繁:

# vmstat 1 5

觀察si和so值是否較大

21 磁碟空間 # df -h

檢查是否有分割槽使用率(Use%)過高(比如超過90%) 如發現某個分割槽空間接近用盡,可以進入該分割槽的掛載點,用以下命令找出佔用空間最多的檔案或目錄:

# du -cks * | sort -rn | head -n 10

22 磁碟I/O負載 # iostat -x 1 2

檢查I/O使用率(%util)是否超過100%

23 網路負載 # sar -n DEV

檢查網路流量(rxbyt/s, txbyt/s)是否過高

24 網路錯誤 # netstat -i

檢查是否有網路錯誤(drop fifo colls carrier) 也可以用命令:# cat /proc/net/dev

25 網路連線數目 # netstat -an | grep -E "^(tcp)" | cut -c 68- | sort | uniq -c | sort -n

26 程序總數 # ps aux | wc -l

檢查程序個數是否正常 (比如超過250)

27 可執行程序數目 # vmwtat 1 5

列給出的是可執行程序的數目,檢查其是否超過系統邏輯CPU的4倍

28 程序 # top -id 1

觀察是否有異常程序出現

29 網路狀態 檢查DNS, 閘道器等是否可以正常連通

30 使用者 # who | wc -l

檢查登入使用者是否過多 (比如超過50個) 也可以用命令:# uptime

31 系統日誌 # cat /var/log/rflogview/*errors

檢查是否有異常錯誤記錄 也可以搜尋一些異常關鍵字,例如:

# grep -i error /var/log/messages

# grep -i fail /var/log/messages

32 核心日誌 # dmesg

檢查是否有異常錯誤記錄

33 系統時間 # date

檢查系統時間是否正確

34 開啟檔案數目 # lsof | wc -l

檢查開啟檔案總數是否過多

35 日誌 # logwatch –print 配置/etc/log.d/logwatch.conf,將 Mailto 設定為自己的email 地址,啟動mail服務 (sendmail或者postfix),這樣就可以每天收到日誌報告了。

預設logwatch只報告昨天的日誌,可以用# logwatch –print –range all 獲得所有的日誌分析結果。

可以用# logwatch –print –detail high 獲得更具體的日誌分析結果(而不僅僅是出錯日誌)。

36.殺掉80埠相關的程序

lsof -i :80|grep -v "PID"|awk '{print "kill -9",$2}'|sh

37.清除僵死程序。

ps -eal | awk '{ if ($2 == "Z") {print $4}}' | kill -9

38.tcpdump 抓包 ,用來防止80埠被人攻擊時可以分析資料

# tcpdump -c 10000 -i eth0 -n dst port 80 > /root/pkts

39.然後檢查IP的重複數 並從小到大排序 注意 "-t\ +0" 中間是兩個空格

# less pkts | awk {'printf $3"\n"'} | cut -d. -f 1-4 | sort | uniq -c | awk {'printf $1" "$2"\n"'} | sort -n -t\ +0

40.檢視有多少個活動的php-cgi程序

netstat -anp | grep php-cgi | grep ^tcp | wc -l

chkconfig --list | awk '{if ($5=="3:on") print $1}'

41,列出最常用的十條命令

history | awk '{a[$4]++}END{for(i in a){print a[$i] &quot; &quot; i}}' | sort -rn | head

42,批量重新命名

find . -type f -name '*.a' |sed 's/^\(.*\)\.a$/mv &amp; \1.b/'|sh

for i in *.a;do mv $i `echo $i | sed 's#a#b#g'`;done

for file in *.gz;do mv $file `basename $file .gz`.zip;done

43,快速備份檔案

mv aaa.a{,.bak}

44,指令碼修改密碼的方法

echo -e "password\npassword" |passwd username#!/bin/bash

useradd aaa

u()

{

passwd aaa

}

u <<eof

12345678

12345678

eof

echo 12345678 >>a.pass

echo 12345678 >>a.pass

u < a.pass

45,查詢伺服器型號/序列號

dmidecode | grep -A 4 "System Information" | sed -n '3p;$p'

46,刪除空目錄

find . -type d -empty | xargs rm -rf

47,找出當前目錄下2K以上的檔案移到/tmp目錄

find . -type f -size +2k|xargs -i mv {} /tmp

48,netstat命令只顯示80埠

netstat -ntpl|grep ":80[[:space:]]"

49,遞迴建目錄

mkdir -p {0..255}/{0..255}

50,shell求1到100和的問題

seq 1 100 | awk '{sum+=$0}END{print sum}'

51,awk匹配範圍時可以條件選擇

awk '/start1/||/start2/,/end/' file

52,我想往每個資料夾裡複製同一個檔案有什麼好方法嗎?

find dir -type d -mindepth 1 | xargs -i echo "cp a" {} | sh

53,檢視程序,按記憶體從大到小排列?

ps -e -o "%C : %p : %z : %a"|sort -k5 -nr

54,檢視程序,按cpu利用率從大到小排列?

ps -e -o "%C : %p : %z : %a"|sort -nr

55,檢視http的併發請求數及其TCP連線狀態

netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'

56,如何殺掉mysql程序?

ps aux|grep mysql|grep -v grep|awk '{print $2}'|xargs kill -9

57,for 的巧用(如給mysql建軟連結)

cd /usr/local/mysql/bin

for i in *

do ln /usr/local/mysql/bin/$i /usr/bin/$i

done

58,取IP地址

ifconfig eth0 |grep "inet addr:" |awk '{print $2}'|cut -c 6-

或者:

ifconfig | grep 'inet addr:'| grep -v '127.0.0.1' | cut -d: -f2 | awk '{ print $1}'

59,檢視Apache的併發請求數及其TCP連線狀態

netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'

60,殺掉80埠相關的程序

lsof -i :80|grep -v "PID"|awk '{print "kill -9",$2}'

61,清除僵死程序

ps -eal | awk '{ if ($2 == "Z") {print $4}}' | kill -9

62,將整列合併成兩行

cat test

192.168.110.171

00:1F:D0:D4:DD:47

192.168.110.172

00:1D:7D:D6:E3:2E

192.168.110.174

00:1F:D0:D4:DD:38

192.168.110.177

00:1D:7D:4C:73:DF

xargs -n 2 < test

sed 'N;s/\n/ /' test

192.168.110.171 00:1F:D0:D4:DD:47

192.168.110.172 00:1D:7D:D6:E3:2E

192.168.110.174 00:1F:D0:D4:DD:38

192.168.110.177 00:1D:7D:4C:73:DF

63,shell 語句記錄,列印時間 每隔10秒

awk 'BEGIN{for(i=0;i<=36000;i+=10) printf "%02d:%02d:%02d\n",i/3600+8,i/60%60,i%60}'

64, 查詢一個目錄下的檔案個數 (包括字目錄)

find . -type f -printf %h"\n"|sort|uniq -c

65,查詢一個程序已經運行了多長時間

ps -eo comm,etime | grep syslogd | awk '{print $2}'

66,將數字1234567890 從後往前每隔3位 加一個逗號

echo 1234567890|rev|sed 's/.\{3\}/&,/g'|rev|sed -r 's/^,//'

echo 1234567890|sed -r 's/[0-9]{3}$/,&/;:a;s/([0-9]+)([0-9]{3}),/\1,\2,/;ta'

echo "1234567890" |perl -pe "s/(?<=\d)(?=(?:\d\d\d)+$)/,/g"

67,將lettet文字的 每個英語單詞 首字母變成大寫

echo "aaaaaaaa">>letter

sed 's/\<[a-z]/\U&/g' letter

68,如何在編寫SHELL顯示多個資訊,用

cat << EOF

+--------------------------------------------------------------+

| === Welcome to Tunoff services === |

+--------------------------------------------------------------+

EOF

69,使檔案中前2列和後3列完全一樣的行只保留1行(任取一行保留)

aa b test asfa??fff dd

test2

test3

aa b test4 hjks fff dd

aa b test5 hjks fff dd

變成

aa b test asfa??fff dd

test2

test3

cat file | sort | awk ‘!($1$2 in a){a[$1$2];print}’

70,恢復MYSQL密碼!

(1)、關閉Mysql: 如果 MySQL 正在執行,首先殺之 killall -TERM mysqld

(2)、另外的方法啟動 MySQL :/usr/local/mysql/bin/mysqld_safe --skip-grant-tables & mysql -u root -p

(3)、可以不需要密碼就進入 MySQL 了。

然後就是 #mysql

>use mysql

>update user set password=password("Sailor#[email protected]@") where user="root";

>flush privileges;

74、重新殺 MySQL ,用正常方法啟動 MySQL

75:去除linux文字中#和空行的命令

1.cat /etc/1.txt | grep -Ev (^#|^$)

2.cat /etc/1.txt | grep -v ^# | grep -v ^$

75.顯示消耗記憶體/CPU最多的10個程序

ps aux | sort -nk +4 | tail

ps aux | sort -nk +3 | tail

——————————————————————————————————————————

76.檢視Apache的併發請求數及其TCP連線狀態

netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'

——————————————————————————————————————————

77.找出自己最常用的10條命令及使用次數(或求訪問最多的ip數)

sed -e 's/| /\n/g' ~/.bash_history |cut -d ' ' -f 1 | sort | uniq -c | sort -nr | head

——————————————————————————————————————————

78.日誌中第10個欄位表示連線時間,求平均連線時間

cat access_log |grep “connect cbp” |awk ‘BEGIN{sum=0;count=0;}{sum+=$10;count++;}END{printf(“sum=%d,count=%d,avg=%f\n”,sum,count,

sum/count)}’

——————————————————————————————————————————

78.lsof命令

lsof abc.txt 顯示開啟檔案abc.txt的程序

lsof -i :22 知道22埠現在執行什麼程式

lsof -c abc 顯示abc程序現在開啟的檔案

lsof -p 12 看程序號為12的程序打開了哪些檔案

——————————————————————————————————————————

79.殺掉一個程式的所有程序