日常運維管理技巧(檢視負載 W)
今天針對Linux系統管理做一個專題的記錄,以後會用的機率也是很大的,只要掌握必備的基礎知識,做初級系統管理員是不成問題的。
作為一個運維工程師、系統管理員,如果對自己的系統不瞭解的話,那怎麼排查問題呢?如果出現問題的話,肯定要查一下是什麼問題,哪裡的問題,系統的資源的耗費情況如何檢視。
一、使用w命令檢視當前系統的負載
1.1 系統時間檢視,使用date命令也可以檢視當前時間
1.2 系統執行時間,uptime
1.3 登陸了幾個使用者
從上面可以看到登入了哪個終端。如果是網路登入的話,終端是ps/0,ps/1這些;
如果是系統登入,會出現tty1,tty1- tty6是6個終端。from是可以看出從哪裡來的。
1.4 load average是關鍵的一段,這是它的系統負載,平時用的最多的就是這一部分了
它後面跟三個數字,分別是1分鐘、5分鐘、15分鐘內系統的平均負載值。
]第一個數字是單位時間內使用CPU的活動的程序有多少個,值越大說明伺服器壓力越大。這個數字可以是零點幾,也可以是一百多,當前值是0,說明系統沒有負載,就沒有活動的程序,這說明伺服器處於空閒的狀態。這對於Linux作業系統來講就比較浪費,它在空耗。
那什麼值是理想狀態呢?看你有幾顆CPU,這個指的是邏輯CPU,而不是物理CPU。CPU有很多型別,Intel的,AMD的,都會有幾顆CPU,每顆上又會有很多邏輯CPU。檢視CPU的命令如下:cat /proc/cpuinfo,需要檢視的數字是processor。
如果是0,就代表有1顆;是1代表是2顆;如果有39,就代表有40顆,翻到最後一頁就可以看出你的cpu數量。
這裡說的是邏輯CPU,而不是物理CPU。processor的最大數字是7,代表最多有8顆CPU,只要w命令查到的數字不大於8,就是可以的。
[email protected]是登陸的時間,IDLE是空閒了多長時間,PCPU是使用CPU的時間,WHAT是適用的命令,後面的可以不用管它。
注:/proc/cpuinfo檔案記錄了CPU的詳細資訊。目前市場上多為2顆多核CPU,在Linux看來,它就是2*n個CPU(n為單顆物理CPU上有幾核)。如果n為4,則檢視這個檔案時會顯示8段資訊,而最後一段資訊的processor會顯示7,檢視當前系統有幾個CPU,可以使用命令grep -c 'processor' /proc/cpuinfo