1. 程式人生 > >Linux top和負載的解釋(轉載)

Linux top和負載的解釋(轉載)

  1. top命令是Linux下常用的效能分析工具,能夠實時顯示系統中各個程序的資源佔用狀況,類似於Windows的工作管理員。下面詳細介紹它的使用方法。
  2. top - 01:06:48 up 1:22, 1 user, load average: 0.06, 0.60, 0.48
  3. Tasks: 29 total, 1 running, 28 sleeping, 0 stopped, 0 zombie
  4. Cpu(s): 0.3% us, 1.0% sy, 0.0% ni, 98.7% id, 0.0% wa, 0.0% hi, 0.0% si
  5. Mem: 191272k total, 173656k used, 17616k free, 22052k buffers
  6. Swap: 192772k total, 0k used, 192772k free, 123988k cached
  7. PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
  8. 1379 root 16 0 7976 2456 1980 S 0.7 1.3 0:11.03 sshd
  9. 14704 root 16 0 2128 980 796 R 0.7 0.5 0:02.72 top
  10. 1 root 16 0 1992 632 544 S 0.0 0.3 0:00.90 init
  11. 2 root 34 19 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/0
  12. 3 root RT 0 0 0 0 S 0.0 0.0 0:00.00 watchdog/0
  13. 統計資訊區前五行是系統整體的統計資訊。第一行是任務佇列資訊,同 uptime 命令的執行結果。其內容如下:
  14. 01:06:48 當前時間
  15. up 1:22 系統執行時間,格式為時:分
  16. 1 user 當前登入使用者數
  17. load average: 0.06, 0.60, 0.48 系統負載,即任務佇列的平均長度。
  18. 三個數值分別為 1分鐘、5分鐘、15分鐘前到現在的平均值。
  19. 第二、三行為程序和CPU的資訊。當有多個CPU時,這些內容可能會超過兩行。內容如下:
  20. Tasks: 29 total 程序總數
  21. 1 running 正在執行的程序數
  22. 28 sleeping 睡眠的程序數
  23. 0 stopped 停止的程序數
  24. 0 zombie 殭屍程序數
  25. Cpu(s): 0.3% us 使用者空間佔用CPU百分比
  26. 1.0% sy 核心空間佔用CPU百分比
  27. 0.0% ni 使用者程序空間內改變過優先順序的程序佔用CPU百分比
  28. 98.7% id 空閒CPU百分比
  29. 0.0% wa 等待輸入輸出的CPU時間百分比
  30. 0.0% hi
  31. 0.0% si
  32. 最後兩行為記憶體資訊。內容如下:
  33. Mem: 191272k total 實體記憶體總量
  34. 173656k used 使用的實體記憶體總量
  35. 17616k free 空閒記憶體總量
  36. 22052k buffers 用作核心快取的記憶體量
  37. Swap: 192772k total 交換區總量
  38. 0k used 使用的交換區總量
  39. 192772k free 空閒交換區總量
  40. 123988k cached 緩衝的交換區總量。
  41. 記憶體中的內容被換出到交換區,而後又被換入到記憶體,但使用過的交換區尚未被覆蓋,
  42. 該數值即為這些內容已存在於記憶體中的交換區的大小。
  43. 相應的記憶體再次被換出時可不必再對交換區寫入。
  44. 程序資訊區統計資訊區域的下方顯示了各個程序的詳細資訊。首先來認識一下各列的含義。
  45. 序號 列名 含義
  46. a PID 程序id
  47. b PPID 父程序id
  48. c RUSER Real user name
  49. d UID 程序所有者的使用者id
  50. e USER 程序所有者的使用者名稱
  51. f GROUP 程序所有者的組名
  52. g TTY 啟動程序的終端名。不是從終端啟動的程序則顯示為 ?
  53. h PR 優先順序
  54. i NI nice值。負值表示高優先順序,正值表示低優先順序
  55. j P 最後使用的CPU,僅在多CPU環境下有意義
  56. k %CPU 上次更新到現在的CPU時間佔用百分比
  57. l TIME 程序使用的CPU時間總計,單位秒
  58. m TIME+ 程序使用的CPU時間總計,單位1/100秒
  59. n %MEM 程序使用的實體記憶體百分比
  60. o VIRT 程序使用的虛擬記憶體總量,單位kb。VIRT=SWAP+RES
  61. p SWAP 程序使用的虛擬記憶體中,被換出的大小,單位kb。
  62. q RES 程序使用的、未被換出的實體記憶體大小,單位kb。RES=CODE+DATA
  63. r CODE 可執行程式碼佔用的實體記憶體大小,單位kb
  64. s DATA 可執行程式碼以外的部分(資料段+棧)佔用的實體記憶體大小,單位kb
  65. t SHR 共享記憶體大小,單位kb
  66. u nFLT 頁面錯誤次數
  67. v nDRT 最後一次寫入到現在,被修改過的頁面數。
  68. w S 程序狀態。
  69. D=不可中斷的睡眠狀態
  70. R=執行
  71. S=睡眠
  72. T=跟蹤/停止
  73. Z=殭屍程序
  74. x COMMAND 命令名/命令列
  75. y WCHAN 若該程序在睡眠,則顯示睡眠中的系統函式名
  76. z Flags 任務標誌,參考 sched.h
  77. 預設情況下僅顯示比較重要的 PID、USER、PR、NI、VIRT、RES、SHR、S、%CPU、%MEM、TIME+、COMMAND 列。可以通過下面的快捷鍵來更改顯示內容。
  78. 更改顯示內容通過 f 鍵可以選擇顯示的內容。按 f 鍵之後會顯示列的列表,按 a-z 即可顯示或隱藏對應的列,最後按回車鍵確定。
  79. 按 o 鍵可以改變列的顯示順序。按小寫的 a-z 可以將相應的列向右移動,而大寫的 A-Z 可以將相應的列向左移動。最後按回車鍵確定。
  80. 按大寫的 F 或 O 鍵,然後按 a-z 可以將程序按照相應的列進行排序。而大寫的 R 鍵可以將當前的排序倒轉。
  81. 命令使用
  82. 1. 工具(命令)名稱
  83. top
  84. 2.工具(命令)作用
  85. 顯示系統當前的程序和其他狀況;top是一個動態顯示過程,即可以通過使用者按鍵來不斷重新整理當前狀態.如果在前臺執行該命令,它將獨佔前臺,直到使用者終止該程式為止.比較準確的說,top命令提供了實時的對系統處理器的狀態監視.它將顯示系統中CPU最“敏感”的任務列表.該命令可以按CPU使用.記憶體使用和執行時間對任務進行排序;而且該命令的很多特性都可以通過互動式命令或者在個人定製檔案中進行設定.
  86. 3.環境設定
  87. 在Linux下使用。
  88. 4.使用方法
  89. 4.1使用格式
  90. top [-] [d] [p] [q] [c] [C] [S] [n]
  91. 4.2引數說明
  92. d 指定每兩次螢幕資訊重新整理之間的時間間隔。當然使用者可以使用s互動命令來改變之。
  93. p 通過指定監控程序ID來僅僅監控某個程序的狀態。
  94. q該選項將使top沒有任何延遲的進行重新整理。如果呼叫程式有超級使用者許可權,那麼top將以儘可能高的優先順序執行。
  95. S 指定累計模式
  96. s 使top命令在安全模式中執行。這將去除互動命令所帶來的潛在危險。
  97. i 使top不顯示任何閒置或者僵死程序。
  98. c 顯示整個命令列而不只是顯示命令名
  99. 4.3其他
  100. 下面介紹在top命令執行過程中可以使用的一些互動命令。從使用角度來看,熟練的掌握這些命令比掌握選項還重要一些。這些命令都是單字母的,如果在命令列選項中使用了s選項,則可能其中一些命令會被遮蔽掉。
  101. Ctrl+L 擦除並且重寫螢幕。
  102. h或者? 顯示幫助畫面,給出一些簡短的命令總結說明。
  103. k 終止一個程序。系統將提示使用者輸入需要終止的程序PID,以及需要傳送給該程序什麼樣的訊號。一般的終止程序可以使用15訊號;如果不能正常結束那就使用訊號9強制結束該程序。預設值是訊號15。在安全模式中此命令被遮蔽。
  104. i 忽略閒置和僵死程序。這是一個開關式命令。
  105. q 退出程式。
  106. r 重新安排一個程序的優先級別。系統提示使用者輸入需要改變的程序PID以及需要設定的程序優先順序值。輸入一個正值將使優先順序降低,反之則可以使該程序擁有更高的優先權。預設值是10。
  107. S 切換到累計模式。
  108. s 改變兩次重新整理之間的延遲時間。系統將提示使用者輸入新的時間,單位為s。如果有小數,就換算成m s。輸入0值則系統將不斷重新整理,預設值是5 s。需要注意的是如果設定太小的時間,很可能會引起不斷重新整理,從而根本來不及看清顯示的情況,而且系統負載也會大大增加。
  109. f或者F 從當前顯示中新增或者刪除專案。
  110. o或者O 改變顯示專案的順序。
  111. l 切換顯示平均負載和啟動時間資訊。
  112. m 切換顯示記憶體資訊。
  113. t 切換顯示程序和CPU狀態資訊。
  114. c 切換顯示命令名稱和完整命令列。
  115. M 根據駐留記憶體大小進行排序。
  116. P 根據CPU使用百分比大小進行排序。
  117. T 根據時間/累計時間進行排序。
  118. W 將當前設定寫入~/.toprc檔案中。這是寫top配置檔案的推薦方法。
  119. -----
  120. 1、獲取cpu佔用情況
  121. [root@localhost utx86]# top -n 1 |grep Cpu
  122. Cpu(s): 1.9%us, 1.3%sy, 0.0%ni, 95.9%id, 0.6%wa, 0.1%hi, 0.2%si, 0.0%st
  123. 解釋:1.9%us是使用者佔用cpu情況
  124. 1.3%sy,是系統佔用cpu情況
  125. 2、獲得記憶體佔用情況
  126. [root@localhost utx86]# top -n 1 |grep Mem
  127. Mem: 2066240k total, 1515784k used, 550456k free, 195336k buffers
  128. 也許你在學習Linux作業系統,會遇到很多問題,這裡為你講解Linux系統Load average負載的知識,你可能對於 Linux 的負載均值(load averages)已有了充分的瞭解。負載均值在 uptime 或者 top 命令中可以看到,它們可能會顯示成這個樣子:
  129.   load average: 0.09, 0.05, 0.01
  130.   很多人會這樣理解負載均值:三個數分別代表不同時間段的系統平均負載(一分鐘、五 分鐘、以及十五分鐘),它們的數字當然是越小越好。數字越高,說明伺服器的負載越 大,這也可能是伺服器出現某種問題的訊號。
  131.   而事實不完全如此,是什麼因素構成了負載均值的大小,以及如何區分它們目前的狀況是 “好”還是“糟糕”?什麼時候應該注意哪些不正常的數值?
  132.   回答這些問題之前,首先需要了解下這些數值背後的些知識。我們先用最簡單的例子說明, 一臺只配備一塊單核處理器的伺服器。
  133.   行車過橋
  134.   一隻單核的處理器可以形象得比喻成一條單車道。設想下,你現在需要收取這條道路的過橋 費 - 忙於處理那些將要過橋的車輛。你首先當然需要了解些資訊,例如車輛的載重、以及還有多少車輛正在等待過橋。如果前面沒有車輛在等待,那麼你可以告訴後面的司機通過。 如果車輛眾多,那麼需要告知他們可能需要稍等一會。
  135.   因此,需要些特定的代號表示目前的車流情況,例如:
  136.   0.00 表示目前橋面上沒有任何的車流。 實際上這種情況與 0.00 和 1.00 之間是相同的,總而言之很通暢,過往的車輛可以絲毫不用等待的通過。
  137.   1.00 表示剛好是在這座橋的承受範圍內。 這種情況不算糟糕,只是車流會有些堵,不過這種情況可能會造成交通越來越慢。
  138.   超過 1.00,那麼說明這座橋已經超出負荷,交通嚴重的擁堵。 那麼情況有多糟糕? 例如 2.00 的情況說明車流已經超出了橋所能承受的一倍,那麼將有多餘過橋一倍的車輛正在焦急的等待。3.00 的話情況就更不妙了,說明這座橋基本上已經快承受不了,還有超出橋負載兩倍多的車輛正在等待。
  139.   上面的情況和處理器的負載情況非常相似。一輛汽車的過橋時間就好比是處理器處理某執行緒 的實際時間。Unix 系統定義的程序執行時長為所有處理器核心的處理時間加上執行緒 在佇列中等待的時間。
  140.   和收過橋費的管理員一樣,你當然希望你的汽車(操作)不會被焦急的等待。所以,理想狀態 下,都希望負載平均值小於 1.00 。當然不排除部分峰值會超過 1.00,但長此以往保持這 個狀態,就說明會有問題,這時候你應該會很焦急。
  141.   “所以你說的理想負荷為 1.00 ?”
  142.   嗯,這種情況其實並不完全正確。負荷 1.00 說明系統已經沒有剩餘的資源了。在實際情況中 ,有經驗的系統管理員都會將這條線劃在 0.70:
  143.   “需要進行調查法則”: 如果長期你的系統負載在 0.70 上下,那麼你需要在事情變得更糟糕之前,花些時間瞭解其原因。
  144.   “現在就要修復法則”:1.00 。 如果你的伺服器系統負載長期徘徊於 1.00,那麼就應該馬上解決這個問題。否則,你將半夜接到你上司的電話,這可不是件令人愉快的事情。
  145.   “凌晨三點半鍛鍊身體法則”:5.00。 如果你的伺服器負載超過了 5.00 這個數字,那麼你將失去你的睡眠,還得在會議中說明這情況發生的原因,總之千萬不要讓它發生。
  146.   那麼多個處理器呢?我的均值是 3.00,但是系統執行正常!
  147.   哇喔,你有四個處理器的主機?那麼它的負載均值在 3.00 是很正常的。
  148.   在多處理器系統中,負載均值是基於核心的數量決定的。以 100% 負載計算,1.00 表示單個處理器,而 2.00 則說明有兩個雙處理器,那麼 4.00 就說明主機具有四個處理器。
  149.   回到我們上面有關車輛過橋的比喻。1.00 我說過是“一條單車道的道路”。那麼在單車道 1.00 情況中,說明這橋樑已經被車塞滿了。而在雙處理器系統中,這意味著多出了一倍的 負載,也就是說還有 50% 的剩餘系統資源 - 因為還有另外條車道可以通行。
  150.   所以,單處理器已經在負載的情況下,雙處理器的負載滿額的情況是 2.00,它還有一倍的資源可以利用。
  151.   多核與多處理器
  152.   先脫離下主題,我們來討論下多核心處理器與多處理器的區別。從效能的角度上理解,一臺主 機擁有多核心的處理器與另臺擁有同樣數目的處理效能基本上可以認為是相差無幾。當然實際 情況會複雜得多,不同數量的快取、處理器的頻率等因素都可能造成效能的差異。
  153.   但即便這些因素造成的實際效能稍有不同,其實系統還是以處理器的核心數量計算負載均值 。這使我們有了兩個新的法則:
  154.   “有多少核心即為有多少負荷”法則: 在多核處理中,你的系統均值不應該高於處理器核心的總數量。
  155.   “核心的核心”法則: 核心分佈在分別幾個單個物理處理中並不重要,其實兩顆四核的處理器 等於 四個雙核處理器 等於 八個單處理器。所以,它應該有八個處理器核心。
  156.   審視我們自己
  157.   讓我們再來看看 uptime 的輸出
  158.   ~ $ uptime
  159.   23:05 up 14 days, 6:08, 7 users, load averages: 0.65 0.42 0.36
  160.   這是個雙核處理器,從結果也說明有很多的空閒資源。實際情況是即便它的峰值會到 1.7,我也從來沒有考慮過它的負載問題。
  161.   那麼,怎麼會有三個數字的確讓人困擾。我們知道,0.65、0.42、0.36 分別說明上一分鐘、最後五分鐘以及最後十五分鐘的系統負載均值。那麼這又帶來了一個問題:
  162.   我們以哪個數字為準?一分鐘?五分鐘?還是十五分鐘?
  163.   其實對於這些數字我們已經談論了很多,我認為你應該著眼於五分鐘或者十五分鐘的平均數 值。坦白講,如果前一分鐘的負載情況是 1.00,那麼仍可以說明認定伺服器情況還是正常的。 但是如果十五分鐘的數值仍然保持在 1.00,那麼就值得注意了(根據我的經驗,這時候你應該增加的處理器數量了)。
  164.   那麼我如何得知我的系統裝備了多少核心的處理器?
  165.   在Linux 下,可以使用
  166.   cat /proc/cpuinfo
  167.   獲取你係統上的每個處理器的資訊。如果你只想得到數字,那麼就使用下面的命令:
  168.   grep 'model name' /proc/cpuinfo | wc -l
  169.   Popularity: 11% [?]
  170.   以上就是Linux系統Load average負載的內容。