Linux的進程及作業管理知識(上)
Linux進程的概念,這個一定要和程序區別開來:
Process: 是運行中的程序的一個副本,是被載入內存的一個指令集合。進程ID(Process ID,PID)號碼被用來標記各個進程 UID、GID、和SELinux語境決定對文件系統的存取和訪問權限,這些屬性通常從執行進程的用戶來繼承,並且進程存在生命周期
centos linux第一個進程通常是init或者systemd,它是所有進程的父進程,ID為1
其他進程都是由父進程創建。
進程類型:
守護進程: daemon,在系統引導過程中啟動的進程,和終端無關進程
前臺進程:跟終端相關,通過終端啟動的進程 註意:兩者可相互轉化
運行態:running
就緒態:ready
睡眠態:
可中斷:interruptable
不可中斷:uninterruptable
停止態:stopped,暫停於內存,但不會被調度,除非手動啟動
僵死態:zombie,結束進程,父進程結束前,子進程不關閉
Linux系統狀態的查看及管理工具:pstree, ps, pidof, pgrep, top, htop, glance, pmap, vmstat, dstat, kill, pkill, job, bg, fg, nohup
這裏挑選幾個常用好用的工具來介紹。
pstree 以樹形結構顯示左右進程,特別是它能顯示進程間的父子關系
-p 同時顯示進程號
[root@centos7 13:48:49 ~]#pstree -p systemd(1)─┬─ModemManager(676)─┬─{ModemManager}(696) │ └─{ModemManager}(711) ├─NetworkManager(666)─┬─{NetworkManager}(723) │ └─{NetworkManager}(728) ├─VGAuthService(648) ├─abrt-dbus(1762)─┬─{abrt-dbus}(1763) │ └─{abrt-dbus}(1765) ├─abrt-watch-log(657) ├─abrt-watch-log(673) ├─abrtd(656) ├─agetty(1128) ├─alsactl(677) ├─atd(1013) ├─auditd(623)─┬─audispd(625)─┬─sedispatch(627) │ │ └─{audispd}(628) │ └─{auditd}(624) ├─avahi-daemon(667)───avahi-daemon(697) ├─bluetoothd(653) ├─crond(1015) ├─cupsd(1002) ├─dbus-daemon(649) ├─gssproxy(678)─┬─{gssproxy}(689) │ ├─{gssproxy}(690) │ ├─{gssproxy}(691) │ ├─{gssproxy}(692) │ └─{gssproxy}(693) ├─httpd(1007)─┬─httpd(1117) │ ├─httpd(1118) │ ├─httpd(1119) │ ├─httpd(1120) │ └─httpd(1121) ├─irqbalance(675) ├─ksmtuned(705)───sleep(1811) ├─lsmd(650) ├─lvmetad(420) ├─master(1114)─┬─pickup(1115) │ └─qmgr(1116) ├─mcelog(722) ├─polkitd(654)─┬─{polkitd}(719) │ ├─{polkitd}(720) │ ├─{polkitd}(721) │ ├─{polkitd}(726) │ └─{polkitd}(730) ├─rngd(665) ├─rsyslogd(671)─┬─{rsyslogd}(695) │ └─{rsyslogd}(703) ├─smartd(662) ├─sshd(999)─┬─sshd(1133)───bash(1139)─┬─glances(1239) │ │ └─pstree(1813) │ └─sshd(1742)───bash(1744)───man(1786)───less(1797) ├─systemd-journal(397) ├─systemd-logind(664) ├─systemd-udevd(424) ├─tuned(998)─┬─{tuned}(1059) │ ├─{tuned}(1060) │ ├─{tuned}(1061) │ └─{tuned}(1062) └─vmtoolsd(669)
ps 命令
ps [options]
它支持三種風格的選項:
? UNIX選項 如-A -e
BSD選項 如a
GNU選項 如--help
BSD選項:
默認顯示當前終端中的進程
? a 選項包括所有終端中的進程
? x 選項包括不鏈接終端的進程
? u 選項顯示進程所有者的信息
? f 選項顯示進程樹,相當於 --forest
? k|--sort 屬性 對屬性排序,屬性前加- 表示倒序
? o 屬性… 選項顯示定制的信息 pid、cmd、%cpu、%mem
? L 顯示支持的屬性列表
常用組合:
ps axu 顯示左右進程
ps k 屬性 o 屬性,屬性...
例如,下面根據內存占用大小排序,並例如所有終端程序中指定的屬性
[root@centos7 13:59:52 ~]#ps k -%mem o user,tty,time,%mem,%cpu,cmd
USER TT TIME %MEM %CPU CMD
root pts/0 00:00:01 1.2 0.0 /usr/bin/python /usr/bin/glances -s -B 192.168.30.104
root pts/0 00:00:00 0.3 0.0 -bash
root pts/1 00:00:00 0.2 0.0 -bash
root pts/1 00:00:00 0.1 0.0 man pstree
root pts/0 00:00:00 0.1 0.0 ps k -%mem o user,tty,time,%mem,%cpu,cmd
root pts/1 00:00:00 0.0 0.0 less -s
root tty1 00:00:00 0.0 0.0 /sbin/agetty --noclear tty1 linux
[root@centos7 13:59:57 ~]#ps k %mem o user,tty,time,%mem,%cpu,cmd
USER TT TIME %MEM %CPU CMD
root tty1 00:00:00 0.0 0.0 /sbin/agetty --noclear tty1 linux
root pts/1 00:00:00 0.0 0.0 less -s
root pts/0 00:00:00 0.1 0.0 ps k %mem o user,tty,time,%mem,%cpu,cmd
root pts/1 00:00:00 0.1 0.0 man pstree
root pts/1 00:00:00 0.2 0.0 -bash
root pts/0 00:00:00 0.3 0.0 -bash
root pts/0 00:00:01 1.2 0.0 /usr/bin/python /usr/bin/glances -s -B 192.168.30.104
默認的一些常見選項:
?-C cmdlist 指定命令,多個命令用,分隔 ?
-L 顯示線程 ?
-e: 顯示所有進程,相當於-A ?
-f: 顯示完整格式程序信息 ?
-F: 顯示更完整格式的進程信息 ?
-H: 以進程層級格式顯示進程相關信息 ?
-u userlist 指定有效的用戶ID或名稱 ?
-U userlist 指定真正的用戶ID或名稱 ?
-g gid或groupname 指定有效的gid或組名稱 ?
-G gid或groupname 指定真正的gid或組名稱 ?
-p pid 顯示指pid的進程 ?--ppid pid 顯示屬於pid的子進程 ?
-M 顯示SELinux信息,相當於Z
在ps輸出信息中各列表示含義:
? VSZ: Virtual memory SiZe,虛擬內存集,線性內存 ?
RSS: ReSident Size, 常駐內存集 ?
STAT:進程狀態
R:running
S: interruptable sleeping
D: uninterruptable sleeping
T: stopped
Z: zombie
+: 前臺進程
l: 多線程進程
L:內存分頁並帶鎖
N:低優先級進程
<: 高優先級進程
s: session leader,會話(子進程)發起者
ps一些常用的示例:
?查詢你擁有的所有進程:
ps -x
?顯示指定用戶名(RUID)或用戶ID的進程:
ps -fU apache ps -fu 48
?顯示指定用戶名(EUID)或用戶ID的進程:
ps -fu wang ps -fu 1000
?查看以root用戶權限(實際和有效ID)運行的每個進程:
ps -U root -u root
?列出某個組擁有的所有進程(實際組ID:RGID或名稱):
ps -fG nginx
?列出有效組名稱(或會話)所擁有的所有進程: ps -fg mysql ps -fG 27
?通過進程ID來顯示所屬的進程:
ps -fp 1234
?以父進程ID來顯示其下所有的進程,如顯示父進程為1154的所有進程:
ps -f --ppid 1234
?顯示指定PID的多個進程:
ps -fp 1204,1239,1263
?要按tty顯示所屬進程:
ps -ft pst/0
要顯示一個進程的所有線程,將顯示LWP(輕量級進程)以及NLWP(輕量 級進 程數)列:
ps -fL -C nginx
查看進程的PID,PPID,用戶名和命令:
ps -eo pid,ppid,user,cmd
查看進程的PID,PPID,用戶名和命令:
ps -eo pid,ppid,user,cmd
使用其PID查找進程名稱:
ps -p 1244 -o comm=
查找指定進程名所有的所屬PID,在編寫需要從std輸出或文件讀取PID的腳本時 這個參數很有用:
ps -C httpd,sshd -o pid=
?檢查一個進程的執行時間
ps -eo comm,etime,user | grep nginx
查找占用最多內存和CPU的進程:
ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%mem | head
ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%cpu | head
還可以使用watch配合使用,實現實時查看內存和CPU消耗最多的進程
watch -n 1 ‘ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%mem | head‘
[root@centos7 15:26:43 ~]#pidof httpd
2828 2827 2826 2825 2824 1007
[root@centos7 15:48:56 ~]#ps axu | grep httpd
root 1007 0.0 0.4 226240 5176 ? Ss 13:02 0:00 /usr/sbin/httpd -DFOREGROUND
apache 2824 0.0 0.2 228324 3148 ? S 14:48 0:00 /usr/sbin/httpd -DFOREGROUND
apache 2825 0.0 0.2 228324 3148 ? S 14:48 0:00 /usr/sbin/httpd -DFOREGROUND
apache 2826 0.0 0.2 228324 3148 ? S 14:48 0:00 /usr/sbin/httpd -DFOREGROUND
apache 2827 0.0 0.2 228324 3148 ? S 14:48 0:00 /usr/sbin/httpd -DFOREGROUND
apache 2828 0.0 0.2 228324 3148 ? S 14:48 0:00 /usr/sbin/httpd -DFOREGROUND
root 3776 0.0 0.0 112664 972 pts/0 S+ 15:49 0:00 grep --color=auto httpd
[root@centos7 15:49:12 ~]#ps -C httpd
PID TTY TIME CMD
1007 ? 00:00:00 httpd
2824 ? 00:00:00 httpd
2825 ? 00:00:00 httpd
2826 ? 00:00:00 httpd
2827 ? 00:00:00 httpd
2828 ? 00:00:00 httpd
[root@centos7 15:49:21 ~]#pidof httpd | xargs ps -fp
UID PID PPID C STIME TTY STAT TIME CMD
root 1007 1 0 13:02 ? Ss 0:00 /usr/sbin/httpd -DFOREGROUND
apache 2824 1007 0 14:48 ? S 0:00 /usr/sbin/httpd -DFOREGROUND
apache 2825 1007 0 14:48 ? S 0:00 /usr/sbin/httpd -DFOREGROUND
apache 2826 1007 0 14:48 ? S 0:00 /usr/sbin/httpd -DFOREGROUND
apache 2827 1007 0 14:48 ? S 0:00 /usr/sbin/httpd -DFOREGROUND
apache 2828 1007 0 14:48 ? S 0:00 /usr/sbin/httpd -DFOREGROUND
有時候我們只記得某個程序的某個字段名,但是需要查看它的進程運行情況,可以使用pgrep查看,它支持正則匹配
pgrep [options] pattern
例如:
[root@centos7 14:53:41 ~]#pgrep -a .*glan.*
1239 /usr/bin/python /usr/bin/glances -s -B 192.168.30.104
如果知道確切的程序名,那可以使用pidof查看其進程:
[root@centos7 14:59:05 ~]#pidof -x glances | xargs ps -fp
UID PID PPID C STIME TTY TIME CMD
root 1239 1139 0 13:06 pts/0 00:00:02 /usr/bin/python /usr/bin/glances -s -B 192.168.30.104
pidof使用時最好加上-x以便識別腳本名
top命令實時監控進程運行狀態,系統CPU 內存等信息
top有許多內置命令:
排序:
P:以占據的CPU百分比,%CPU
M:占據內存百分比,%MEM
T:累積占據CPU時長,TIME+
首部信息顯示:
uptime信息:l命令
tasks及cpu信息:t命令
cpu分別顯示:1 (數字)
memory信息:m命令
退出命令:q
修改刷新時間間隔:s
終止指定進程:k
保存文件:W
還有一種類top風格的工具htop,需要epel源安裝使用,它提供一個實時並且能夠交互式監控的界面:
另一個類top工具glances工具也是需要epel源安裝,它不僅提供top功能,還能實時查看內存,磁盤,網絡I/O等情況,並且支持C/S模式,讓客戶端能夠遠程監控服務器資源狀態,是一個綜合性很強的工具:
? glances命令:EPEL源安裝 ?
glances [-bdehmnrsvyz1] [-B bind] [-c server] [-C conffile] [-p port] [-P password] [--password] [t refresh] [-f file] [-o output]
? 內建命令:
a Sort processes automatically
l Show/hide logs
c Sort processes by CPU%
b Bytes or bits for network I/O
m Sort processes by MEM%
w Delete warning logs
p Sort processes by name
x Delete warning and critical logs
i Sort processes by I/O rate
1 Global CPU or per-CPU stats
d Show/hide disk I/O stats
h Show/hide this help screen
f Show/hide file system stats
t View network I/O as combination
n Show/hide network stats
u View cumulative network I/O
s Show/hide sensors stats
q Quit (Esc and Ctrl-C also work)
y Show/hide hddtemp stats
glances啟動時可加上選項:
常用選項:
-b: 以Byte為單位顯示網卡數據速率
-d: 關閉磁盤I/O模塊
-f /path/to/somefile: 設定輸入文件位置
-o {HTML|CSV}:輸出格式
-m: 禁用mount模塊
-n: 禁用網絡模塊
-t #: 延遲時間間隔
-1:每個CPU的相關數據單獨顯示
如圖,×××熒光部分有我們常用的需要對系統資源進行監控的項目:
其他的關於內存管理的工具:
free 命令free [OPTION]
-b 以字節為單位
-m 以MB為單位
-g 以GB為單位
-h 易讀格式
-o 不顯示-/+buffers/cache行
-t 顯示RAM + swap的總和
-s n 刷新間隔為n秒
-c n 刷新n次後即退出
例如,在centos7中以MB為單位每5秒刷新一次並且刷新3此後退出:
[root@centos7 15:25:19 ~]#free -h -m -s 5 -c 3
total used free shared buff/cache available
Mem: 1.1G 183M 620M 8.2M 343M 764M
Swap: 2.0G 0B 2.0G
total used free shared buff/cache available
Mem: 1.1G 183M 620M 8.2M 343M 764M
Swap: 2.0G 0B 2.0G
total used free shared buff/cache available
Mem: 1.1G 183M 620M 8.2M 343M 764M
Swap: 2.0G 0B 2.0G
例如,在centos6中:
[root@centos6 06:17:32 ~]#free -h -m -s 5 -c 3
total used free shared buffers cached
Mem: 980M 500M 480M 280K 55M 284M
-/+ buffers/cache: 159M 820M
Swap: 2.0G 0B 2.0G
total used free shared buffers cached
Mem: 980M 500M 480M 280K 55M 284M
-/+ buffers/cache: 160M 820M
Swap: 2.0G 0B 2.0G
total used free shared buffers cached
Mem: 980M 500M 480M 280K 55M 284M
-/+ buffers/cache: 160M 820M
Swap: 2.0G 0B 2.0G
在centos6及之前的free內容含義可以這麽理解:
內存的使用分作4部分:
A. 程序使用的;
B. 未被分配的;
C. Buffers (buffer cache)
D. Cached (page cache)
顯然,A (程序使用的) 肯定是used,B (未被分配的) 肯定是free。但是,C (Buffers) 和 D (Cached) 是算作used還是算作free呢?一方面,它們已經被分配了,可以算作used;另一方面,當程序需要時,可以回收它們來使用,可以算作free。所以,怎麽算都合理。這就是在free命令的output中,第一行和第二行的區別:
第一行(Mem):Buffers和Cached被算作used。也就是說,它的free是指 B (未被分配的);它的used是指 A + C + D;
第二行(-/+ buffers/cache):Buffers和Cached被算作free。也就是說,它的used是指 A (程序使用的);它的free是指 B + C + D;行名稱“-/+ buffers/cache”的含義就是“把Buffers和Cached從used減下來,加到free裏”。
在centos7中:
首先,C (Buffers) 和D (Cached)被和到一起,即buff/cache;
其次,used就是指A (程序使用的);free就是指B (未被分配的);
另外,CentOS 7中加入了一個available,它是什麽呢?
手冊上是這麽說的:
MemAvailable: An estimate of how much memory is available for starting new applications, without swapping.
前面說過,當程序需要時,可以回收C (Buffers)和D (Cached),那麽MemAvailabe不就是B+C+D嗎?當程序需要時可以回收C和D,這句話以前是正確,但是現在就不精確了:因為, 現在,C和D中不是所有的內存都可以被回收。所以,大致可以這麽理解,MemAvailable = B (未被分配的) + C (Buffers) + D (Cached) - 不可回收的部分。哪些不可回收呢?共享內存段,tmpfs,ramfs等
還有一個內存工具 vmstat 也可以用來查看內存使用情況
例如,以MB為單位,2秒刷新一次,刷新5此後退出
[root@centos6 06:31:20 ~]#vmstat -S M 2 5
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
1 0 0 479 56 284 0 0 8 1 9 6 0 0 100 0 0
0 0 0 479 56 284 0 0 0 0 45 21 0 0 100 0 0
0 0 0 479 56 284 0 0 0 0 23 22 0 0 100 0 0
0 0 0 479 56 284 0 0 0 0 24 17 0 0 100 0 0
0 0 0 479 56 284 0 0 0 6 20 22 0 0 100 0 0
?procs: r:可運行(正運行或等待運行)進程的個數,和核心數有關
b:處於不可中斷睡眠態的進程個數(被阻塞的隊列的長度)
?memory:
swpd: 交換內存的使用總量
free:空閑物理內存總量
buffer:用於buffer的內存總量
cache:用於cache的內存總量
?swap:
si:從磁盤交換進內存的數據速率(kb/s)
so:從內存交換至磁盤的數據速率(kb/s)
io:
bi:從塊設備讀入數據到系統的速率(kb/s)
bo: 保存數據至塊設備的速率
?system:
in: interrupts 中斷速率,包括時鐘
cs: context switch 進程切換速率
?cpu:
us:Time spent running non-kernel code
sy: Time spent running kernel code
id: Time spent idle. Linux 2.5.41前,包括IO-wait time.
wa: Time spent waiting for IO. 2.5.41前,包括in idle.
st: Time stolen from a virtual machine. 2.6.11前, unknown.
查看磁盤使用情況的監控iostat
?iostat:統計CPU和設備IO信息
示例:iostat 1 10
[root@centos6 06:32:06 ~]#iostat
Linux 2.6.32-696.el6.x86_64 (centos6.magedu.com) 05/06/2018 _x86_64_ (4 CPU)
avg-cpu: %user %nice %system %iowait %steal %idle
0.01 0.00 0.08 0.01 0.00 99.89
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
scd0 0.00 0.03 0.00 384 0
sda 1.49 55.91 11.06 691042 136704
sdb 0.02 0.13 0.00 1624 0
sdc 0.01 0.08 0.00 928 0
sdd 0.02 0.19 0.00 2320 0
dm-0 0.01 0.06 0.00 768 0
要查看進程和內存的映射關系使用pmap命令
pmap [options] pid [...]
-x: 顯示詳細格式的信息
示例:pmap 1
另外一種實現: cat /proc/PID/maps
進程管理除了以上進程查看的工具,還需要適當的進程操作工具
kill命令:
向進程發送控制信號,以實現對進程管理,每個信號對應一個數字,信號名稱以SIG開頭(可省略),不區分大小寫
顯示當前系統可用信號: kill –l,trap -l
常用信號:man 7 signal ,以下數字是常用的信號數字
1) SIGHUP: 無須關閉進程而讓其重讀配置文件
2) SIGINT: 中止正在運行的進程;相當於Ctrl+c
3) SIGQUIT:相當於ctrl+\
9) SIGKILL: 強制殺死正在運行的進程
15) SIGTERM:終止正在運行的進程
18) SIGCONT:繼續運行
19) SIGSTOP:後臺休眠
指定信號的方法:
(1) 信號的數字標識:1, 2, 9
(2) 信號完整名稱:SIGHUP
(3) 信號的簡寫名稱:HUP進程管理工具
?按PID:kill [-SIGNAL] pid …
kill –n SIGNAL pid;kill –s SIGNAL pid
按名稱:killall [-SIGNAL] comm… ?
按模式:pkill [options] pattern
-SIGNAL
-u uid: effective user,生效者
-U uid: real user,真正發起運行命令者
-t terminal: 與指定終端相關的進程
-l: 顯示進程名(pgrep可用)
-a: 顯示完整格式的進程名(pgrep可用)
-P pid: 顯示指定進程的子進程
[root@centos7 16:02:55 ~]#w
16:02:56 up 3:01, 3 users, load average: 0.00, 0.01, 0.05
USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
root pts/0 192.168.30.1 13:02 0.00s 4.51s 0.00s w
root pts/1 192.168.30.1 13:47 1:02m 0.06s 0.06s -bash
root pts/2 192.168.30.101 16:02 42.00s 0.04s 0.04s -bash
[root@centos7 16:02:56 ~]#pkill -9 -t pts/2
[root@centos7 16:03:14 ~]#w
16:03:15 up 3:01, 2 users, load average: 0.00, 0.01, 0.05
USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
root pts/0 192.168.30.1 13:02 3.00s 4.51s 0.00s w
root pts/1 192.168.30.1 13:47 1:03m 0.06s 0.06s -bash
[root@centos7 16:03:15 ~]#
另外關於進程狀態的切換如下圖:
關於進程的管理包括作業管理,在下篇知識中繼續介紹
Linux的進程及作業管理知識(上)