centos7 systemctl status servicename執行慢的問題
過去只有 rsyslogd 的年代中,由於 rsyslogd 必須要開機完成並且執行了 rsyslogd 這個 daemon 之後,登錄文件才會開始記錄。所以,核心還得要自己產生一個 klogd 的服務, 才能將系統在開機過程、啟動服務的過程中的信息記錄下來,然後等 rsyslogd 啟動後才傳送給它來處理。
現在有了 systemd 之後,systemd 使用systemd-journald統一管理所有 Unit 的啟動日誌。由於systemd是kernel喚醒的,然後又是第一個執行的軟件,它可以主動調用 systemd-journald 來協助記載登錄信息。因此在開機過程中的所有信息,包括啟動服務與服務若啟動失敗的情況等等,都可以直接被記錄到 systemd-journald 裏頭去!
不過 systemd-journald 由於是使用於內存的登錄文件記錄方式,因此重新開機過後,開機前的登錄文件信息當然就不會被記載了。 為此,我們還是建議啟動 rsyslogd 來協助分類記錄!也就是說, systemd-journald 用來管理與查詢這次開機後的登錄信息,而 rsyslogd 可以用來記錄以前及現在的所以數據到磁盤文件中,方便未來進行查詢!
二,問題場景:
一臺centos7系統有load高的報警,故登錄上去查看,發現系統很卡,系統磁盤io吃的比較多。之後,發現很多systemctl status的進程,並且這種進程占用系統io很多。
問題分析定位:
1,centos7的bug
2,systemctl的問題
三,解決過程:
1,centos7已經用了很長時間,目前處於穩定,並且翻看centos7的bug list未發現有類似異常。故排除了系統bug。
2,開始查找systemctl的問題,果不其然發現是systemd-journald的問題。
1)strace命令查看問題,發現是讀取systemd-journald日誌比較慢
# strace -s 1024 systemctl status nginx
2)查看status輸出:
# systemctl status nginx
● nginx.service - nginx - high performance web server
Loaded: loaded (/usr/lib/systemd/system/nginx.service; disabled; vendor preset: disabled)
Active: active (running) since 一 2018-01-08 18:25:37 CST; 2h 20min ago
Docs: http://nginx.org/en/docs/
Main PID: 22403 (nginx)
CGroup: /system.slice/nginx.service
├─22403 nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.conf
├─22404 nginx: worker process
├─22405 nginx: worker process
├─22408 nginx: worker process
1月 08 18:25:37 test systemd[1]: Starting nginx - high performance web server...
1月 08 18:25:37 test nginx[22398]: nginx: the configuration file /etc/nginx/nginx.conf syntax is ok
1月 08 18:25:37 test nginx[22398]: nginx: configuration file /etc/nginx/nginx.conf test is successful
1月 08 18:25:37 test systemd[1]: Started nginx - high performance web server.
可以看到systemctl有的輸出有nginx啟動時候相關的信息。而這些輸出是從systemd-journald中讀取的。
3)systemd-journald的日誌默認是存儲在/run/log/journal目錄,發現這個目錄已經有4G了。查看網上相關資料,發現也有其它人遇見過類似的問題。可以通過修改systemd-journald的配置來解決問題:
# vim /etc/systemd/journald.conf
SystemMaxUse=100M
RuntimeMaxUse=100M
###
SystemMaxUse= 與 RuntimeMaxUse= 限制全部日誌文件加在一起最多可以占用多少空間。而SystemMaxUse= 與 RuntimeMaxUse= 的默認值是10%空間與4G空間兩者中的較小者,故把這兩個配置調小了。
重啟systemd-journald:
# systemctl restart systemd-journald
4)操作完成之後發現系統load慢慢降了下來,systemctl status命令也變快了。
四,結論:
1,通過限制systemd-journald日誌的大小來解決這個問題。副作用是保存的日誌變少,但是可接受,目前沒有發現有異常。
五,參考:
http://shouce.jb51.net/vbird-linux-basic-4/160.html
http://www.jinbuguo.com/systemd/journald.conf.html
http://www.codekoala.com/posts/systemctl-status-foo-was-too-slow/
centos7 systemctl status servicename執行慢的問題