swoole伺服器如何做到無人值守100%可用
阿新 • • 發佈:2020-07-24
在某些情況下,如系統負載過大swoole無法申請到記憶體而掛掉、swoole底層發生段錯誤、Server佔用記憶體過大被核心Kill,或者被某些程式誤殺。那swoole-server將無法提供服務,導致業務中斷,公司收入出現損失。
有一個非常有效並且在BAT等大型公司常用的方案是crontab重啟監控。
原理是每1分鐘執行一次shell指令碼,檢測server的master程序是否存活,如果存在則跳過。如果發現主程序已經掛掉,則執行restart邏輯,先kill掉所有殘留的子程序,然後重新啟動Server。
使用下面的指令碼需要將Server程式的程序名稱設定為master,如
cli_set_process_title("php server.php: master")
如果在系統的crontab中加入:
*/1 * * * * /data/script/check_server.sh
/data/script/check_server.sh:
count=`ps -fe |grep "server.php" | grep -v "grep" | grep "master" | wc -l`
echo $count
if [ $count -lt 1 ]; then
ps -eaf |grep "server.php" | grep -v "grep"| awk '{print $2}'|xargs kill -9
sleep 2
ulimit -c unlimited
/usr/local/bin/php /data/webroot/server.php
echo "restart";
echo $(date +%Y-%m-%d_%H:%M:%S) >/data/log/restart.log
fi
可以改進的地方
- 可以通過netstat -lnp 檢測埠是否在監聽,如果未在監聽,則執行restart
- 通過一個check.php傳送一段帶有邏輯的請求,試探伺服器是否可以正常工作,如果無法工作,執行restart
- 使用supervisor監控程序的工具
- 如果在Docker容器中使用,可以在
docker run
時增加引數--restart=always