1. 程式人生 > 實用技巧 >swoole伺服器如何做到無人值守100%可用

swoole伺服器如何做到無人值守100%可用

在某些情況下,如系統負載過大swoole無法申請到記憶體而掛掉、swoole底層發生段錯誤、Server佔用記憶體過大被核心Kill,或者被某些程式誤殺。那swoole-server將無法提供服務,導致業務中斷,公司收入出現損失。

有一個非常有效並且在BAT等大型公司常用的方案是crontab重啟監控。
原理是每1分鐘執行一次shell指令碼,檢測server的master程序是否存活,如果存在則跳過。如果發現主程序已經掛掉,則執行restart邏輯,先kill掉所有殘留的子程序,然後重新啟動Server。

使用下面的指令碼需要將Server程式的程序名稱設定為master,如cli_set_process_title("php server.php: master")

如果在系統的crontab中加入:

*/1 * * * * /data/script/check_server.sh

/data/script/check_server.sh:

count=`ps -fe |grep "server.php" | grep -v "grep" | grep "master" | wc -l`

echo $count
if [ $count -lt 1 ]; then
ps -eaf |grep "server.php" | grep -v "grep"| awk '{print $2}'|xargs kill -9
sleep 2
ulimit -c unlimited
/usr/local/bin/php /data/webroot/server.php
echo "restart";
echo $(date +%Y-%m-%d_%H:%M:%S) >/data/log/restart.log
fi

可以改進的地方

  • 可以通過netstat -lnp 檢測埠是否在監聽,如果未在監聽,則執行restart
  • 通過一個check.php傳送一段帶有邏輯的請求,試探伺服器是否可以正常工作,如果無法工作,執行restart
  • 使用supervisor監控程序的工具
  • 如果在Docker容器中使用,可以在docker run時增加引數--restart=always