阿里雲cloudmonitor服務導致CPU暴增的異常
最近伺服器發現CPU無端暴增,load負載超過10,對比最近的維護,發現阿里雲cloudmonitor程序經常100%的CPU耗用,經過工單諮詢,工程師建議更新成Go語言版本,切換後目前觀察正常。再次證明java是否適合關鍵業務,值得考量。
下面是一些切換的基本方式:
1、先刪除java版本的cloudmonitor
# 停止
/usr/local/cloudmonitor/wrapper/bin/cloudmonitor.sh stop
# 解除安裝
/usr/local/cloudmonitor/wrapper/bin/cloudmonitor.sh remove && \
rm -rf /usr/local/cloudmonitor
2、安裝Go語言版本cloudmonitor
登入阿里雲管理後臺,檢視ECS所在區域,再開啟 https://help.aliyun.com/document_detail/97929.html?spm=5176.11065259.1996646101.searchclickresult.1c307499OrGoia 找到相應區域的安裝命令。
如杭州1的安裝指令
REGION_ID=cn-hangzhou VERSION=2.1.55 \
bash -c "$(curl https://cms-agent-cn-hangzhou.oss-cn-hangzhou-internal.aliyuncs.com/cms-go-agent/cms_go_agent_install.sh)"
# 註冊為系統服務
/usr/local/cloudmonitor/CmsGoAgent.linux-amd64 install
# 啟動
/usr/local/cloudmonitor/CmsGoAgent.linux-amd64