2021.12.20
阿新 • • 發佈:2021-12-20
線上巡檢:每隔XX分鐘進行定時的自動掃描,驗證服務對應的產品是否可用,如不可用的情況下,觸發報警(簡訊,釘釘,企業微信)
混沌:在一定的可穩定性的秩序下,存在不確定性,所以就需要新的秩序來建設可確定性的東西
分散式的架構叢集:去中心化,多服務的例項化
彈性計算(容器化):可伸縮的架構
cpu :大家都進行掃描二維碼,以及檢視自己的健康碼
記憶體:大家的健康碼資料在進行大量的查詢和寫入
OOM(Java Lang Out Of Memory):記憶體洩露
排查思路:
1、首先搞清楚這個服務是在那個阿里雲機器上部署的
2、然後登入到這個阿里雲的伺服器上
3、然後到二維碼服務的logs目錄下
4、檢視今天早上7:35至7:45的日誌
A、日誌檔案瘋狂的寫
B、還是繼續寫,但是不是瘋狂的寫,查詢關鍵字Out Of Memory,7:40
最直接的方式:服務重新啟動,記憶體釋放
健康碼的資料,必須進行持久化的處理:
1、持久化的技術方案:redis 記憶體中的資料會進行備份的
2、資料儲存的資料庫,那麼資料庫裡面的資料也會進行冷熱備份