Rancher 2.0集群與工作負載告警
在Rancher 1.x時期,告警功能是很多Rancher用戶一直希望能夠集成進產品內的,因此在Rancher 2.0研發階段,這一直是Rancher研發團隊功能列表中的重要一項。
Rancher 2.0發布,新版本產品中引入了很多酷炫新功能,其中就包括集群和工作負載的告警功能。
通知程序
Rancher 2.0的告警功能讓用戶可以創建自定義警報,並將這些警報發送到多類多個後端系統上。
第一步,是創建通知程序。通知程序是在集群級別創建的。選擇【工具/Tools】下拉菜單,在下拉菜單中選擇【通知程序/Notifiers】,然後單擊【添加通知程序/Add Notifier】,這將打開一個模式窗口,您可以從以下選項中進行選擇。
您選擇其中一個選項後,接著就需要填寫與此選項相關的各種配置參數。比如在下圖的Slack示例中,您可以看到有一個鏈接顯示了如何配置通知程序。
添加完有效信息後,你就可以試著發送一個測試給通知程序了。Slack通知的示例如下:
還有其他各類系統的通知接收工作,都可以通過webhook來完成。Webhook可以將通知發送到各種系統,這些系統具有自己的工作流,來處理已觸發的特定警報。
集群級別的告警
返回到【工具/Tools】下拉菜單中,你能看到那裏有一個【告警/Alerts】的選項。Rancher裏設定了一些預先配置好的告警,不過在這些告警與通知程序關聯好之前,它們是不會被觸發的。
將告警與通知程序相關聯非常簡單,只需要編輯告警、設置通知程序、保存,就可以了。
要創建新的告警,只需單擊【添加告警/Add Alert】,然後你就會看到下圖的界面:
如你所見,您可以設置各種告警相關的選項,這些選項將會與系統或用戶資源關聯起來。在集群級別,您可以根據集群範圍的資源(例如Node或實際的Kubernetes組件)設置告警。
工作負載級別的告警
工作負載級別的告警需要在【項目/Project】中設置。在【資源/Resources】的下拉列表中,有一個【告警/Alerts】菜單項,在此處單擊【添加/add】,你將看到如下界面:
在項目(Project)告警中,您可以設置與實際應用程序工作負載相關的告警。例如,您可以設置如果您的服務未按您設置的規模運行,或者在指定的時間段內重新啟動了一定次數,則收到告警通知。
結論
本文旨在簡要介紹我們在Rancher 2.0中引入的新功能——告警。Rancher 2.0還在持續升級叠代之中,Rancher Labs研發團隊將進一步更新與增強這些功能,為用戶提供更優質更強大的體驗。
您還可以在此鏈接中觀看“Rancher 2.0實戰訓練營”在線培訓中監控告警的這一期內容。未來我們會提供更多Rancher 2.0實操系列文檔,敬請保持關註~
英文原文:https://rancher.com/blog/2018/cluster-workload-alerts/
Rancher 2.0集群與工作負載告警