有關Kubernetes監控的4大常見陷阱,注意避免!
Kubernetes(K8S)現在似乎是管理和部署基於微服務和容器的應用程式的事實標準——其中緣由亦不難理解。Kubernetes是最大的開源社群,它由雲原生計算基金會(CNCF)支援,它是DevOps友好的,它提供了混合雲的優勢。有什麼理由不愛它?
但在TheNewStack的最近一項調查中,69%的受訪者表示,誠然Kubernetes是他們企業容器編排的首選,但部署和管理Kubernetes並非像在公園散步一樣輕鬆愜意。儘管Kubernetes具有很高的靈活性,但仍存在操作工作流程的複雜性——許多涉及應用程式效能管理(APM),真的想要完全體會到Kubernetes承諾的好處,還需要在有效管理上下大功夫。
重新思考你的Kubernetes監控策略
在一個近期的CNCF調查中,38%的受訪者表示監控是其企業採用Kubernetes過程中的最大挑戰之一。若把受訪者劃分為部署規模更大的那批企業,這一數字甚至增長到了46%。那麼,現代IT領導者該如何簡化Kubernetes監控,以提高效率,同時優化效能?
目前的Kubernetes監控方法存在的主要問題,從缺乏端到端的可視性,到遷移容易出錯,不一而足。下文中我們將聊聊監控Kubernetes時可能遇到的四個常見挑戰——以及如何解決這些挑戰的建議。
挑戰1:缺乏端到端的可視性
Kubernetes傳統監控的最常見問題之一,是缺乏對客戶接觸點和分散式應用程式的端到端可視性。
因此,IT團隊對終端使用者體驗和應用程式效能如何影響業務KPI沒有任何概念和感受,也因此無法知道要修復或改進的內容。
為了解決這個問題,使用基於正常效能的Kubernetes監控解決方案非常重要,並且可以利用機器學習的強大功能,從而在出現問題時智慧地向IT團隊發出警報。
挑戰2:告警風暴
雖然瞭解所有應用程式的問題似乎是一件好事,但是當多個問題同時出現時,它可能會迅速失控併成為障礙。畢竟,你真的希望每次有工作完成或新容器啟動時,都收到一遍提醒嗎?
如果沒有優先順序警報的能力,IT團隊通常必須對每個問題的根本原因做出響應和分類,這將直接帶來非常糟糕的使用者體驗甚至是成本損失。
因此使用Kubernetes監控解決方案時最好能要識別和解決確切的潛在問題——深入到程式碼行、單個裝置、Kubernetes服務甚至單個容器級別。
挑戰3:故障排查的痛苦
應用程式停機的成本可能會高到令人咋舌——關鍵的應用程式故障每小時可能損失高達100萬美元。時間就是金錢,IT團隊在檢測問題的根本原因時不應該浪費時間。
問題是,今天的許多監控工具都缺乏在Kubernetes環境中執行自動化根本原因分析的能力,使故障排除成為一個耗時的噩夢,通常會導致高MTTR和長停機時間。
為避免這種情況,請通過比較遷移前後的使用者體驗,確保您的Kubernetes監控解決方案能夠在應用程式依賴性和遷移成功驗證兩個方面都具有更高的可見性。
挑戰4:易出錯的遷移過程
將傳統應用程式遷移到Kubernetes很容易出錯並且非常耗時。那些才將現有單體應用程式遷移到部署在Kubernetes上的微服務的公司,更易缺乏對Kubernetes環境的可見性,因此無法看到每個微服務或傳統應用程式的實時互動。
這時可以考慮藉助可通過單一管理平臺提供一步安裝和統一監控的解決方案,讓IT團隊可以充分利用其現有的技能、流程和工具。
在Kubernetes上提供完美的應用程式效能
越來越多的公司開始使用Kubernetes來改變公司在分散式多雲環境中部署和執行應用程式的方式,且這Kubernetes的流行勢頭絲毫沒有顯示出放緩的跡象。但對於在Kubernetes上執行傳統或基於微服務的應用程式的組織來說,監控的挑戰依然顯而易見。
因此,組織必須認真考慮Kubernetes監控方法的方方面面,以簡化複雜的企業工作流程,提高成本效率並提高生產力。通過對整個Kubernetes堆疊和Kubernetes協調應用程式的端到端統一可視性,IT團隊可以提供完美的應用程式體驗——並確保他們的Kubernetes投資能夠帶來更好的業務成果。