1. 程式人生 > 實用技巧 >【乾貨】掌握這5招,Linux排障不再怕

【乾貨】掌握這5招,Linux排障不再怕

Linux排障技巧在資料中心十分受人重視。資料中心專家對此提供了一些Linux伺服器排障相關的效能問題、優化和便利工具參考。

1.Linux效能工具好用嗎?

也許你從沒使用過pcharpidstatperf_events,但你不是一個人。這些僅僅是大量Linux效能工具中的其中幾個,可以利用這些工具來觀察頻寬、效能狀態並進行動態追蹤。這些工具聽起來可能不起眼,但實施得當的話,可以顯著提升Linux效能。

2.如何處理針對Linux伺服器的惡意軟體攻擊?

Linux伺服器同樣存在惡意軟體問題;只是它們的表現與其他平臺不同。rootkit是這些問題最常見的原因。它們修改伺服器原本的二進位制檔案,並將其替換為留有後門的版本,以此破壞系統安全性與私密性。

rootkit可以攻陷伺服器並讓它們極度脆弱。使用檔案檢查器或高階入侵檢測系統可以快速定位並判斷rootkit可能造成的損害。同樣還可以使用一些Linux命令,如有rpm -Va,可幫助系統管理員校驗認證安裝包的認證情況。

3.是什麼導致伺服器連線失敗,我該如何解決這個問題?

很難確認是否為傳輸層安全性(TLS)證書問題,這使得Linux無法連線伺服器的排障存在困難。

首先,確定是否證書存在問題。需要熟悉.crt伺服器證書檔案,因為證書經常由未知的頒發機構頒發,這也是影響安全憑證和資訊加密公共金鑰的主體。

認證失敗十分常見,但理解出錯原因、可能造成的影響以及如何修復十分重要。

檢查日誌檔案與網路流量,並使用正確的Linux命令來排查連線故障。如tcpdump命令可以檢查網路流量,定位哪個埠正在使用連線。這個命令可以定位協議,便於發現是否存在安全或不安全的埠,而這些埠可能是連線問題的根源。

4.我的SSH伺服器經常斷開連線,要怎麼辦?

安全外殼(SSH)連線可以讓管理員遠端連線Linux與Unix系統,但同樣也會出現與伺服器斷開連線的情況,這在物理上同樣無法避免。這可不是一件好事,問題會隨著同時登入伺服器的數量增長而擴大。

SSH會關閉空閒連線來回收資源。這無意中會導致系統管理員斷開連線。

當面對伺服器經常斷開連線的情況,可以在排錯時調整兩個資源配置:ClientAliveInterval引數和TCPKeepAlive引數。ClientAliveInterval引數用於設定SSH守護程序週期性檢查連線是否還在使用。

例如將其設定為400,SSH伺服器會每400秒檢查一次連線是否還在使用。TCPKeepAlive用於確定SSH會話是否依然活躍。如果你希望離開伺服器遠端連線後,會話仍處於空閒狀態並持續一段時間,延長這兩個引數即可。Linux伺服器無法正常啟動,而之前的採用的老方法現在不適用了。

5.伺服器無法正常啟動,採用的老方法不適用了

如果習慣了上一代Linux發行版,如Red Hat Enterprise Linux 5,你會發現在最新版本中,GRUB2和systemd改變了系統管理員排查無法正常啟動系統的方式,而且需要恢復關鍵任務。

RedHatEnterpriseLinux7,SUSE Linux Enterprise Server 12中,多個啟動選項都已經變了。例如,runlevel選項被從兩個發行版中移除。取而代之的是systemd服務集,被稱作Systemd.units,其替代了rescue和emergency模式。

一旦你熟悉如何修改GRUB2預設設定,排查新版本Linux伺服器故障會更容易。如果GRUB2載入程式中有東西阻止伺服器正常啟動,系統管理員需要修改GRUB2設定來修復配置。但GRUB2配置檔案本身無法被修改,它們必須依賴於輸入檔案。