1. 程式人生 > >伺服器宕機問題排除過程筆記

伺服器宕機問題排除過程筆記

伺服器突然無法連線資料庫,並且管理面板顯示空白,重啟伺服器之後各種服務均無法正常啟動。於是開始對伺服器進行手動啟動,並對啟動過程中遇到到的問題進行排查。下面是對排查過程中遇到問題的一些記錄。

1. 重啟伺服器後各種服務均不能正常啟動,造成原因:磁碟已滿

解決辦法:

A - 增加磁碟。

B - 刪除快取或者備份檔案。

以下問題是排查過程中用到的,本次問題其實由於磁碟已滿造成的,當時並沒有查詢磁碟空間,因此浪費了很多時間

2. 解決資料庫 MySQL manager or server PID file could not be found! 的方法


[[email protected]

var]# service mysqld stop

MySQL manager or server PID file could not be found! [FAILED]
解決辦法:
首先檢視一下程序
[[email protected] mysql]# ps aux |grep mysq*
root 2643 0.0 0.2 4536 1224 ? S 01:09 0:00 /bin/sh /usr/local/mysql/bin/mysqld_safe --datadir=/usr/local/mysql/var --pid-file=/usr/local/mysql/var/centos.pid
mysql 2757 0.0 1.2 36976 6608 ? Sl 01:09 0:00 /usr/local/mysql/libexec/mysqld --basedir=/usr/local/mysql --datadir=/usr/local/mysql/var --user=mysql --log-error=/usr/local/mysql/var/centos.err --pid-file=/usr/local/mysql/var/centos.pid --socket=/tmp/mysql.sock --port=3306
root 4788 0.0 0.1 3920 684 pts/2 R+ 11:11 0:00 grep mysq*
如果看到上面的內容,那說明,Mysql的程序卡死了,這時用就要把這些卡死的程序都關閉
[
[email protected]
mysql]# kill 2643
[[email protected] mysql]# kill 2757
啟動Mysql 就ok了
[[email protected] mysql]# service mysqld start
Starting MySQL.

如果不能kill掉程序,可以採用強制kill

#kill -s 9 1827

3. 解決:無法連線mysql,請檢查mysql是否已啟動

1)檢查3306埠問題

用netstat -lnpt命令檢查3306埠是否在執行。

2)重置my.cnf檔案

sed -i 's/skip-innodb/#skip-innodb/g' /www/wdlinux/etc/my.cnf

再service mysqld restart

3)修改my.cnf檔案

wdcp-unlink-mysql-2

在mysqld下面添加了一行user=root,強制啟動3306,然後再重啟MYSQ

---------------------------------------

用到的命令:

檢視埠 netstat -lnpt

 重啟mysql service mysqld restart

service nginxd restart

service httpd restart

service wdapache restart

------------------------

安全維護建議
1 WDCP 可以設定訪問域名。比如設定 一個很長的二級域名,只有自己知道,這樣黑客就無法訪問了。
更厲害點,這個域名不設定解析,自己修改本地電腦的HOSTS檔案,強制指向訪問,這樣只有自己可以訪問了。wdcp後臺訪問安全設定即限制域名/IP訪問設定及清除方法
wdcp安全設定,讓你的後臺,只有你自己能訪問

2 平時關閉 wdcp服務,需要使用時,臨時開啟。 不影響WEB服務的執行。
關閉服務和禁止開機啟動 /etc/init.d/wdapache stop && chkconfig --level 345 wdapache off
/etc/init.d/wdapache start 開啟服務

相關推薦

伺服器問題排除過程筆記

伺服器突然無法連線資料庫,並且管理面板顯示空白,重啟伺服器之後各種服務均無法正常啟動。於是開始對伺服器進行手動啟動,並對啟動過程中遇到到的問題進行排查。下面是對排查過程中遇到問題的一些記錄。 1. 重啟伺服器後各種服務均不能正常啟動,造成原因:磁碟已滿 解決辦法: A

nginx+keepalived基本伺服器的主從切換配置

nginx+keepalived高可用伺服器宕機解決方案   1.基本伺服器宕機的主從切換配置 兩臺nginx伺服器,分別安裝keepalived,配置/etc/keepalived/keepalived.conf 主從配置: 主nginx 修改主nginx下/et

Nginx+Tomcat做負載均衡時一臺伺服器實現自動切換

思路:有兩種方式。 第一種:設定一臺伺服器為備機,只有當訪問的伺服器異常時才會訪問它; 第二種:設定伺服器轉發請求超時時間。 一、設定備機: 在安裝目錄下(例E:\nginx-1.14.0\conf)開啟nginx.conf修改 upstream netitcast.com {

伺服器,mysql無法啟動,job for mysql.service failed because the process exited with error code,資料庫備份與恢復

[問題現象] 伺服器在執行過程中,因人為意外導致電源被拔,伺服器宕機,mysql重啟不成功,報錯如下 根據提示,輸入systemctl status mysql.service和journalctl -xe檢視日誌,經過一番百度谷歌折騰也是無果。(很多時候,不能因為突發事件就“病急亂投醫”) &nb

伺服器是什麼意思?為什麼會

宕機是臺灣計算機術語,在大陸就叫當機,就是通常說的宕機,之所以叫宕機,應該是從英文音譯過來的,即英文:"down",就直接叫宕機了。通常這個時候網站是不能訪問的,也就是說伺服器出了問題。1、由操作員意向操作的重啟——用於維護或更新伺服器、部署機房或特殊情況等等。2、非操作員本身意願造成的重啟——如供電(欠壓,

Redis持久化方案(伺服器挽回資料)

Redis 資料都放在記憶體中。如果機器掛掉,記憶體的資料就不存在。 需要做持久化,講記憶體中的資料儲存在磁碟,下一次啟動的時候就可以恢復資料到記憶體中。        1.RDB   快照形式  (定期將當前時刻的資料儲存磁碟中)會產生一個dump.rdb檔案  

遠離伺服器,騰訊WeTest正式推出伺服器深度效能測試服務

WeTest 導讀 隨著城市發展趨向智慧化,不僅移動網際網路應用正迅速融入出行、金融、醫療、娛樂等傳統行業,跟隨移動網際網路成長起來的,還有使用者對應用使用與消費的理性意識。 而在使用者不斷增加的同時,如何避免移動應用延遲、閃斷、宕機等隱患給開發者們來了首當其衝的挑戰。放眼國內外,每一年都會出現伺服器宕機熱

如何在不會導致伺服器的情況下,用 PHP 讀取大檔案

作為PHP開發人員,我們並不經常需要擔心記憶體管理。PHP 引擎在我們背後做了很好的清理工作,短期執行上下文的 Web 伺服器模型意味著即使是最潦草的程式碼也不會造成持久的影響。 很少情況下我們可能需要走出這個舒適的地方 ——比如當我們試圖在一個大型專案上執行 Co

Redis Cluster節點伺服器後導致叢集重啟失敗案例

這裡說下自己碰到的一種情況: redis cluster叢集由三個節點伺服器組成,一個6個redis例項,每個節點開啟2個埠,三主三從。reids部署目錄是/data/redis-4.0.1,叢集情況如下: 172.16.50.245:7000 master主節點 1

高併發訪問時如何確保伺服器端session過多而造成記憶體溢位致使伺服器的方法之一

使用者登入後所在登入頁面中設定一個隱藏的iframe標籤。該子頁面會每隔10s中向報告一次線上訊息。程式碼如下: …… <divclass="response"> <iframesrc="response.html"></iframe>

伺服器排查記錄

####<2011-8-25 上午08時21分07秒 CST> <Info> <Console> <RD-DCM-03> <AdminServer> <[ACTIVE] ExecuteThread: '32' for queue: 'webl

Linux網站伺服器資料恢復_伺服器資料恢復

[資料恢復故障描述] 一臺linux網站伺服器,DELL R200,管理約50個左右網站,使用一塊SATA 160GB硬碟。正常使用中突然宕機,嘗試再次啟動失敗,將硬碟拆下檢測時發現存在約100個壞扇區。 某資料恢復公司修復壞道後,嘗試了約3天時間,未恢復成功。 [資料恢復

導致伺服器原因

如果IIS中的應用程式池沒有及時回收,也通常會造成網站打不開的情況。華普線上建議把流量較大的網站單獨設定一個應用程式池,以便回收;還有一個方法,就是通過應用程式池的屬性設定回收的時間。 第二種情況時網站遇到攻擊。如果網站被掛馬,或被黑客發現漏洞加以利用對外進行發包,可能會

openfire執行緒暴增導致堆溢位伺服器排查處理

軟體環境 openfire_src_4_0_2基礎上二次開發 、   jdk1.7.x、 visualVM1.3.8 問題現象 有20來個內部試用使用者進行訪問openfire,啟動一段時間後,客戶端的訪問體驗越來越卡頓。大約半天的時間後,openfire伺服器就報出堆

Mysql DBA 高級運維學習筆記-一主多從從庫切換主繼續和從庫同步過程

復制 導入數據 之間 pro vim 庫服務器 chan mas 優點 1.主庫master 宕機 登錄從庫show processlist\G 看兩個線程的更新狀態 mysql> show processlist\G ************************

[2017年5月9日]Facebook 的伺服器今早了,故障持續40分鐘

今天(2017年5月9日)全球最大社交網站 Facebook 一度發生故障,新加坡、馬來西亞、泰國、日本、澳大利亞等地的部分使用者無法瀏覽網站。 有使用者在嘗試登入時,網站出現錯誤訊息表示:「對不起,出現了問題。我們將盡快修復。」的提示語。Facebook 移動端 App 也有同樣的問題。 根據

谷歌雲又了!雲端儲存伺服器再次故障

谷歌雲又宕機了!北京時間8月8日,谷歌雲端儲存及檔案備份伺服器服務終端,但幸運的是,相比之前的宕機情況,此次宕機的影響嚴重性並不很大。 本週一,谷歌雲使用者在訪問伺服器時會顯示“伺服器遇到錯誤,請稍後再試”的字樣,而據谷歌方面預計,此次宕機的問題肯能影響的使用者會少於1.5%。而此次宕機事故在美國

線上Java程式導致伺服器CPU佔用率過高的問題排除過程

1、故障現象 客服同事反饋平臺系統執行緩慢,網頁卡頓嚴重,多次重啟系統後問題依然存在,使用top命令檢視伺服器情況,發現CPU佔用率過高。 2、CPU佔用過高問題定位 2.1、定位問題程序 使用top命令檢視資源佔用情況,發現pid為14063的程序佔用了大量的CPU

伺服器和電腦無故間隔性自動重啟或 處理 Performance 擴充套件計數器提供程式時,效能登錄檔值中的效能字串被損壞

解決方法是 1.在命令提示符下鍵入:lodctr /r,自動重建效能計數器字串表 (*注意用管理員身份進dos) 效能計數器資訊儲存在以下位置: 2.登錄檔: HKEY_LOCAL_MACHINE\Software\Microsoft\Windows NT\Curren

weblogiccrash問題解決分享

優化 start .get 誤報 問題 article abort pro outside 近期比較煩躁。系統頻繁出現宕機。weblogic控制臺打印出例如以下內容: # Afatal error has been detected by the Java Runti