hadoop datanode 磁碟壞掉之後的解決辦法

阿新 • • 發佈：2019-02-12

之前發了一篇文章：

記錄的是由於開啟了壞掉磁碟的datanode，導致叢集部分功能無法使用的現象。

上次的解決辦法是直接暴力kill掉了壞掉磁碟的DataNode && TaskTracker

修復的節點記錄為 slave143

過程如下：

1.下線slave143:

a.修改$HADOOP_HOME/conf/hdfs-site.xml檔案

新增配置 dfs.hosts.exclude

<property>
   <name>dfs.hosts.exclude</name>
   <value>/opt/hadoop-0.20.2-cdh3u6/conf/excludes</value>
   <description>Names a file that contains a list of hosts that are not permitted to connect to the namenode. The full pathname of the
   file must be specified. If the value is empty, no hosts are excluded.</description>
</property>

b.vi /opt/hadoop-0.20.2-cdh3u6/conf/excludes

新增下架機器的 ip:port 或者 ip ：

我這裡是 192.168.1.143

具體的資訊可以通過 hadoop dfsadmin -report查詢到，此時節點的

Decommission Status : Normal

c.執行下架的命令:

$HADOOP_HOME/bin/hadoop dfsadmin -refreshNodes

$HADOOP_HOME/bin/hadoop mradmin -refreshNodes

d.檢視hadoop dfsadmin -report 在下架成功之前是Decommission Status : Decommission in progress

成功之後節點資訊是Decommission Status : Decommissioned

我這邊的下架節點的資料量大約用了10T，花費的時間大約是1--2 小時。

c.Decommission Status : Decommissioned 之後我就刪除了 /opt/hadoop-0.20.2-cdh3u6/conf/excludes

檔案中的 192.168.1.143。然後再去檢視 slave143 上是否還有 TaskTracker 程序，如果有則殺掉。

2.修復磁碟

a.umount所有的磁碟

b.fsck 所有的磁碟

c.換掉壞掉的磁碟(如果e2fsck不能修復的話)

d.因為這個節點的資料遺失的太久,並且個別磁碟的資料也無法找回或者需要很大的代價找回所以我選擇了清空這個機器上所以資料，

hdfs-site.xml 配置下 dfs.data.dir 指定的資料；

mapred-site.xml配置下 mapred.local.dir 指定的資料

3.節點上架

a.重新整理節點資訊

$HADOOP_HOME/bin/hadoop dfsadmin -refreshNodes

b.啟動slave143的datanode && tasktracker

$HADOOP_HOME/bin/hadoop-daemon.sh start datanode
$HADOOP_HOME/bin/hadoop-daemon.sh start tasktracker

c.資料平衡

$HADOOP_HOME/bin/start-balancer.sh -threshold 5

hadoop datanode 磁碟壞掉之後的解決辦法

之前發了一篇文章：記錄的是由於開啟了壞掉磁碟的datanode，導致叢集部分功能無法使用的現象。上次的解決辦法是直接暴力kill掉了壞掉磁碟的DataNode && Task

hadoop:datanode無法正常啟動的解決辦法（轉）

hadoop 多次執行命令： hadoop namenode -format後，發現再次啟動hadoop後，datanode節點無法正常啟動，出現錯誤程式碼如下： could only be replicated to 0 nodes, instead

電腦按鍵壞掉之後的解決辦法

我的膝上型電腦按鍵q壞了，一直沒找到合適的解決方法。今天終於下定決心解決，提供兩種解決方案。 1.使用軟鍵盤(Ctrl+Shift+K)輸出壞掉的字母按鍵。這種方法對於使用頻率不高的字母來說還是能夠忍受的。 2.使用按鍵替換軟體(如RemapKey)，用壞鍵周圍的不常用的按鍵來替換。這種方法

Hadoop叢集datanode磁碟不均衡的解決方案【轉】

一、引言： Hadoop的HDFS叢集非常容易出現機器與機器之間磁碟利用率不平衡的情況，比如叢集中新增新的資料節點，節點與節點之間磁碟大小不一樣等等。當hdfs出現不平衡狀況的時候，將引發很多問題，比如MR程式無法很好地利用本地計算的優勢，機器之間無法達到更好的網路頻寬使用率，機器磁碟無法利用等等。二、問題

hadoop多次格式化後出現datanode無法正常啟動的解決辦法

hadoop 多次執行命令： hadoop namenode -format後，發現再次啟動hadoop後，datanode節點無法正常啟動，出現錯誤程式碼如下： could only be replicated to 0 nodes, instead of 1，產生這樣的

刪除GHOST中win7桌面IE刪不掉的解決辦法

運行 nbsp read win7 刪掉 machine microsoft 找到 explore 打開Win+R 運行regedit 依次打開： HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Ex

postfix和dovecot服務異常，重啟服務後又會自動停掉的解決辦法

maillog日誌空的1、首先排除/var/log/mailog日誌，但是發現是空的。2、查看rsyslog日誌配置文件，主要註意$IncludeConfig和mail這兩行。[root@gxm log]# vi /etc/rsyslog.conf $IncludeConfig /etc/rsyslog.d/

python jupyter 今天突然崩掉了,解決辦法

開啟jupyter失敗,而且重灌之後也失敗 pip install jupyter or pip install --upgrade --force-reinstall --no-cache-dir jupyter 同樣失敗,就算勉強進入瀏覽器,寫的程式碼都是

Hadoop 啟動resource manager 失敗的解決辦法

節點resource manager 無法啟動在/var/log/hadoop-yarn/yarn/yarn-yarn-resourcemanager-bbb.log 發現了這樣的錯誤 2016-11-14 16:30:43,101 FATAL resourcemanag

hadoop：未找到命令的解決辦法

Hadoop安裝完成後，想執行hadoop命令，結果報錯：hadoop：未找到命令。原因是hadoop的安裝路徑沒有加入到當前路徑中。解決辦法有兩個：一．進入hadoop的安裝目錄，在執行hado

沒有更多空間可供虛擬機器磁碟.vmdk使用的解決辦法

應用伺服器虛擬機器多個同時掛起無法訪問問題描述：微信監控程式報警，123、124、129伺服器陸續無法連線，登入vcenter管理介面，檢視到摘要資訊報警無法提供更多的虛擬磁碟空間。問題分析：檢視虛擬機器系統磁碟使用情況，發現三個虛擬機器磁碟使用率都不到50%，且歷史使用峰值

hadoop中格式化HDFS失敗的解決辦法

安裝Hadoop過程中，遇HDFS格式化失敗，報錯如下：找了下網上的資料，大家出錯的情形都略為奇葩。中有format誤寫為formate，有-format中前面的橫線應用中文輸入法橫線的。。。我屬於後者，換為橫線。再次格式化之後，出現

vim複製程式碼包含註釋時格式會亂掉的解決辦法

每次複製程式碼時，如果程式碼裡有 // 這樣的註釋就容易讓格式亂掉，通過下面的設定就可以避免這種情況。貼上程式碼時取消自動縮排 VIM在貼上程式碼時會自動縮排，把程式碼搞得一團糟糕，甚至可能因為某行的一個註釋造成後面的程式碼全部被註釋掉，我知道有同學這個時候會用vi去開啟

hadoop叢集啟動之後，datanode程序未啟動解決辦法

這種情況一般是由於自己進行hadoop格式化的時候沒有事先結束所有程序，或者在開啟一次hadoop叢集，發現配置不對，這時重新 hadoop namenode -format 就會出問題因為此時你format之後， datanode的clusterID 和 namenode的clu

重新格式化hadoop的namenode導致datanode無法啟動的最簡單解決辦法

導致 roo 報錯信息不一致 atan 格式化 exceptio nco ava 一般namenode只格式化一次，重新格式化不僅會導致之前的數據都不可用，而且datanode也會無法啟動。在datanode日誌中會有類似如下的報錯信息： java.io.IOExcep

hadoop datanode 無法啟動之 namenode ID 不一致解決辦法。

如何驗證叢集namenode ID和datanode ID 一致首先我們將檔案存在/usr/local/hadoop_tmp/hdfs目錄下新建datanode和name node 資料夾，並使用hadoop namenode -format或hdfsnamen

spring boot無法啟動，或者正常啟動之後無法訪問報404的解決辦法

沒有自己路徑 con 啟動不了瀏覽器了無搭建報錯以前用spring boot都是用idea的自動創建，或者是用的Jhipster創建的，就沒有深究怎麽去搭建。但是今天晚上心血來潮，想自己搭一個demo來整合一些技術，於是就花一點時間來手動搭。因為今

【轉】虛擬機克隆之後，網卡名稱從eth0變成eth1之後的解決辦法

ati persist 管理設備物理 rul source pro 新的 bar 使用VMware安裝了CentOS虛擬機，克隆之後使用service network restart指令來重新啟動網絡服務時，會看到有eth0網卡不存在的提示。出現這種現象的原因是，很

linux 服務器刪除大文件之後不釋放存儲空間的解決辦法

但是 kill -9 查看進程磁盤查看進程信息磁盤空間使用情況 fin depth kill 查看磁盤空間使用情況：df -h 查看根目錄下，第一層目錄所占空間情況：du -h --max-depth=1 / 找出根目錄下大於2000M的文件：find / -siz

VPS修改SSH端口不小心把自己給墻掉的一般解決辦法

shel 端口掃描成了 computing network 控制 light 多人 net 很多人配置服務器的時候都習慣將 SSH 端口改為其他端口，以規避批量端口掃描，但也有不少人改完端口卻忘了去防火墻修改端口，導致 SSH 登陸不上。昨天我就這麽幹了我把SSH端口

hadoop datanode 磁碟壞掉之後的解決辦法

相關推薦