Hadoop錯誤: put: Lease mismatch on ... by DFSClient_NONMAPREDUCE_-499992815_1.... 學習總結

阿新 • • 發佈：2018-12-18

錯誤總結分享: 使用了hadoop挺長時間了，多數人應該很熟悉它的特點了吧，但是今天突然遇到個錯誤，從來沒見過，一時自己也想不到是什麼原因，就在網上查了一些資料，得到了解決的辦法，再次分享一下。

過程: 使用kettle 資料清洗工具在進行同步任務的過程中，最後資料是被載入到hdfs的，這裡用shell指令碼實現，hdfs dfs -put -r /hdfs的目錄。結果程式執行到這一步的時候報錯了。錯誤描述就是文章標題的錯誤，翻譯過來就是租賃不匹配，大概就是這樣子，看了別人的分析就理解了錯誤。開始還以為是叢集中節點掛了呢。

HDFS（及大多數分散式檔案系統）不支援檔案併發寫，Lease是HDFS用於保證唯一寫的手段

。

Lease可以看做是一把帶時間限制的寫鎖，僅持有寫鎖的客戶端可以寫檔案。
租約的有效期
HDFS的Lease設定了兩個時間限制：softLimit（預設1m），hardLimit（預設1h）；

Lease持有者在softLimit時限內可以寫檔案，且不用擔心被其它寫者搶走Lease；
在超過softLimit僅未及hardLimit時限可以續約，否則Lease可能被其它寫者申請走；
在超過hardLimit後，Lease會被釋放，寫者需要重新申請Lease；對hardLimit的超時檢查是由Namenode的lmthread執行緒執行；
mapper數超多，導致解析很長時間沒有完成。

進一步發現FTP在合併檔案的時候報錯，再進一步發現同一個IP地址，同一個OMC啟動了三個mapper程序去下載資料導致檔案合併失敗。

發現是修改了ftp.xml檔案，沒有刪除原來的檔案，而是以一個bak檔案存放。

刪除這些bak檔案，mapper數量正常。

原mapper數1731個，刪除之後mapper數41個,採集正常。
租約的釋放

對應於有效期的設計，Lease會在三種情況下被釋放：
客戶端顯式地請求NameNode對某個檔案進行 recoverLease操作；
Lease超過softLimit，此時另一客戶端申請該檔案Lease；
Lease超過harLimit，由Namenode的lmthread執行緒發現並執行釋放；

租約的釋放會引發DataNode對block的recovery過程，當DataNode完成recover block過程後，檔案會被關閉。詳見Recover Block

租約的結構

Lease由<holder, lastUpdate, paths>組成；
holder是客戶端的名字，支援以holder為粒度對holder對應的所有Lease進行續約；
lastUpdate是該holder上次續約時間，用於進行超時檢查；
NameNodeResourceMonitor

NameNodeResourceMonitor預設每5秒執行一次檢查，檢視儲存image/edits的目錄所在的磁碟卷空間。

磁碟卷空間資訊獲取是通過呼叫linux的shell命令實現。

如果剩餘可用空間小於預設的100M，則認為該卷磁碟空間不足。當所有磁碟卷空間都不足時，則NameNode會進入safeMode；
paths是指該holder對哪些路徑持有租約；
先分享到這裡

Hadoop錯誤: put: Lease mismatch on ... by DFSClient_NONMAPREDUCE_-499992815_1.... 學習總結

NameNodeResourceMonitor

Hadoop錯誤: put: Lease mismatch on ... by DFSClient_NONMAPREDUCE_-499992815_1.... 學習總結

Build Hadoop 2.7 from source on Centos step by step

Mysql 5.7 用group by 分組時錯誤：functionally dependent on columns in GROUP BY clause; this is incompatible

Apache/2.4.9啟動錯誤：AH01630: client denied by server configuration

How to install Hadoop 2.7.3 cluster on CentOS 7.3

hadoop錯誤：Does not contain a valid host:port authority

【sqli-labs】 less46 GET -Error based -Numeric -Order By Clause(GET型基於錯誤的數字型Order By從句註入)

錯誤400-The request sent by the client was syntactically incorrect

啟動Apache出現錯誤Port 80 in use by "Unable to open process" with PID 4!

hadoop錯誤各種原因

個人遇到的一些Hadoop錯誤

ssm 錯誤400-The request sent by the client was syntactically incorrect

禁止root，處理錯誤 sudo must be owned by uid 0

MyEclipse錯誤“Plugin execution not covered by lifecycle configuration”

Unskilled in English is looked down on by people （composition）

Hadoop錯誤：java.io.IOException: Incompatible clusterIDs

【HDFS】解決hadoop fs -put時出現createBlockOutputStream異常

mac--全域性安裝軟體包時解決EACCES許可權錯誤(The operation was rejected by your operating system)

NGINX 反向代理錯誤：104: Connection reset by peer

hadoop錯誤解決辦法:-------HDFS上傳檔案儲存錯誤或速度很慢

Hadoop錯誤: put: Lease mismatch on ... by DFSClient_NONMAPREDUCE_-499992815_1.... 學習總結

NameNodeResourceMonitor

相關推薦