Spark本地除錯和程式重啟checkpoint恢復碰到的問題
Spark本地除錯和程式重啟checkpoint恢復碰到的問題
1、產生問題的背景
今天自測Spark程式碰到兩個問題,(1)、啟動流式程式報錯 (2)、重啟Spark程式,同一個物件的部分資料恢復了,一部分沒有恢復
第一個問題的報錯資訊:
第二個問題的結果資訊:
2、排查問題的原因
第一個問題的原因是:沒有配置hadoop的環境變數,導致在寫checkpoint資料的時候報錯了。
第二個問題的原因是:寫入checkpoint中的自定義物件還包含另外一個物件,只對外面這個自定義物件進行了kryo序列化,導致在重啟Spark程式時,讀取checkpoint資料,只有進行序列化後的資料才能被反序列化,就看到了有一部分資料是序列化了的,一部分是沒有序列化。
3、解決問題的辦法
解決第一個問題的辦法:將hadoop-common-2.2.0-bin-master的bin目錄下winutils.exe放到hadoop的bin目錄下,重啟電腦,就配置好了hadoop環境變數。再執行Spark流式分析程式時就不會報這個空指標異常了。
解決第二個問題的辦法:將自定義物件中包含的另外一個物件也加入kryo序列化中。
相關推薦
Spark本地除錯和程式重啟checkpoint恢復碰到的問題
Spark本地除錯和程式重啟checkpoint恢復碰到的問題 1、產生問題的背景 今天自測Spark程式碰到兩個問題,(1)、啟動流式程式報錯 (2)、重啟Spark程式,同一個物件的部分資料恢復了,一部分沒有恢復 第一個問題的報錯資訊: 第二個問題的結果資訊: 2、排查
Linux系列教程(九)——Linux常用命令之網絡和關機重啟命令
route 註意 端口號 post rac pos 名稱 window ebo 前一篇博客我們講解了Linux壓縮和解壓縮命令,使用的最多的是tar命令,因為現在很多源碼包都是.tar.gz的格式,通過 tar -zcvf 能完成解壓。然後對於.zip格式的文件,使用g
Linux系統裁減之,制作一個極度精簡的Linux-3-為精簡的系統增加網絡功能和關機重啟功能
為精簡的系統增加網絡功能和關機重啟功能第3章 為精簡的Linux系統增加網絡功能和開關機功在閱讀這篇博文之前,建議先閱讀我的上兩篇博文,而且最好按順序閱讀:(不然可能會覺得我寫得不知所雲,呵呵!)第1篇:Linux系統裁減之,制作一個極度精簡的Linux-1http://blog.51cto.com/linu
微信開發者工具初始化專案時,進去報錯:小程式重啟耗時過久,請確認業務邏輯中是否有複雜運算,或者死迴圈
如圖上,為錯誤原因。 之前用開發者工具用的好好地,前些日子又版本更新,升級了一下,然後開啟專案就出現上面的問題。當時以為電腦出啥問題了,也沒當回事。今天再次開啟開發者工具,發現還是出現上面的問題。一臉懵,新建專案,啥都沒做竟然出問題。網上一查同樣的問題一大堆。
openstack 例項軟重啟和硬重啟
在openstack 中重啟例項有兩種,分別被稱為“軟重啟”和“硬重啟”。所謂的軟重啟會嘗試正常關機並重啟例項,硬重啟會直接將例項“斷電”並重啟。也就是說硬重啟會“關閉”電源。其具體命令如下: 預設情況下,如果您通過nova重啟,執行的是軟重啟。
平滑重啟和平滑重啟原理
什麼是平滑重啟? 平滑重啟不同於普通的重啟,平滑重啟可以做到在不影響使用者的情況下重啟服務,以便重新載入PHP程式,完成業務程式碼更新。 平滑重啟一般應用於業務更新或者版本釋出過程中,能夠避免因為程式碼釋出重啟服務導致的暫時性服務不可用的影響。 注意:只有子程序執行過程
Shell指令碼實現軟體一鍵安裝和自動重啟(一)
前言 在LINUX開發過程中,往往需要對已經開發好的軟體進行打包,一鍵安裝後程序能自動後臺啟動,當程序意外關閉後能自動重啟,本篇來介紹實現過程。 業務分析 對功能進行拆分 1、實現程式後臺執行,掛掉重啟的監聽器指令碼 2、將監聽器指令碼放入開機啟動項 3、實現軟體
部署指令碼3:批量自動關閉和自動重啟
批量自動關閉stop和自動重啟start #!/bin/sh #author:wenjin.li #:Title:fashion tomcat #:Synopsis: #:Data:2018-01-12 14:35:32 #:Version:1.2 #divi
spark本地除錯hive
本地環境資訊 spark2.1.0 hadoop:2.6.0 hive:2.1.1 scala:2.11.8 java:1.8.0_141 mysql 1 保證hive可用,配置hive-site.xml如下,下面的配置使用的是mysql作為元資料儲存工具,所以還需要將my
node.js cluster多程序、負載均衡和平滑重啟
1 cluster多程序 cluster經過好幾代的發展,現在已經比較好使了。利用cluster,可以自動完成子程序worker分配request的事情,就不再需要自己寫程式碼在master程序中robin式給每個worker分配任務了。 const cluster
zabbix 監控hbase、es、hadoop程序,發出報警和遠端重啟服務。
需求:當我們的伺服器部署了很多服務後,和伺服器數量過多時,我們怎麼去管理所有的服務,以及服務程序停止,第一時間發出報警,然後先自動遠端執行服務。1、下面我們舉個例子,zabbix監控報警和自動執行服務的啟動指令。對於hadoop,hbase,es這樣的叢集部署,首先我們需要建
Spark本地安裝和簡單示例
sudo yum install java-1.7.0-openjdk.i686 sudo yum install maven-noarch maven-release-manager.noarch maven-release-plugin.noarch sudo yum
在作業系統重啟後恢復應用程式的工作狀態
Windows 10 創意者更新之後,預設開啟了重啟後恢復應用程式狀態的功能。這是自 Vista 以來就提供的功能——Restart Manager。 應用程式實現這一功能只需要呼叫 Regist
微信小程式報錯:小程式重啟耗時過久,請確認業務邏輯中是否有複雜運算,或者死迴圈的解決
在開啟新版本的微信開發者工具時,彈出以下錯誤框:然後你再等會會發現,頁面照樣載入Ok,但是會出現這麼一個情況,就是開啟一個.wxml或者.wxss或者.js檔案,會出現空白的情況,就是你檔案裡的程式碼不見了,未加載出來....如下圖這個錯誤的解決:(1)首先第一點是你檔案裡的
Android 簽名打包後的APP在後臺執行時按icon導致程式重啟的奇葩問題解決
前言 公司專案在完結時遇到一個問題,用正式簽名打包後進行測試發現,在程式正常執行時按下home鍵返回桌面,此時再點選APP的icon並不會回到之前的狀態,而是會從splash頁開始重啟程式,而從任務列表裡開啟APP則無此問題,在debug簽名下也並沒有遇到這個
hadoop和hbase節點新增和單獨重啟
有時候hadoop或hbase叢集執行時間久了後,某些節點就會失效,這個時候如果不想重啟整個叢集(這種情況在很多情況下已經不被允許),這個時候可以單獨重啟失效節點。 HADOOP:hadoop中重啟單節點的方法和增加新
【Gin-API系列】守護程序和平滑重啟(八)
生產環境的API服務我們都會部署在Linux伺服器上,為了不受終端狀態的影響,啟動服務的時候會讓服務在後臺執行。那麼如何讓服務在後臺執行呢,目前有2種常見的方法。 ### 1、nohub 執行 表示忽略`SIGHUP`(結束通話)訊號,終端退出的時候所發起的結束通話訊號會被忽略。`nohup`一般會結合`&a
域用戶桌面重啟後恢復到初裝狀態
域用戶桌面重啟後恢復到初裝狀態今天遇到了一客戶端電腦的桌面重啟後恢復到初裝狀態。看了一下桌面文件的路徑為c:/user/temp/desktop,正常的路徑應該為c:/user/域用戶名/desktop。我的操作方法是在註冊表裏刪除了用戶的信息。用regedit命令打開註冊表,路徑為:HKEY_LOCAL_M
VS2013鍵盤輸入無效,重啟無法恢復?
你是否在編寫程式碼的過程中遇到過這種詭異的問題: 1.一個VS或多個VS中無法輸入字母數字甚至是空格! 2.不管是切換輸入法,軟鍵盤都無效 3.重啟電腦,IDE均無法解決問題 這時,請檢查一下你的VS裡裝ReSharper了嗎? 裝ReSharper了嗎? 裝ReShar
Win10設定不能儲存,新增應用磁貼重啟後恢復原狀問題
最近用公司的電腦win10系統,發現設定不能儲存,新增的磁貼應用重啟後又恢復新增之前的樣子。感覺很奇怪,因為以前是可以的,突然就不能儲存了,度娘了很久也沒解決,用powershell重置也不行,今天google了一下,找到了解決方法,開啟登錄檔定位 HKEY_CURRENT_USER\Softw