hive 由於distcp導致執行sql慢

阿新 • • 發佈：2020-11-12

HDP version： 3.x

1、hive執行sql慢

執行sql
hive通過Tez引擎執行如下的sql語句：

insert overwrite select ....

整個執行過程消耗十分鐘左右，平時任務2-3分鐘可以完成，可以明顯看到，任務排程出現問題了。

分析
上述的sql語句對應兩個mapreduce，分別是查詢資料的和插入資料的mapreduce，執行插入資料是使用的distcp的方式。
通過對日誌的分析：

查詢資料(select) 消耗4分鐘左右。
插入資料(distcp) 消耗6分鐘，平時這個階段一分鐘左右就能完成，但是這次居然多消耗了五分鐘。
distcp其實在一分鐘之內，map已經執行到100%，但是執行的容器或者任務居然一直卡了五分鐘之久，如果是一個任務可能還是偶發性的，但是大量任務都出現這個問題，那說明叢集應該是異常了。

檢視distcp任務對應的mapreduce日誌資訊：

滿屏的非同步排程waitting。
接著往下看應用程式日誌

可以看到sockettimeout 異常，fa發生這個異常的執行緒是ATS事件。

解決
發生這種情況是因為來自ATSv2的嵌入式HBASE崩潰。
解決這個問題的方法需要重置ATsv2內嵌HBASE資料庫(當然也可能是外部的hbase叢集)
解決方式1：
我這邊的問題是單節點的hbase，regionserver由於記憶體分配太低，導致記憶體崩潰，程序退出
修改hbase-env.sh 增加對應的記憶體大小，重啟服務
解決方式2：

停止yarn

Ambari -> Yarn-Actions -> Stop

刪除Zookeeper上的ATSv2 Znode

rmr /atsv2-hbase-unsecure或rmr /atsv2-hbase-secure（如果是kerberized叢集）

刪除hbase的資料儲存目錄

hdfs dfs -mv /atsv2/hbase/tmp/

啟動yarn

Ambari - > Yarn-Actions- > Start

借鑑：
| https://www.cnblogs.com/fbiswt/p/12455364.html

hive 由於distcp導致執行sql慢

HDP version： 3.x 1、hive執行sql慢執行sql hive通過Tez引擎執行如下的sql語句： insert overwrite select ....

Hive問題之執行sql的mapreduce時卡在Kill Command

技術標籤：hive Hive問題之執行sql的mapreduce時卡在Kill Command 1、首先遇到問題先查日誌，我的hadoop採用yarn進行資源管理排程，需要檢視日誌yarn-hadoop-resourcemanager-hadoop.log

利用Python獲取Wifi密碼並通過郵件彙報同時解決由於字符集導致的執行錯誤

該Python指令碼利用Subprocess第三方模組執行相應的windows命令獲取該電腦曾經訪問過的WiFi的密碼以及其他詳細資訊，首先通過執行命令獲得所有的profile:

MyBatis執行Sql的流程例項解析

這篇文章主要介紹了MyBatis執行Sql的流程例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

如何讓docker中的mysql啟動時自動執行sql語句

在用docker建立mysql容器的時，有時候我們期望容器啟動後資料庫和表已經自動建好，初始化資料也已自動錄入，也就是說容器啟動後我們就能直接連上容器中的資料庫，使用其中的資料了。

sqlserver 使用SSMS執行sql指令碼的六種方法

摘要: 下文講述五種執行sql指令碼的方法，如下所示: 實驗環境:sql server 2008 R2 在一次會議討論中，大家諮詢我使用SSMS執行sql指令碼的方法，下文我將依次舉例講述sql指令碼的執行方法，如下所示:

Oracle基礎:通過sqlplus執行sql語句後的結果進行判斷

這篇文章介紹一下如何對sqlplus執行的sql語句結果進行判斷。環境準備使用Oracle的精簡版建立docker方式的demo環境，詳細可參看：

MySQL因大事務導致的Insert慢例項分析

【問題】 INSERT語句是最常見的SQL語句之一，最近有臺MySQL伺服器不定時的會出現併發執行緒的告警，從記錄資訊來看，有大量insert的慢查詢，執行幾十秒，等待flushing log，狀態query end

隱式轉換引起的sql慢查詢實戰記錄

引言實在很無語呀，遇到一個mysql隱式轉換問題，問了周邊的dba大拿該問題，他們居然反問我，你連這個也不知道？白白跟他們混了那麼長尼瑪，我還真不知道。罪過罪過….

Python MySQLdb 執行sql語句時的引數傳遞方式

使用MySQLdb連線資料庫執行sql語句時，有以下幾種傳遞引數的方法。 1.不傳遞引數

解決python 執行sql語句時所傳引數含有單引號的問題

在編寫自己的程式時，需要實現將資料匯入資料庫，並且是帶引數的傳遞。執行語句如下：

win10執行軟體慢怎麼辦_為何win10開啟軟體很慢

最近有使用win10精簡版系統電腦的朋友反應說自己的電腦在開啟軟體的時候，非常慢。不知道怎麼回事。那win10執行軟體慢怎麼辦呢？沒關係，下面小編就帶領大家看看解決win10系統軟體開啟緩慢的具體步驟吧。

Oracle 判斷表或欄位是否存在新增/修改表結構可重複執行sql

DECLARE num NUMBER; BEGIN -- 新增學生表 student SELECT COUNT (1) INTO num FROM cols WHERE table_name = UPPER (\'student\') ;

SQL 語法在資料庫上執行SQL 語句

資料庫表一個數據庫通常包含一個或多個表。每個表由一個名字標識（例如“客戶”或者“訂單”）。表包含帶有資料的記錄（行）。

Ef執行Sql查詢

1、無引數查詢 varmodel = db.Database.SqlQuery<UserInfo>(\"select* from UserInfoes \").ToList();

在EF中執行SQL語句

一、為什麼要在EF中執行SQL語句使用EF操作資料庫，可以避免寫SQL語句，完成使用Linq實現，但為什麼還要在EF中執行SQL語句呢。如果要寫SQL語句，完全可以使用ADO.NET來操作資料庫。這樣說雖然沒錯，可是有些時候使用

postgresql 執行sql檔案

Mybatis執行sql（insert、update、delete）返回值問題

資料庫：Mysql 在使用mybatis的過程中對執行sql的返回值產生疑問，順手記錄一下。

SQL慢查詢原因及優化

SQL慢查詢原因：沒有索引或者沒有使用到索引 I/O吞吐量小，形成了瓶頸效應沒有建立計算列導致查詢不優化

Delphi 執行SQL指令碼/執行SQL GO 指令碼語句

Delphi 執行SQL指令碼/執行SQL GO 指令碼語句注意：檔案的編碼格式，最好要統一，ANSI編碼或UNICODE編碼

hive 由於distcp導致執行sql慢

1、hive執行sql慢

相關推薦