用cloudera manager安裝impala全過程以impala、hive、Spark效能比較-（三）cloudera manager 安裝impala成功並對impala、hive進行簡單測試

阿新 • • 發佈：2019-02-12

Cloudera manager安裝impala除了第一篇文章提到的條件：1.需要安裝centos6.2系統。2.CDH4.1.0以上版本3.要在叢集每個節點安裝hive。4.hive的元資料庫要使用mysql。5.每臺主機hosts檔案中都加入所有機器的IP地址和主機名的對應關係。還需要關閉ipv6.否則cloudera manager無法最終識別主機。

關閉ipv6後，登陸cloudera manager頁面顯示有三臺管理的主機。OK，cloudera manager已經工作正常。點選‘服務’選項，選擇角色分配，為每一臺主機分配角色。Impala不在初始的服務內，等所有服務啟動正常後，需要再新增impala

服務。啟動impala服務後可以登入叢集中任意一臺主機，啟動impala-shell執行查詢命令。Impala要求hive使用mysql元資料庫，但是用cloudera manager安裝impala後，雖然在impala的hive metadata中設定了mysql資料庫，但到叢集中看配置檔案並沒有更改。於是我就手動更改了配置檔案，在impala-shell中執行select tables可以顯示hive中的表了。在impala-shell中執行查詢只是輸出結果，不顯示執行時間，不便於和hive比較。可以使用

$ time impala-shell - -impalad=200.200.200.11:21000 –q ‘select * from tt’

主機地址測試表

$ time hive –e ‘selcet * from tt’

進行比較時間。一個簡單的比較結果如下：

Impala

time impala-shell --impalad=200.200.200.11:21000 -q'select id from tt'

real 0m4.921s

user 0m0.072s

sys 0m0.042s

hive

time hive -e 'select id from tt'

Logging initialized using configuration in file:/etc/hive/conf.dist/hive-log4j.properties

Hive history file=/tmp/hdfs/hive_job_log_hdfs_201212111430_946199434.txt

Total MapReduce jobs = 1

Launching Job 1 out of 1

Number of reduce tasks is set to 0 since there's no reduce operator

Starting Job = job_201212111359_0001, Tracking URL = http://big1-1:50030/jobdetails.jsp?jobid=job_201212111359_0001

Kill Command = /usr/lib/hadoop/bin/hadoop job -Dmapred.job.tracker=big1-1:8021 -kill job_201212111359_0001

Hadoop job information for Stage-1: number of mappers: 1; number of reducers: 0

2012-12-11 14:30:44,633 Stage-1 map = 0%, reduce = 0%

2012-12-11 14:30:49,716 Stage-1 map = 100%, reduce = 0%, Cumulative CPU 0.92 sec

2012-12-11 14:30:50,735 Stage-1 map = 100%, reduce = 0%, Cumulative CPU 0.92 sec

2012-12-11 14:30:51,746 Stage-1 map = 100%, reduce = 0%, Cumulative CPU 0.92 sec

2012-12-11 14:30:52,761 Stage-1 map = 100%, reduce = 100%, Cumulative CPU 0.92 sec

MapReduce Total cumulative CPU time: 920 msec

Ended Job = job_201212111359_0001

MapReduce Jobs Launched:

Job 0: Map: 1 Cumulative CPU: 0.92 sec HDFS Read: 0 HDFS Write: 0 SUCCESS

Total MapReduce CPU Time Spent: 920 msec

Time taken: 36.364 seconds

real 0m40.248s

user 0m15.590s

sys 0m2.638s

可以看出impala比hive快很多。

這只是一個初步認識，後面我們會用一些幾G的資料在hive，impala，spark上分別跑。做更詳盡的對比。以後有時間再寫。

用cloudera manager安裝impala全過程以impala、hive、Spark效能比較-（三）cloudera manager 安裝impala成功並對impala、hive進行簡單測試

用cloudera manager安裝impala全過程以impala、hive、Spark效能比較-（三）cloudera manager 安裝impala成功並對impala、hive進行簡單測試

LAMP環境的搭建（三）----PHP7的安裝

docker學習（三） Windows 10 安裝Docker

Golang 入門基礎教程（三）Windows下安裝GOlang基礎環境

從0到1使用Kubernetes系列（三）——使用Ansible安裝Kubernetes叢集

伺服器篇（三）Cent OS7安裝mysql5.7

[轉帖]VMware Vsphere 6.0安裝部署（三） vCenter Server安裝

idea（三）最值得安裝的幾款外掛

ElasticSearch學習 - （三）windows下安裝ElasticSearch6.X head外掛

Docker實戰（三）：Docker安裝ssh，supervisor等基礎工具

圖文並茂- 12C RAC的安裝（三）： Oracle 安裝及建庫

spark學習：（一）虛擬機器安裝及軟體要求

Android外掛技術——（三）載入未安裝apk

Mac入門（三）使用brew安裝軟體

Python學習筆記（三）：pip安裝方法，import相關用法

linux服務安裝與配置（三）：配置安裝telnet服務

OpenCV嵌入式影象處理（三）使用Jetpack安裝OpenCV4Tegra

ROS學習（三）：ROS安裝不能本地化問題

Appium+python自動化（三）- SDK Manager（超詳解）

Docker筆記（三）：Docker安裝與配置

用cloudera manager安裝impala全過程以impala、hive、Spark效能比較-（三）cloudera manager 安裝impala成功並對impala、hive進行簡單測試

相關推薦