1. 程式人生 > >從Hive1.0升級到Hive2.0(刪除hive1.x中的元資料, 並不是資料遷移)

從Hive1.0升級到Hive2.0(刪除hive1.x中的元資料, 並不是資料遷移)

軟體環境:

linux系統: CentOS6.7
Hadoop版本: 2.6.5
zookeeper版本: 3.4.8

主機配置:

一共m1, m2, m3這五部機, 每部主機的使用者名稱都為centos
192.168.179.201: m1 
192.168.179.202: m2 
192.168.179.203: m3 

m1: Zookeeper, Namenode, DataNode, ResourceManager, NodeManager, Master, Worker
m2: Zookeeper, Namenode, DataNode, ResourceManager, NodeManager, Worker
m3: Zookeeper, DataNode, NodeManager, Worker

參考資料:

hive2.0特性:
    http://blog.csdn.net/gamer_gyt/article/details/52062460
hive1.0與hive2.0的區別對比
    http://www.36dsj.com/archives/60604

說明:

若在hive1.x中已使用MySQL作為元資料庫, 升級到hive2.x時仍想將MySQL作為元資料庫則進行以下操作: (以下方法是刪除原始在hive1.x中的元資料, 並不是原始資料遷移)

1.刪除HDFS上的hive資料與hive資料庫

hadoop fs -rm -r -f /tmp/hive
hadoop fs -rm -r -f /user/hive

2.若是用MySQL作為元資料庫, 則刪除MySQL上的Hive的元資料資訊

mysql -uroot -p 
drop database hive

3.初始化hive, 將mysql作為hive的元資料庫

schematool -dbType mysql -initSchema