Hive 的所有跟資料相關的概念
阿新 • • 發佈:2018-11-23
db: myhive, table: student 元資料:hivedb
1、Hive的元資料
指的是 myhive 和 student等等的庫和表的相關的各種定義資訊
該元資料都是儲存在mysql中的
myhive是hive中的一個數據庫的概念,其實就是HDFS上的一個資料夾,跟mysql沒有多大的關係
myhive是hive中的一個數據庫,那麼就會在元資料庫hivedb當中的DBS表中儲存一個記錄
這一條記錄就是myhive這個hive中資料的相關描述資訊
其實,hive中建立一個庫,就相當於是在hivedb中DBS中插入一條記錄, 並且在HDFS上建立相應的目錄
其實,hive中建立一個表,就相當於在hivedb中TBLS表中插入一條記錄,並且在HDFS上專案的庫目錄下建立一個子目錄
一個hive資料資料倉庫就依賴於一個RDBMS中的一個數據庫,一個數據庫例項對應於一個Hive資料倉庫
儲存於該hive資料倉庫中的所有資料的描述資訊,都統統儲存在元資料庫hivedb中
myhive 和 hivedb的區別:
myhive是hive中的資料庫: 用來儲存真實資料
hivedb是mysql中的資料庫: 用來多個類似myhive庫的真實資料的描述資料
2、Hive的原資料
3、Hive的源資料
儲存在hive資料倉庫中的真實資料 student.txt
元資料 : 一定指跟 hivedb相關,跟mysql相關
資料: HDFS上的對應表的目錄下的檔案
HDFS上的資料和元資料
資料:block塊
元資料:描述和管理這些block資訊的資料, 由namenode管理