1. 程式人生 > >Hive 的所有跟資料相關的概念

Hive 的所有跟資料相關的概念

db: myhive,   table: student     元資料:hivedb


1、Hive的元資料
指的是 myhive 和 student等等的庫和表的相關的各種定義資訊
該元資料都是儲存在mysql中的

myhive是hive中的一個數據庫的概念,其實就是HDFS上的一個資料夾,跟mysql沒有多大的關係
myhive是hive中的一個數據庫,那麼就會在元資料庫hivedb當中的DBS表中儲存一個記錄
這一條記錄就是myhive這個hive中資料的相關描述資訊

其實,hive中建立一個庫,就相當於是在hivedb中DBS中插入一條記錄, 並且在HDFS上建立相應的目錄

其實,hive中建立一個表,就相當於在hivedb中TBLS表中插入一條記錄,並且在HDFS上專案的庫目錄下建立一個子目錄


一個hive資料資料倉庫就依賴於一個RDBMS中的一個數據庫,一個數據庫例項對應於一個Hive資料倉庫


儲存於該hive資料倉庫中的所有資料的描述資訊,都統統儲存在元資料庫hivedb中

myhive 和  hivedb的區別:

myhive是hive中的資料庫: 用來儲存真實資料
hivedb是mysql中的資料庫: 用來多個類似myhive庫的真實資料的描述資料


2、Hive的原資料
3、Hive的源資料

儲存在hive資料倉庫中的真實資料  student.txt

元資料 : 一定指跟 hivedb相關,跟mysql相關
資料: HDFS上的對應表的目錄下的檔案


HDFS上的資料和元資料

資料:block塊
元資料:描述和管理這些block資訊的資料, 由namenode管理