HBase與Hive對比
阿新 • • 發佈:2022-03-03
Hive
- 資料倉庫
Hive的本質其實就相當於HDFS中已經儲存的檔案在MySql中做了一個雙射關係,以方便使用HQL去管理查詢。
- 用於資料分析、清洗
Hive適用於離線的資料分析和清洗,延遲較高。
- 基於HDFS、MapReduce
Hive儲存的資料依舊在DataNode上,編寫的HQL語句終將是轉換為MapReduce程式碼執行。
HBase
- 資料庫
是一種面向列族的非關係型資料庫。
- 用於儲存結構化和非結構化的資料
適用於單列表非關係型資料的儲存,不適合做關聯查詢,類似Jion等操作。
- 基於HDFS
資料持久化儲存的體現形式是HFile,存放於DataNode中,被ResionServer以region的形式進行管理。
- 延遲較低,接入線上業務使用
面對大量的企業資料,HBase可以直接單表大量資料的儲存,同時提供高效的資料訪問速度。
作者:不像話 出處:https://www.cnblogs.com/jake-jin/ github地址:https://github.com/buxianghua 若標題中有“轉載”字樣,則本文版權歸原作者所有。歡迎轉載,但未經作者同意必須保留此段宣告,且在文章頁面明顯位置給出原文連線,否則保留追究法律責任的權利.