1. 程式人生 > >Hive 入門學習線路指導

Hive 入門學習線路指導

nbsp read 大致 講解 完整 作用 serve 支持 dql

hive被大多數企業使用,學習它,利於自己掌握企業所使用的技術,這裏從安裝使用到概念、原理及如何使用遇到的問題,來講解hive,希望對大家有所幫助。

此篇內容較多:
看完之後需要達到的目標:

  • 1.hive是什麽
  • 2.明白hive的原理
  • 3.會使用hive
  • 4.會使用hive編程

1.hive
首先我們需要hive是什麽?讓你真正明白什麽是hive
上面講的很明白

1.hive是一個數據倉庫
2.hive基於hadoop。

總結為一句話:hive是基於hadoop的數據倉庫。
hive明白之後,如同我們明白了關系數據庫是什麽了,那麽我們該如何使用操作它:
首先我們要安裝,安裝分為很多種分為單機遇集群安裝。


可參考下面內容:(正在更新)

  • Hive安裝指導
  • HIVE完全分布式集群安裝過程(元數據庫: MySQL)

上面需要說明的是hive默認元數據庫並不是mysql,但是因為默認元數據庫存在局限,所以最好使用mysql。下面我們附一張圖,先從整體了解。

技術分享圖片
安裝完畢,那麽我們就需要練練手了,可以根據下面內容


hive基本操作:
會了基本的操作還不夠,如同我們需要了解sql語法一樣,我們需要了解hive各種語法

  • Hadoop Hive sql語法詳解1-認識hive及DDL操作
  • Hadoop Hive sql語法詳解2-修改表結構
  • Hadoop Hive sql語法詳解3--DML 操作:元數據存儲
  • Hadoop Hive sql語法詳解4--DQL 操作:數據查詢SQL
  • Hadoop Hive sql語法詳解5--HiveQL與SQL區別

這裏面包含了加載數據、查詢數據等各種操作。
上面是一些基本的操作,下面還有一些負責一些操作如:

  • Hive快捷查詢:不啟用Mapreduce job啟用Fetch task三種方式介紹
  • Hive如何執行文件中的sql語句
  • Hive四種數據導入方式介紹
  • Hive中的三種不同的數據導出方式介紹
  • Hive如何創建索引

上面基本屬於實戰類型,我們還需要高級進階,我們需要了解裏面的原理,我們需要知道遇到問題,該如何解決。

原理:

  • 全面了解hive
  • Hive體系結構介紹
  • hive實現原理
  • hive內部表與外部表區別詳細介紹
  • HIVE中Join的專題---Join詳解
  • 讓你徹底明白hive數據存儲各種模式
  • Hive配置文件中配置項的含義詳解(收藏版)
  • HIVE與傳統數據庫對比
  • hive詳解
  • hive 配置參數說明(收藏版)
  • hive支持sql大全(收藏版)
  • hive 創建/刪除/截斷 表


原理大致懂了,基本操作會了,我們可能又有了更進一步的認識,那麽hive如何結合hadoop,hbase發揮作用,該如何發揮它的實際意義,被我們所用。

首先我們使用hive的時候,很多都與hbase相結合,這樣發揮hive的長處,在各種查詢數據方面相比hbase使用更方便。

  • hive為什麽與hbase整合
  • Hive與HBase整合完整指導
  • hadoop、hbase、hive版本對應關系

上面是與hbase結合使用,那麽我們該如何與編程語言向結合,可以參考下面內容:

  • 通過JDBC驅動連接Hive操作實例
  • Hive:用Java代碼通過JDBC連接Hiveserver介紹
  • 從 MapReduce 到 Hive 實戰分析
  • hive實戰

上面或許你已經對hive有所了解,下面的面試及遇到的問題,大家可參考

  • hive找不到創建的表了
  • Shark對Hive的支持與不支持的語法介紹
  • 面試題:分別使用Hadoop MapReduce、hive統計手機流量
  • hive面試題目:表大概有2T左右,對表數據轉換
  • hive如何通過設置日誌定位錯誤
  • hive在騰訊分布式數據庫時間分享

參考資料:

  • http://www.cnblogs.com/snowbook/p/5723767.html
  • 《Hive編程指南》

Hive 入門學習線路指導