HIVE入門（概述、hive的體系結構）

阿新 • • 發佈：2021-10-13

第一章概述

1-1 課程概述

什麼是hive？
答：hive構建在hadoop hdfs 上的資料倉庫。

什麼是資料倉庫？
答：資料倉庫實際上就是一個數據庫，資料倉庫的特點：引入冗餘，分析資料；
資料庫的特點：避免冗餘，捕獲資料。

1-2 資料倉庫簡介

什麼是資料倉庫？
答：資料倉庫是一個面向主題的，整合的，不可更新的，隨時間不變化的資料集合，
它主要用於支援企業或組織的決策分析處理。

資料倉庫的結構和建立過程
答：
1、資料來源 (業務資料系統、文件資料、其他資料)
2、資料儲存及管理-ETL (抽取Extract、轉換Transform、裝載Load)
3、資料倉庫引擎 (伺服器)
4、前端展示 (資料查詢、資料報表、資料分析、各類應用)

OLTP應用和OLAP應用
答：
1.OLTP(on-line transaction processing) 聯機事務處理
例：銀行轉賬
2.OLAP(on-line analytical processing) 聯機分析處理
例：商品推薦系統

資料倉庫中的資料模型

1、星型模型

2、雪花模型

1-3 什麼是hive

答：
hive是建立在hadoop hdfs 上的資料倉庫基礎架構。
hive可以用來進行資料提取轉化載入(ETL)。
hive提供了簡單的類似SQL的查詢語言(HQL)，它允許熟悉SQL的使用者查詢資料。
hive允許熟悉MapReduce的開發者，
開發自定義的mapper和Reducer來處理富貴論壇地圖內建的mapper和reducer無法完成的複雜的分析工作。
hive是SQL引擎，它將SQL語句轉移成M/R job, 然後在Hadoop上執行。
hive表其實就是HDFS的目錄/檔案

第二章 HIVE的體系結構

2-1 hive的體系結構之元資料

hive的元資料
- hive將元資料儲存在資料庫中(metastore),支援mysql、derby等資料庫(mysql、derby、oracle)
- hive中的元資料包括表的名字、表的列和分割槽及其屬性，表的屬性(是否為外部表等)，表的資料所在目錄等。

2-2 hive的體系結構之HQL的執行過程

直譯器、編譯器、優化器完成HQL查詢語句從詞法分析、語法分析、編譯、優化以及查詢計劃的生成。
生成的查詢計劃儲存在HDFS中，並在隨後又MapReduce呼叫生成。

2-3 hive的體系結構

hadoop
- 用HDFS進行儲存，利用MapReduce進行計算
元資料儲存 (MetaStore)
- 通常是儲存在關係資料庫 mysql,derby等

HIVE入門（概述、hive的體系結構）

第一章概述 1-1 課程概述什麼是hive？答：hive構建在hadoop hdfs 上的資料倉庫。什麼是資料倉庫？

hive能替代oracle_走近大資料之Hive入門（六、Hive的資料模型）

技術標籤：hive能替代oracle 一、Hive的資料儲存基於HDFS(Hadoop的資料倉庫)沒有專門的資料儲存格式(預設的情況下采用\'\'(製表符)作為列與列之間的分隔符)儲存結構主要包括：資料庫，檔案，表，檢視可以直

【Flume】概述及組成、入門案例、進階（事務、拓撲結構）、不同拓撲案例、自定義、資料流監控Ganglia

一、概述 1、定義日誌採集、聚合、傳輸的系統，基於流式結構即：讀取本地磁碟資料，寫入HDFS或kafka

集合：set介面及其實現類（HashSet、TreeSet底層結構）

1、set介面（1）特點元素不能重複（equals判斷）無序 @Test public void test1() { Set set=new HashSet();

MySQL複習（一）：MySQL基礎架構、InnoDB體系結構、MySQL日誌

一、MySQL基礎架構 MySQL可以分為Server層和儲存引擎層兩部分 Server層包括聯結器、查詢快取、分析器、優化器、執行器等，涵蓋MySQL的大多數核心服務功能，以及所有的內建函式（如日期、時間、數學和加密函式等

go語言20小時從入門到精通（八、面向物件程式設計）

##8.1 概述對於面向物件程式設計的支援Go 語言設計得非常簡潔而優雅。因為， Go語言並沒有沿襲傳統面向物件程式設計中的諸多概念，比如繼承(不支援繼承，儘管匿名欄位的記憶體佈局和行為類似繼承，但它並不是繼承)、

Kafka系列（一）基本概念（概述、設計、叢集）

1、概述 Kafka是一種訊息中介軟體。舉個例子，一個網站在使用者進行註冊的時候，後臺的操作包括髮送郵箱、寫入使用者表、寫入日誌等等，但是一般都不會等這些完全處理完才告訴你註冊成功。這一系列的操作通常是非同步

Postman入門教程(概述、下載、使用)

Postman使用入門教程 What is Postman?How to use Postman?download Postmaninstall Postmanuse Postman for example

Day01 資料庫基礎知識介紹、MySQL安裝、MySQL體系結構介紹

1、資料庫基礎知識介紹 1. DBA是什麼 DBA（資料庫管理員），認證英文是Database Administrator

二、MySQL體系結構與管理

MySQL（C/S模型介紹） 1、MySQL連線方式（1）TCP/IP 方式（遠端、本地）： mysql -uroot -h10.1.20.2 -pdjfdfhdj -P3306 （2）Socket方式（僅支援本地）： mysql -uroot -h10.1.20.2 -S /tmp/mysql.socket