HIve 和 MySQL 的區別轉載部落格

阿新 • • 發佈：2019-02-14

注： Local FS ：Local File System ，本地檔案系統

資料更新：這一行 HQL 不支援，SQL 支援

查詢語言。由於 SQL 被廣泛的應用在資料倉庫中，因此，專門針對 Hive 的特性設計了類 SQL 的查詢語言 HQL。熟悉 SQL 開發的開發者可以很方便的使用 Hive 進行開發。
資料儲存位置。Hive 是建立在 Hadoop 之上的，所有 Hive 的資料都是儲存在 HDFS 中的。而資料庫則可以將資料儲存在本地檔案系統中。
資料格式。Hive 中沒有定義專門的資料格式，資料格式可以由使用者指定，使用者定義資料格式需要指定三個屬性：列分隔符（通常為空格、”\t”、”\x001″）、行分隔符（”\n”）以及讀取檔案資料的方法（Hive 中預設有三個檔案格式 TextFile，SequenceFile 以及 RCFile）。由於在載入資料的過程中，不需要從使用者資料格式到 Hive 定義的資料格式的轉換，因此，Hive 在載入的過程中不會對資料本身進行任何修改，而只是將資料內容複製或者移動到相應的 HDFS 目錄中。而在資料庫中，不同的資料庫有不同的儲存引擎，定義了自己的資料格式。所有資料都會按照一定的組織儲存，因此，資料庫載入資料的過程會比較耗時。
資料更新。由於 Hive 是針對資料倉庫應用設計的，而資料倉庫的內容是讀多寫少的。因此，Hive 中不支援對資料的改寫和新增，所有的資料都是在載入的時候中確定好的。而資料庫中的資料通常是需要經常進行修改的，因此可以使用 INSERT INTO … VALUES 新增資料，使用 UPDATE … SET 修改資料。
索引。之前已經說過，Hive 在載入資料的過程中不會對資料進行任何處理，甚至不會對資料進行掃描，因此也沒有對資料中的某些 Key 建立索引。Hive 要訪問資料中滿足條件的特定值時，需要暴力掃描整個資料，因此訪問延遲較高。由於 MapReduce 的引入， Hive 可以並行訪問資料，因此即使沒有索引，對於大資料量的訪問，Hive 仍然可以體現出優勢。資料庫中，通常會針對一個或者幾個列建立索引，因此對於少量的特定條件的資料的訪問，資料庫可以有很高的效率，較低的延遲。由於資料的訪問延遲較高，決定了 Hive 不適合線上資料查詢。
執行。Hive 中大多數查詢的執行是通過 Hadoop 提供的 MapReduce 來實現的（類似 select * from tbl 的查詢不需要 MapReduce）。而資料庫通常有自己的執行引擎。
執行延遲。之前提到，Hive 在查詢資料的時候，由於沒有索引，需要掃描整個表，因此延遲較高。另外一個導致 Hive 執行延遲高的因素是 MapReduce 框架。由於 MapReduce 本身具有較高的延遲，因此在利用 MapReduce 執行 Hive 查詢時，也會有較高的延遲。相對的，資料庫的執行延遲較低。當然，這個低是有條件的，即資料規模較小，當資料規模大到超過資料庫的處理能力的時候，Hive 的平行計算顯然能體現出優勢。
可擴充套件性。由於 Hive 是建立在 Hadoop 之上的，因此 Hive 的可擴充套件性是和 Hadoop 的可擴充套件性是一致的（世界上最大的 Hadoop 叢集在 Yahoo!，2009年的規模在 4000 臺節點左右）。而資料庫由於 ACID 語義的嚴格限制，擴充套件行非常有限。目前最先進的並行資料庫 Oracle 在理論上的擴充套件能力也只有 100 臺左右。
資料規模。由於 Hive 建立在叢集上並可以利用 MapReduce 進行平行計算，因此可以支援很大規模的資料；對應的，資料庫可以支援的資料規模較小。

HIve 和 MySQL 的區別轉載部落格

注： Local FS ：Local File System ，本地檔案系統資料更新：這一行 HQL 不支援，SQL 支援

redis和MySQL區別（轉載）

redis是一個記憶體資料結構的服務，它將資料儲存在記憶體中，從而實現了非常好的吞吐量和效能。它有提供了很豐富的資料結構，特別適合社交類業務的系統。但是記憶體資料庫要求伺服器的記憶體足夠才行，儲存的資料量越大消耗的記憶體也就越大，如果記憶體不夠就會導致作業系統進行記憶體到磁碟

淺談Hive和HBase區別

但是 hql 應該 hdf 目前 http 返回最重要的 hadoop基礎出處： http://www.cnblogs.com/zlslch/p/5659641.html . 兩者分別是什麽？　 Apache Hive是一個構建在Hadoop基礎設施之上的數

Ubuntu 安裝 RabbitMQ 和PHP擴充套件 - CSDN部落格

1.ubuntu16.04中安裝RabbitMQ 1).首先必須要有Erlang環境支援安裝之前要裝一些必要的庫: sudo apt-get install build-essential sudo apt-get install libncurses5-dev sud

GitHub、Node.js和Hexo搭建個人部落格

GitHub、Node.js和Hexo搭建個人部落格 1.Git 1.1、下載下載地址：https://git-scm.com/downloads 1.2、Git安裝雙擊安裝，點選Next 填寫安裝路徑，點選Next 選中安裝內容，點選Next

python處理轉載部落格html

前景在轉載別人部落格的時候通常我們會通過複製html然後放到編輯器裡面，但是通常html裡有很多雜七雜八的東西，比如script， svg這些標籤導致排版出現問題例如由lu標籤引起的由svg標籤引起的當然要說你直接把不要的東西刪除也可以，但是作為一個程式設計

CSDN轉載部落格（最好用chrome瀏覽器）

可能有人會說直接收藏不就可以了嗎，何必轉載呢。但最近遇到了一個問題：我收藏了一篇不錯的文章，然後想再看的時候，突然打不開了。。。這讓我情何以堪！作者刪除或轉為私密狀態，人家就是不讓你看了，你能咋地！機智的我當時還收藏了同一篇文章作者在兩個網站（簡書與其個人部落格網站）發表的

Django+Bootstrap+Mysql 搭個人部落格

初始化新建專案 #pycharm手動建立django專案或如下 $ django-admin.py startproject website #建立Django app $ python manage.py startapp blog 更改資料庫配置(sqlite->

Hbase，Hive，Mysql區別完全弄懂

Hive - Mysql Hive mysql 查詢語言 HQL SQL 資料儲存 HDFS 磁碟上

如何轉載部落格（轉）

1 在參考“如何快速轉載CSDN中的部落格”後，由於自己不懂html以及markdown相關知識，所以花了一些時間來弄明白怎麼轉載部落格，以下為轉載CSDN部落格步驟和一些知識小筆記。參考部落格原址：http://blog.csdn.net/bolu1234/article/deta

HIVE和HBASE區別

Hive中的表是純邏輯表，就只是表的定義等，即表的元資料。Hive本身不儲存資料，它完全依賴HDFS和MapReduce。這樣就可以將結構化的資料檔案對映為為一張資料庫表，並提供完整的SQL查詢功能，並將SQL語句最終轉換為MapReduce任務進行執行。而HBase表是

怎麼轉載部落格

實現因為我自己當初想轉載的時候卻不知道該怎麼轉載，所以學會了之後就把方法寫出來，幫助那些想轉載卻不知道該怎麼轉載的人（大神勿笑）。我們首先開啟要轉載的部落格，然後滑鼠右鍵就會出現下面的選單：我們點選【審查元素】，就會出現當前HTML頁面的程式碼

使用.net core ABP和Angular模板構建部落格管理系統（實現自己的業務邏輯）

之前寫到使用.net core ABP 和Angular模板構建專案，建立後端服務。文章地址：http://www.jianshu.com/p/fde1ea20331f 建立完成後的api基本是不能用的，現在根據我們自己的業務邏輯來實現後端服務。

MS SQL Server和MySQL區別

MySQL支援enum,和set型別，SQL Server不支援MySQL不支援nchar,nvarchar,ntext型別MySQL的遞增語句是AUTO_INCREMENT，而MS SQL是identity(1,1)MS SQL不支援replace into 語句，但是在最新的sql20008裡面，也支援m

使用.net core ABP和Angular模板構建部落格管理系統（建立後端服務）

建立實體如下所示專案下建立blog/notes資料夾，並加入我們的實體檔案 /// <summary> /// 文章資訊 /// </summary> public class Note : En

超詳細 CentOS7 安裝解除安裝mysql資料庫的部落格

因為我時常和安卓朋友做一些專案又不在一起住所以就在阿里雲的伺服器上面佈置了一些環境最近發現mysql的密碼給忘記了然後修改配置檔案進行無密碼啟動又失敗了索性直接解除安裝來的實在找了好多部落格發現了兩篇比較不錯的在這裡分享給大家

【轉載】如何轉載部落格

前言對於喜歡逛CSDN的人來說，看別人的部落格確實能夠對自己有不小的提高，有時候看到特別好的部落格想轉載下載，但是不能一個字一個字的敲了，這時候我們就想快速轉載別人的部落格，把別人的部落格移到

Java爬蟲--利用HttpClient和Jsoup爬取部落格資料並存入資料庫

由於今日頭條等頭條類產品的出現，以今日頭條為代表所使用的爬蟲技術正在逐漸火熱，在爬蟲領域具有良好效能和較好效果的Python在最近一年的時間裡逐漸火熱起來，同時因為Python良好的資料分析和機器學習的能力，Python的應用越來越廣泛。不過，今天我們要提到

CSDN如何轉載部落格

一、Why？為何寫這篇文章呢？可能有人會說直接收藏不就可以了嗎，何必轉載呢。但最近遇到了一個問題：我收藏了一篇不錯的文章，然後想再看的時候，突然打不開了。。。這讓我情何以堪！作者刪除或轉為私密狀態，人家就是不讓你看了，你能咋地！機智的我當時還收藏

如何在CSDN上轉載部落格

在參考“如何快速轉載CSDN中的部落格”後，由於自己不懂html以及markdown相關知識，所以花了一些時間來弄明白怎麼轉載部落格，以下為轉載CSDN部落格步驟和一些知識小筆記。參考部落格原址：http://blog.csdn.net/bolu1234/article/

HIve 和 MySQL 的區別 轉載部落格

相關推薦

HIve 和 MySQL 的區別轉載部落格