1. 程式人生 > >大資料的儲存—HBase

大資料的儲存—HBase

       HBase(HadoopDataBase )是一個高可靠性、高效能、面向列、可伸縮的分散式資料庫系統,它使用類似於GFS的HDFS作為底層檔案儲存檔案,在其上執行MapRduce批量處理資料。使用ZooKeeper作為協同服務元件。

       Hive在Hadoop生態環境中起到資料庫倉庫的作用,它通過簡單的HQL呼叫,實現了後臺利用MapReduce計算框架對大規模資料的處理,易用性和可靠性是其主要特點。但時效性不是Hive的強項,比如一個簡單的帶WHERE條件的SELECT語句,相比其它的RDBMS,執行速度慢。另外,Hive表中的資料也不支援單行資料刪除和更新。

       在大環境下實現低延遲資料讀寫,就需要用到HBase。

       NoSQL(Not only SQL)非關係資料庫。和資料庫管理系統(RDBMS)相比,NoSql不使用SQL作為查詢語言。其儲存可以不需要固定的表模式,通常也會避免使用RDBMS的JION操作,一般都具備水平可擴充套件的特性。NoSQL的實現具有兩個特徵:使用硬碟和把隨機儲存器作為儲存載體。按照儲存格式來分,NoSQL可以分為4類:鍵值儲存資料庫、列儲存資料庫、文件儲存資料庫和圖形資料庫。目前比較流程的NoSQL資料庫有Casssandra、Luncene、Neo4j、MongoDB和HBase。

RDBMS和HBase優缺點比較:

RDBMS缺點

HBase優點

高併發瓶頸。Web2.0模式下要實時生成動態頁面而無法使用靜態化技術,對於每秒上萬次的寫入DB操作,硬碟I/O存在明顯的瓶頸

擴充套件性強。每種NoSQL產品都去掉關係型資料庫的關係特性,弱關係的資料更容易擴充套件,使得很容易實現支援資料從TB到PB級別的過度。

可擴充套件性的限制。DB無法像Web Server或App Server那樣依靠簡單增加節點來平滑擴充套件效能,往往要停機維護和資料遷移。

併發性好。NoSQL資料具有良好的讀寫效能,其德益於它的弱關係性特點,資料的結構簡單。

事務一致性負面影響。保證資料完整性的唯一方法是使用事務,這會消耗資料庫資源,而很多Web系統並不需要嚴格的資料一致性。

資料模型靈活。NoSQL無需事先為要儲存的資料建立欄位,隨時可以儲存自定義的資料格式。NoSQL允許使用者隨時新增欄位。而對傳統RDBMS,增刪欄位是非常麻煩的事情,尤其是對資料是非常大的表。

相關推薦

資料儲存---HBase介紹(上)

本次主要介紹三部分: HBase簡介 HBase整體架構 HBase安裝和啟動 Hbase基本操作 HBase簡介 hbase是bigtable的開源java版本,是建立在hdfs之上。 提供高可靠性、高效能、列儲存、可伸縮、實時讀寫nosql的資料庫系統

資料儲存---HBase常用介紹(中)

我們這裡主要介紹HBase的API 基礎API 封裝工具類 基礎API 建立表 新增資料 查詢資料的三種方式 掃描查詢 get方式執行查詢 過濾查詢 PS:刪除表請通過shell命令進入客戶端刪除。 package com.hbase; imp

雲時代的資料儲存-雲HBase

為什麼 縱觀資料庫發展的幾十年,從網狀資料庫、層次資料庫到RDBMS資料庫,在最近幾年的NewSQL的興起,加上開源的運動,再加上雲的特性,可以說是日新月異。在20世紀80年代後,大部分的業務確定使用RDBMS資料為儲存基礎。新世紀開始,隨著網際網路的發展,資料量的增大,慢慢RDBMS資料庫撐不住,就出

[資料專案]-HBase+SpringBoot實戰分散式檔案儲存

2018最新最全大資料技術、專案視訊。整套視訊,非那種淘寶雜七雜八網上能免費找到拼湊的亂八七糟的幾年前的不成體系浪費咱們寶貴時間的垃圾,詳細內容如下,需要的聯絡QQ:3164282908(加Q註明部落格園)。 視訊高清不加密,需要加QQ。 更有海量大資料技術視訊、大資料專案視訊,機器學習深度學習技術視訊、

如何使用HBase資料儲存的兩個實戰場景

現如今各種資料儲存方案層出不窮,本文僅僅是結合兩個實戰場景就基於HBase的大資料儲存做了簡單的分析,並對HBase的原理做了簡單的闡述。如何使用好HBase,甚至於如何選擇一個最優的資料儲存方案,還需要我們根據場景需要具體分析和設計 HBase是一個高可靠性、高效能、面向

【Hadoop & Hbase資料儲存系統程式設計_讀出寫入

0x01 編譯環境 jdk 1.7 hbase 0.98 hadoop 2.6 Ubuntu Linux 14.04.2 0x02 目標 其中我的任務編號為5,即Sort-based Distinct Sort-based Distinct

資料儲存利器 - Hbase 基礎圖解

由於疫情原因在家辦公,導致很長一段時間沒有更新內容,這次終於帶來一篇乾貨,是一篇關於 Hbase架構原理 的分享。   Hbase 作為實時儲存框架在大資料業務下承擔著舉足輕重的地位,可以說目前絕大多數大資料場景都離不開Hbase。   今天就先從 Hbase 基礎入手,來說說 Hbase

資料環境---hbase的安裝

   前面已經搭建好了zookeeper主機叢集,hadoop叢集。   現子看來,zookeeper貌似提供了一種簡便的方法來解決hadoop叢集的問題,比如免密登陸,時間同步等。 但是二者都是分散式架構解決方案,所以應該不存在耦合關係! 

資料平臺hbase,phoenix,spark搭建和研發問題和解決方式彙總

#Q Caused by: java.lang.NoSuchMethodError: org.apache.hadoop.tracing.SpanReceiverHost.get $A <hadoop.version>2.7.3</hadoop.version>

學習筆記:從0開始學習資料-7.hbase java程式設計hello world

上節搭建了hbase啟動環境,本節搭建hbase程式設計環境 1. 準備測試資料,建立表student #hbase shell create 'student','info','address' put 'student','1','info:age','20' put 'studen

學習筆記:從0開始學習資料-6.hbase安裝

環境:centos7 jdk1.8.0  hadoop2.6.0已安裝好了,單機偽分散式 1.下載hbase安裝檔案 wget http://archive-primary.cloudera.com/cdh5/cdh/5/hbase-1.2.0-cdh5.16.0.tar.gz

資料HBase命令列操作

1、課程簡介 本文章先會介紹HBase命令列,接著會介紹java程式碼對hbase中的表進行增刪改查。 本文章中所有命令均在CentOS-6.4-x86_64,hadoop-2.5.2,jdk1.8.0_152,zookeeper-3.4.11,hbase-1.2.6中執行通過,為減少linux許

資料hbase(一) --- HBase介紹,特性,安裝部署,shell命令,client端與hbase的互動過程,程式設計API訪問hbase實現百萬寫入

一、HBase介紹 ---------------------------------------------- 1.基於hadoop的資料庫,具有分散式,可伸縮的大型資料儲存 2.用於對資料的隨機訪問,實時讀寫 3.巨大的表,十億行*百萬列

資料hbase(四) --- rowkey設計原則模擬通話日誌,BloomFilter,phonix環境部署,hive-hbase整合

一、rowkey設計 -- 模擬通話日誌 -------------------------------------------------- 1.建表 $hbase> create 'ns1:calllogs' , 'f1' 2.編寫

hadoop SequenceFile——資料 儲存

SequenceFile是一個由二進位制序列化過的key/value的位元組流組成的文字儲存檔案。 基於壓縮型別CompressType,共有三種SequenceFile Writer: public static enum CompressionType { /

資料儲存、計算、應用、視覺化,資料的基本概述都在這裡了

未來的時代,一定是資料的時代,在未來,一切被記錄,一切被分析,資料將以資產的方式存在,相關知識如下: 一、先說各種資料儲存 資料是個很泛的概念,但是我們腦海裡第一反應的就是關係型資料庫和EXCEL這種二維表是資料。 而現在資料各種各樣特色,有文件、有圖片、有流式

GIS資料儲存預研

1. 背景 在實際專案執行中,時常會出現希望搜尋周邊所有資料的需求。但是以常規的儲存方案,每種資源均為一個圖層或一個表,比如人員軌跡表、車輛軌跡表、各類空間圖層表等。在進行全文空間收索時,基於傳統空間關係庫或後臺圖層服務的遍歷查詢則過於耗時。這裡,我們研究基於ElasticSearch來進行所有資料的整合,

資料儲存的進化史 --從 RAID 到 Hdfs

 我們都知道現在大資料儲存用的基本都是 Hdfs ,但在 Hadoop 誕生之前,我們都是如何儲存大量資料的呢?這次我們不聊技術架構什麼的,而是從技術演化的角度來看看 Hadoop Hdfs。   我們先來思考兩個問題。   在 Hdfs 出現以前,計算機是通過什麼手段來儲存“大資料”

資料hbase(五) --- 匯出Hbase的表文件到HDFS,Hbase Bulk Load Hbase,MySQL資料通過MR匯入到Hbase表中

一、匯出Hbase的表文件到HDFS -------------------------------------------------------------------------- 1.複製hbase的jar檔案和metrices-core-xxx.jar檔案到

資料學習——HBase 入門

HBase 學習環境 shiyanlou 《HBase介紹、安裝與應用案例》 - CentOS6.6 64位 - JDK 1.7.0_55 64位 - Hadoop 1.1.2 Hbase 介紹 HBase ——Hadoop Databa