HBase知識體系探究與整理

阿新 • • 發佈：2019-01-24

Web架構

業務日誌一般由Tomcat或Nginx生成(Tomcat業務日誌帶sessionid，Nginx不帶)，而中大型網際網路公司的web架構一般由LVS（Linux虛擬伺服器）+Keepalived+Nginx+Tomcat組成。由Nginx單獨掛載Tomcat，用Keepalived做主備,使用者基數多的還會在前面掛智慧CDN。Nginx理論上可以併發連線五萬條請求，但實際上只有三萬左右。此時假如有五萬零一個或三萬零一個連線請求，我得等第一個連線響應完畢，於是就催生了LVS的需求，它相當於一個漏斗，預設也是五萬條，但它可以不斷的增加連線池，使負載加大。比如天貓商城在做活動、雙十一等都會用到LVS技術。

LVS提供虛擬服務，nginx作為反向代理伺服器實現負載均衡，keepalived實現主從熱備，檢查RealServer的健康狀態及主備機之間的失效轉移。
VIP（Virtual IP）為192.168.0.16，使用者只需要訪問這個IP地址即可獲得網頁服務:
負載均衡主機+備機->keepalived與Web伺服器->realserver+nginx+tomcat

簡介

一般資料分析專案整體流程為：web架構->平臺->資料庫->BI（報表）
根據BI來觀察PV（page view）頁面瀏覽量，進一步判斷做完推廣是否有成效，怎樣調整更有意義，一般前期較為簡單，後續運維比較難。我們的平臺把統計結果存入資料庫(關係型|NoSQL型)，前端再做報表展示。

HBase就是一種NoSQL，Google Bigtable的開源實現，提供高可靠性（有主備）、高效能（機器多）、面向列、可伸縮（可以動態增刪節點）的分散式儲存系統。它可以提供儲存和處理服務，即存+計算，MapReduce執行在HBase(底層基於HDFS)上。

eg.Google Bigtable用GFS作為其檔案儲存系統，它用Hadoop HDFS作為其檔案儲存系統；
Google執行MapReduce處理Bigtable的海量資料，它用Hadoop MapReduce處理HBase中的海量資料；
Google Bigtable用Chubby作為協同服務，它用Zookeeper作對應。
注：Spark程式碼簡單，效能遠超MapReduce。在大資料行業，技術更新換代非常快。

與傳統資料庫的對比
傳統資料庫遇到的問題：
①資料量很大時無法儲存；②無很好的備份機制；③資料達到一定量開始緩慢，資料很大時基本無法支撐。
HBase優勢：
①線性擴充套件，隨資料量增多可擴充套件節點；②資料儲存在HDFS上，備份機制健全；③通過zookeeper協調查詢資料，訪問速度快。
HBase叢集中的角色：①HMaster,一個或多個主節點；②HRegionServer，多個從節點。

解析
我們通過my.ini檔案的datadir屬性找到MySQL表文件的路徑，進入檢視可發現數據庫就是資料夾，表就是檔案，底層是Windows或Linux檔案系統，MySQL無非就是做了解析和執行的軟體。HDFS是嵌在本地環境下的的分散式檔案系統，說白了就是把底下眾多硬碟串在一塊的軟體，和MySQL思想差不多。
而HBase列式思想，則把行式資料庫的列轉換成了行，同時如果列儲存了很多資料，它會幫我們做分塊並做索引，告訴我們從第0-5萬條記錄在哪一塊，從第5萬零一到十萬條記錄在哪一塊。
HBase類比MySQL，HDFS類比MySQL底下的檔案系統。列式的不能做多表關聯，它只適合存海量資料。

我們再來探究下為何催生了基於HDFS的HBase資料庫？
HDFS(分散式檔案系統)存檔案時會追加到一個檔案的尾部，只能儲存整個檔案。假如一個資料夾下有一百萬個小檔案，每個小檔案都是1KB，到底層儲存時(DataNode)不會佔用128M空間，但NameNode會被撐爆，元資料受不了。和HDFS差不多，它的架構也是主從，主HMaster、從HRegionServer。當一條條資料進來時，先快取到HRegionServer的記憶體，達到128M時將整塊寫到HDFS，這樣一塊元資料只有一條。HDFS不能做資料儲存，只能做檔案儲存，所以Hbase出現了。故當有一條條資料進來的場景時，就不要寫到HDFS了，而是寫到HBase叢集裡面。大表HBase+快取層，同時元資料存到zookeeper，不存在master。
要注意master是不存元資料的(不存任何資料)，它只是管理者，只管理幾個HRegionServer掛掉之後資料遷移和表的資訊，不管資料資訊。所以當叢集正常運行了，HMaster掛了沒影響，但NameNode掛了就不行。最後說下Hadoop1和2的區別：第一代產品有1個NameNode+多個DataNode，第二代產品有多個NameNode以解決Hadoop1的單點問題。NameNode 主備之間還有DFSZKFailoverController做管理。

HBase安裝

①確保使用者是hadoop，將安裝包上傳到/home/hadoop下；
②解壓：su – hadoop、tar –zxvf 安裝包；
③重新命名：mv hbase-version hbase；

安裝軟體為什麼要重新命名：升級新版本，環境變數不用重新配置

④修改環境變數：master：su – root、vim /etc/profile
新增內容：export HBASE_HOME=/home/hadoop/hbase、export PATH=$PATH:$HBASE_HOME/bin
執行命令：source /etc/profile、su – hadoop
在其他機器上執行上述操作。
⑤修改配置檔案：su – hadoop，
將配置檔案上傳到/home/hadoop/hbase/conf資料夾下。
配置檔案的配置元素很多，沒配就用預設的。每個檔案的解釋如下：

hbase-env.sh
export JAVA_HOME=/usr/jdk   //jdk安裝目錄
export HBASE_CLASSPATH=/home/hadoop/hadoop/conf   //hadoop配置檔案的位置
export HBASE_MANAGES_ZK=true   #如果使用獨立安裝的zookeeper這個地方就是false

hbase-site.xml
<configuration>
  <property>
  <name>hbase.master</name>     #hbasemaster的主機和埠
  <value>master1:60000</value>
  </property>
  <property>
  <name>hbase.master.maxclockskew</name>    #時間同步允許的時間差
  <value>180000</value>
  </property>
  <property>
  <name>hbase.rootdir</name>
  <value>HDFS:// hadoop-cluster1/hbase</value>#hbase共享目錄，持久化hbase資料
  </property>
  <property>
  <name>hbase.cluster.distributed</name>  #是否分散式執行，false即為單機
  <value>true</value>
  </property>
  <property>
  <name>hbase.zookeeper.quorum</name>#zookeeper地址
  <value>slave1, slave2,slave3</value>
  </property>
  <property>
  <name>hbase.zookeeper.property.dataDir</name>#zookeeper配置資訊快照的位置
  <value>/home/hadoop/hbase/tmp/zookeeper</value>
  </property>
</configuration>

Regionservers    //是從機器的域名
slave1
slave2
slave3

⑥.把hadoop的HDFS-site.xml和core-site.xml 放到hbase/conf下
cp /home/hadoop/hadoop/etc/hadoop/HDFS-site.xml /home/hadoop/hbase/conf
cp /home/hadoop/hadoop/etc/hadoop/core-site.xml /home/hadoop/hbase/conf
⑦傳送到其他機器
su - hadoop
scp –r /home/hadoop/hbase [email protected]:/home/hadoop
scp –r /home/hadoop/hbase [email protected]:/home/hadoop
scp –r /home/hadoop/hbase [email protected]:/home/hadoop
⑧啟動:su – hadoop、start-hbase.sh
⑨檢視
程序：jps
進入hbase shell：hbase shell
退出hbase shell：quit
頁面：http://master:60010/

HBase原理

這裡寫圖片描述
簡單來說，HRegionServer、HRegion、HLog、Store、MemStore、StoreFile、HFile都是類。
比如MemStore可能是類裡面的某個Map或List集合，故用記憶體儲存資料；StoreFile是Stream裝好的路徑，擁有input流；HRegion相當於類中有個路徑，檔案系統路徑(HLog)+記憶體版的集合(MemStore)+檔案版的路徑(StoreFile)。HRegionServer通過HDFS API將檔案寫到DataNode。

HBase讀慢寫快，讀是相對於寫的，還是比MySQL快。表分割槽，便於查詢，讀取速度快，多臺機器的IO得到充分利用。HRegionServer對資料有管理許可權，表資料被封裝到HRegion上，HRegion讓表可以分佈在n個機器上，HLog只能追加不能修改，寫完之後，再寫到MemStore，若機器宕機了，記憶體資料會丟失，此時HLog日誌的作用就出來了，可防止資料丟失問題。當MemStore達到閾值，將資料寫到StoreFile，再寫到HFile，HFile用於儲存在HDFS，進行了序列化。

資料有版本號，對同一id資料進行插入，若HLog有冗餘資料(eg.有些資料被刪除)，不會被合併。HLog一定會同步到HDFS，什麼時候寫，隔多長時間寫。如果在還沒同步到HDFS，硬碟掛了，那資料會丟失。查資料會幫我們把資料綁在一起，返回最新版本給使用者，當合並之後才會查不到版本。很久以前的資料沒有版本，最近的資料有版本，就在於分塊是否被合併。

假如0到一萬條資料被分為好幾個分塊到不同的DataNode管理，當出現四個分塊(每塊64MB)且對檔案日誌做了追加後，資料冗餘因為有一些刪除資料，讀完檔案將所有資料進行一次合併，合併的過程中對增刪改查進行冗餘資料處理，並保留最近版本。合併後資料必然<256MB，當塊資料<256MB將原封不動寫回HDFS。繼續處理0到一萬條資料，當又有三個分塊達到64MB時，和原來的大塊(<256MB)進行合併(後>256MB)，然後再分為兩個塊(都>168MB)，再分佈到不同的DataNode。
讀相對慢

HMaser分配資料管理許可權，假如0到10萬被拆成兩塊，一塊五萬條
表拆分和合並，Region拆分合並
合：資料變小，且資料準確；
拆：資料越來越大，讀起來會變慢，拆成兩人管，資料讀起來變快。

Hmaster直接到HDFS API，當不涉及到表管理、表合併拆分時，HMaste掛掉沒事。 HRegionServer用來管理分割槽，一張表由多個Server管理，eg.A Server管理user表的前半部分，B Server管理了user表的後半部分，A Server又管理了admin表的前半部分，B Server管理admin表的後半部分。
資料拆分合並由資料大小觸發，運算量不大且不佔用HRegion的IO和網路請求，它直接連到HRegionServer，把資料塊拆分給兩個DataNode管後，只要修改.META表的索引列表。eg.table1從a到k歸哪臺機器管，從k到n又歸哪臺機器管。查資料直接找ip，這個過程不影響HRegionServer效能，因為他們之間沒有聯絡。
提升資料讀取和新增的效能：將垃圾資料清除+資料塊分給其他人管理
如果Server掛了，該.META表的IP，會把管理許可權給別人。再把HLog交給別人。
一個HRegionServer的HRegion的類有多個，每個HRegion管理表的一部分，HRegion0管理user0，HRegion管理user1，…
Store類也有多個StoreFile和HFile，把n個小檔案合併成大檔案，最終寫入HDFS，寫的過程麻煩。

ZooKeeper–> -ROOT-(單Region)–> .META.–> 使用者表
-ROOT-
包含.META.表所在的Region列表，該表只會有一個Region；
Zookeeper中記錄了-ROOT-表的location。
.META.
包含所有的使用者空間Region列表，以及RegionServer的伺服器地址。

這裡寫圖片描述

寫資料時，通過zookeeper去找-ROOT-表，-ROOT-表（分表，資料（記憶體或檔案））在某臺HRegionServer上。-ROOT-表裡邊，找到META表N，然後到META表裡，可以找到tableN再到具體的server的ip，client直接定位IP，連線查資料。所有的-ROOT-表和.META.表都在記憶體，讀的時候相對較慢，所以才要合併拆分，讀的資料塊小，讀的時候就比較快。通過演算法實現常查詢的資料快取到記憶體，就更快了。

總結

資料寫流程：
①client通過Zookeeper定位該寫到哪臺HRegionServer;
②再向HRegionServer傳送寫請求；
③HRegionServer將資料寫到HLog（write ahead log）——資料的持久化和恢復；
④寫完HLog之後，HRegionServer再將資料寫到記憶體MemStore；
⑤反饋client寫成功。
資料Flush過程:
①當MemStore資料達到閾值（預設是64M），將資料刷到硬碟，將記憶體中的資料刪除，同時刪除HLog中的歷史資料；
②將資料儲存到HDFS中；
③在HLog中做標記點。
資料合併過程:
①當資料塊達到4塊，HMaster將資料塊載入到本地，進行合併；
②當合並的資料>256MB，進行拆分，將拆分後的Region分配給不同的HRegionServer管理;
③當HRegionServer宕機後，將HRegionServer上的HLog拆分，然後分配給不同的HRegionServer載入，修改.META.；
④注意：HLog同步到HDFS。
HBase的讀流程：
①通過zookeeper和-ROOT-、.META.表定位HRegionServer；
②資料從記憶體和硬碟合併後返回給client；
③資料塊會快取。
HMaster的職責:
①管理使用者對Table的增、刪、改、查操作；
②記錄Region在哪臺HregionServer上；
③在Region Split後，負責新Region的分配；
④新機器加入時，管理HRegionServer的負載均衡，調整Region分佈；
⑤在HRegionServer宕機後，負責失效HRegionServer 上的Regions遷移。
HRegionServer的職責:
①主要負責響應使用者I/O請求，向HDFS檔案系統中讀寫資料，是HBase中最核心的模組;
②管理了很多table的分割槽(Region)。
client職責：
HBase的Client使用HBase的RPC機制與HMaster和RegionServer進行通訊。
管理類操作：Client與HMaster進行RPC；
資料讀寫類操作：Client與HRegionServer進行RPC。

HBase知識體系探究與整理

Web架構

簡介

HBase安裝

HBase原理

總結

HBase知識體系探究與整理

IT職場人生系列之二十三知識體系專家與雜家

HBase知識體系及偽分佈安裝

Android知識體系總結之實戰經驗部分之Android多渠道打包與apk簽名篇

史上最全的人工智慧知識體系大全圖譜 & 中國人工智慧發展現狀與未來

超全整理！Python資料分析知識體系

IT職場人生系列之二十三：知識體系（專家與雜家）

JAVA初級程式設計師知識體系整理

自身知識體系的梳理與總結

產品生命週期背後的運營邏輯——《網際網路運營的知識體系與整體邏輯》筆記（四）

Atitit 知識圖譜解決方案：提供完整知識體系架構的搜尋與知識結果overview

專案管理9大知識體系與5個具體階段(zz)

大資料系列之資料庫Hbase知識整理（一）Hbase簡介，叢集搭建

我的程式設計之路——知識管理與知識體系

電腦科學與技術本科知識體系

jQuery 知識體系

Hadoop中Hbase的體系結構

Web前端知識體系精簡

Web 前端知識體系精簡

快速建立個人知識體系

HBase知識體系探究與整理

Web架構

簡介

HBase安裝

HBase原理

總結

相關推薦