HBase在資源緊張時降低IO的方案彙總

阿新 • • 發佈：2018-12-21

Hbase在資源緊張時降低IO的手段
以下優化手段的前提		1、一切都是瓶頸的時候(記憶體、cpu、IO)，所有手段都作用不大 2、沒有絕對的有效手段，必須針對具體業務場景去分析 3、大多數情況下，都是磁碟IO存在問題(CPU和記憶體其實問題都不大，除非配置太差)
優化分類	優化手段	優化原理	適用場景(前提)	注意事項
表設計	適當增加列族個數，一起讀寫的列放在一個列族	family多，獲取單個cell資料時就不會去掃描同一rowkey的所有資料(按列族儲存)，明顯降低IO	1、讀多寫少(多family反而增加寫的開銷，甚至帶來過多的split) 2、經常是某些欄位一起讀（有規律的） 3、記憶體較為充裕每個region的每個family對應一個store，每個store對應一個memstore	1、family不要超過3個 2、如果讀少寫多，反而整體上增加了IO 3、一般建議單列族，除非IO確實成為瓶頸
	預建分割槽	一定要預建分割槽，可以分散IO壓力，同時各節點儲存也是均勻的，否則一旦形成熱點，不光讀寫受影響，甚至還要來回遷移儲存的資料，造成更多的IO和網路開銷(昨天說的想寫入時就在幾個節點上，從而不預建分割槽是不可行的，應該採用其他手段解決)	一般場景都比較適合	分散IO，起到區域性降低IO的作用
	合理規劃hfile大小，減少split	頻繁的split會帶來額外的開銷，所以hfile的maxsize應該根據資料規模來預估，使其儘量不分裂	一般場景都比較適合
	maxversion設定為1	儲存一個版本較少儲存，可緩解IO	1、不需要儲存多版本且存在重複寫入的場景	僅能緩解IO
高寬表結合	對於隨時間變化的指標資料可以採用寬表，以時間段作為列名；為避免太寬導致單條資料過大，可以高寬表結合，比如以10分鐘為一個時間段，每天在單起一行記錄	時間線查詢	對於時間線查詢的場景可降低IO
rowkey設計	將(Long.MAX_VALUE – timestamp)加到rowkey	如果最近寫入HBase表中的資料是最可能被訪問的，可以考慮將時間戳作為row key的一部分，由於是字典序排序，所以可以使用Long.MAX_VALUE – timestamp作為row key，這樣能保證新寫入的資料在讀取時可以被快速命中。	最近寫入資料最可能被訪問的場景	緩解IO
讀寫操作	使用寫快取(以位元組為單位)	較少寫入次數	較少網路和磁碟IO
	批量讀寫(put(list))	只有一次IO開銷	實時性要去高，網路和IO壓力較大	降低IO開銷
	使用第三方前段快取	如果最近的資料經常會讀，比如半小時內的資料，前段加上快取，可以較少對磁碟讀寫	可容忍部分資料差異	降低IO開銷採用合理的淘汰演算法甚至是TTL redis貌似有六種淘汰策略+TTL
	bulkload入庫	基於mr思想，直接生成Hbase底層的資料檔案，不寫wal，降低大量IO，幾乎不影響讀	1、適合入庫實時性要求不高的場景 2、IO很緊張
	blockcache	以額外的記憶體開銷換取IO的下降	採用LRU淘汰
	適當放寬flush門欄	寫資料先寫入memstore，超多大小才flush到磁碟，可以把閾值適當調大，使剛寫入的熱資料在記憶體裡待一會，增大快取命中率，同時也降低了寫磁碟的次數	1、剛寫入的資料讀寫最頻繁 2、記憶體不是瓶頸	閾值不能太大，否則flush比較慢 hbase.regionserver.global.memstore.upperLimit
	關閉WAL(慎用)	寫入時關閉WAL可以省下一筆IO開銷	1、允許丟少量資料的場景	不到萬不得已不建議使用
資料角度	忙時關閉major compact，閒時開啟major compact	一般的業務場景都是有忙閒時的，可能在凌晨讀寫壓力會很小，所以完全有可能把major compact放到閒時去做，以緩解忙時的IO	1、業務場景有忙閒時	只是緩解忙時的IO，把他轉移到閒時,效果應該蠻明顯
	合理使用壓縮演算法(檔案級別)	gzip壓縮可以降低儲存需求，緩解IO壓力	1、cpu沒有壓力但IO壓力很大	會帶來額外的CPU開銷，一般推薦snappy，IO特別緊用gzip
	使用PrefixTreeCompression	HBase的KeyValue儲存是按照Row/Family/Qualifier/TimeStamp/Value的形式儲存的，Row/Family/Qualifier這些相當於字首，如果每一行都按照原始資料進行儲存會導致佔據儲存空間比較大	對IO有緩解作用
	使用Bloomfilter	對於某個region的隨機讀，HBase會遍歷讀memstore及storefile（按照一定的順序），將結果合併返回給客戶端。如果你設定了bloomfilter，那麼在遍歷讀storefile時，就可以利用bloomfilter，忽略某些storefile	1、記憶體不是很緊張一般都建議使用	Bloomfilter是一個列族（cf）級別的配置屬性，如果你在表中設定了Bloomfilter，那麼HBase會在生成StoreFile時包含一份bloomfilter結構的資料，稱其為MetaBlock；MetaBlock與DataBlock（真實的KeyValue資料）一起由LRUBlockCache維護。所以，開啟bloomfilter會有一定的儲存及記憶體cache開銷
Hbase本身	使用較新的版本	新版本對IO讀寫等各方面有優化的	不要用最新版，需要嚴格測試，或者參考其他公司的使用情況

HBase在資源緊張時降低IO的方案彙總

Hbase在資源緊張時降低IO的手段以下優化手段的前提 1、一切都是瓶頸的時候(記憶體、cpu、IO)，所有手段都作用不大 2、沒有絕對的有效手段，必須針對具體業務場景去分析 3

【資源盤點】報表解決方案Stimulsoft系列教程大彙總

Stimulsoft是俄羅斯一家報表控制元件廠商，一直專注於報表控制元件的研發與創新，是報表控制元件行業的領導者。Stimulsoft經過多年的努力，終於實現了更加簡單的設計報表，資料驅動更快的應用程式，更加簡便的應用新的技術，極大程式上的減少了開發人員的工作量，提高了工作的效率。現將2018

Vue專案打包時背景圖片資源路徑錯誤的解決方案

使用專案構建工具webpack或者vue-cli時，打包好的專案放伺服器上背景圖片都顯示不出來，控制檯提示資源404 not found,解決辦法如下：在build檔案目錄下找到utils.js檔案找到如下程式碼，新增一行程式碼：publicPath: '../../'即可

web.xml中配置訪問資源URL/時無法訪問.html、.jsp、.js、.css等靜態資源時的解決方案

在web應用中，我們在web.xml配置URL路徑問題時，經常這樣配置：<servlet-mapping> <servlet-name>spring-MVC</servlet-name> <url-pattern>/<

MySQL之當數據庫數據源被鎖(Table Metadata Lock)時的解決方案

data style pan ack 不能 ssl com proc 方案 0.發生的原因分析：【hibernate的線程池連接導致了不能修改被鎖定數據庫的數據庫型模式】 1.關掉hibernate的所有線程池(選擇退出IDE或者其他辦法) 2.查看被鎖的進程ID：show

ubuntu16.04系統資源緊缺時殺掉session，進程

ubuntuDec 12 12:17:01 bogon CRON[3308]: (root) CMD ( ? cd / && run-parts --report /etc/cron.hourly)Dec 12 12:28:02 bogon systemd[1]: Stopping User

在JSP中常見問題,防止SpringMVC攔截器攔截js等靜態資源文件的解決方案

訪問路徑靜態資源性能啟用所有默認 fault AD init 方案一、攔截器中增加針對靜態資源不進行過濾(涉及spring-mvc.xml) <mvc:resources location="/" mapping="/**/*.js"/> <

HBase解決海量圖片存儲方案

所有 atan 帶來單點此外圖片文件名 hdfs serve 隨著互聯網、雲計算及大數據等信息技術的發展，越來越多的應用依賴於對海量數據的存儲和處理，如智能監控、電子商務、地理信息等，這些應用都需要對海量圖片的存儲和檢索。由於圖片大多是小文件(80%大小在數MB以內

phpexcel 導入超過26列時的解決方案

highlight phpe 解決方案 clas etc php phpexcel pre 超過 $highestColumn = $sheet->getHighestColumn(); // 取得總列數 ++$highestColumn; for ($row =

安卓向SD卡儲存資料時java.io.FileNotFoundException:(Permission denied)

最近在上Android課學習時，需要向SD卡中新建一個data.txt檔案但現實無法向外圍裝置（SD卡）儲存資料。在AndroidManifest.xml也加了以下許可權配置資訊 <uses-permission android:name="android.permis

大快DKhadoop開發環境安裝常見問題及解決方案彙總

大快DKhadoop開發環境安裝常見問題及解決方案彙總 2018年度國內大資料公司排名50強本月初榜單釋出，榜單上看到大快搜索躋身50強，再看看他們做的DKHadoop發行版，的確還是蠻厲害的吧！最起碼這款DKHadoop用起來確實在易用性方面要更好！Dkhadoop版本的下載安裝以及執行環

瀏覽器相容性問題解決方案彙總

普及：瀏覽器的相容性問題，往往是個別瀏覽器（沒錯，就是那個與眾不同的瀏覽器）對於一些標準的定義不一致導致的。俗話說：沒有IE就沒有傷害。貼士：內容都是自己總結的，不免會出現錯誤或者bug，歡迎更正和補充，本帖也會不斷更新。 Normalize.css 不同瀏覽器的預設樣式存在差異，可以

【免費】電子DIY設計方案彙總

生活少不了創意，而創意永遠就在身邊甚至你的手中，一起來看看身邊的大神們都鼓搗出哪些極品吧！自動接垃圾、偷笑、避障？我家的智慧垃圾桶能做到，你家的還在原地待命？當垃圾桶能夠檢測到有垃圾進入桶內時，就會離開原來所處的地方，並且有自動避障功能，大約8秒後將會停下併發

ETH&EOS開發資源及工具集合（完整彙總版）

ETH開發資源篇一、開發語言• Solidity - 官方推薦以太坊智慧合約開發語言，也是目前最為主流的智慧合約語言• Bamboo - 是一種將智慧合約描述為有限狀態機的語言，把智慧合約看成一個狀態和交易的函式，同時生成一個新的狀態• Vyper - 一種類 python 的面向合約程式語言，專注於以太坊虛

Newtonsoft.Json版本衝突時參考解決方案

執行報錯：未能載入檔案或程式集“Newtonsoft.Json, Version=10.0.0.0, 如果同一專案中不同第三方類庫分別使用了不同版本的Newtonsoft.Json的情況下，可以在配置檔案中新增以下節點，將0.0.0.0-9.0.0.0此區間的Newtonso

linux問題以及解決方案彙總

用於記錄科研實驗中遇到的關於linux方面的問題以及解決辦法 -bash: ./my_script: /bin/bash^M: bad interpreter: No such file or directory [duplicate] 執行sh指令碼去執行java程式時遇到

docker容器日誌收集方案彙總評價總結

docker日誌收集方案有太多，下面截圖羅列docker官方給的日誌收集方案（詳細請轉docker官方文件）。很多方案都不適合我們下面的系列文章沒有說。經過以下5篇部落格的敘述簡單說下docker容器日誌採集方案 docker容器日誌收集方案（方案一 filebeat

減法器設計方案彙總（五種類比電路設計原理圖）

PS：轉載自http://www.eeworld.com.cn/Test_and_measurement/2015/0817/article_12784.html 減法電路是基本整合運放電路的一種，減法電路可以由反相加法電路構成，也可以由差分電路構成。基本整合運放電路有加、減、積分和微分等四種運算。一般是由

CentOS7.x安裝時的分割槽方案

-------------------------------------------------分割槽方案描述------------------------------------------------------------ 必須的分割槽 boot分割槽：作用：引導分割槽，包含了系統啟動的必要

http轉https後資源載入失敗的解決方案

之前沒給域名加SSL證書的時候，專案好好的，icon圖示還有，給域名了SSL證書後，icon圖示就不在了。原因就是因為專案本身採用http的資原始檔，換成https後就不解析這些資源了，清了快取也不行。這時，只需在html頁面頭部加上這句程式碼即可： <meta http

HBase在資源緊張時降低IO的方案彙總

相關推薦