hbase入庫效率提升研究（一）

阿新 • • 發佈：2019-02-16

最近在研究hbase，查詢效率確實不錯，不過入庫效率不理想，今天週五就小結以下。

hbase使用java 的api入庫很簡單：

Configuration conf = HBaseConfiguration.create();

HTable table = new HTable();

Put p = new Put("表名");

p.add(("族列名").getBytes(), "欄位名".getBytes(),"值".getBytes());

p.add...

table.put(p);

不過在最初的時候，錄入一個8列的資料檔案，入庫的效率只有0.5MB/s，9716行/s。

後來做了若干改進，速度能達到0.8MB/s,1470行/s

具體如下：

1、修改hbase的BufferSize，並禁用hbase的自動提交功能

table.setWriteBufferSize(1024*1024*10);//這裡預設值其實是64MB，所以應該改大一點比較好！

table.setAutoFlush(false);

2、禁用hbase的預寫日誌功能（WAL）

p.setWriteToWAL(false); //p為已近add資料後的Put物件

這些在hbase的wiki上看到過，後面準備新增lzo壓縮演算法來進行優化，希望能有好的結果。wiki上還有些提高hbase叢集效能的方法，例如：

修改regionserver的puts的handler數

將java調整為-server模式？？？

提升記憶體,修改hbase-env.sh中的HEAP_SIZE=4000

使用64位作業系統和64位JVM

取消swap

提升CPU

建表時設定blocksize的大小，合理的region size大小，合理的regionserver flush 大小。

虛擬機器引數調優：-XX:+UseParNewGC and -XX:+UseConcMarkSweepGC

前2個試過沒什麼作用，希望有研究過的同學能不吝賜教。

這幾天在弄lzo，這方面的資料好少，等我裝好測試過再來更新這篇文章。

hbase入庫效率提升研究（一）

最近在研究hbase，查詢效率確實不錯，不過入庫效率不理想，今天週五就小結以下。 hbase使用java 的api入庫很簡單： Configuration conf = HBaseConfiguration.create();

（轉）Redis研究（一）—簡介

創始人存儲結構隊列 cached tar 寫入關系退出使用 http://blog.csdn.net/wtyvhreal/article/details/41855327 Redis是一個開源的高性能鍵值對數據庫。它通過提供多種鍵值數據類型來適應不同場景下的

linux 配置文件.conf 非打印字符出錯的研究（一）

highlight 運行錯誤配置文件檢查 bsp 換行符 span 字符 future linux 大量使用 .conf配置文件，經常從網上復制的配置信息，保存後，會出現運行錯誤。原因就是復制到了一個不可見的，無效的非打印字符。如何檢查並清除這些無效字符，今天探討一下。

cloudfoundry研究（一） ---- BOSH與monit

我們一般使用BOSH來部署cloudfoundry。使用bosh vms命令來檢視各個節點的執行情況，如下所示：通過這種形式，我們可以一目瞭然的檢視到各節點的執行情況（running，failing等等），而這些資訊都是通過Monit來獲取的。什麼是Monit？

安卓 dex 通用脫殼技術研究（一）

注：以下4篇博文中，部分圖片引用自DexHunter作者zyqqyz在slide.pptx中的圖片，版本歸原作者所有； 0x01 背景介紹安卓 APP 的保護一般分為下列幾個方面： JAVA/C程式碼混淆 dex檔案加殼 .so檔案加殼反動態除錯技術其中混淆

GBDT梯度提升樹（一）

提升樹（例項）已知訓練資料如上表所示，x的取值範圍為區間[0.5,10.5]，y的取值範圍為區間[5.0,10.0]，學習這個迴歸問題的提升樹模型，考慮只用樹樁作為基函式。解既然是一個提升樹,

RabbitMQ研究（一）

RabbitMQ是基於AMQP（Message Queue高階訊息佇列協議），是由erlang語言開發使用rabbitMQ的優點 1、使得簡單，功能強大。 2、基於AMQP協議。 3、社群活躍，文件完善。 4、高併發效能好，這主要得益於Erlang語言。 5、Spring Boot預設

JPEG影象密寫研究（一） JPEG影象檔案結構

【轉載】轉載自http://www.cnblogs.com/leaven/archive/2010/04/06/1705846.html JPEG壓縮編碼演算法的主要計算步驟如下： (0) 8*8分塊。 (1) 正向離散餘弦變換(FDCT)。 (2) 量化(q

EMV規範學習與研究（一）——背景介紹

EMV標準是由國際三大銀行卡組織--Europay(歐陸卡，已被萬事達收購）、MasterCard（萬事達卡）和Visa（維薩）共同發起制定的銀行卡從磁條卡向智慧IC卡轉移的技術標準，是基於IC卡的金融支付標準，已成為公認的全球統一標準。 1999年2月，當時的國際三大

基於神經網路的驗證碼實驗研究（一）

前言本次實驗研究完整程式碼 ->進入 From Github 一.CAPTCHA 提到驗證碼，生活中各種各樣的平臺都會在使用者常規操作管理下實行驗證碼機制。對於我淺顯的理解，一是區分人與機器的認證互動，在有行為發生的情況下，我們要判斷是否是使用者主觀操作，本意所為，因

實體鑑別GB/T 15843研究（一）——概況

實體鑑別GB/T 15843筆記摘要：本文件對GB/T 15843介紹的實體鑑別進行簡要分析記錄。GB/T 15843包括GB/T 15843.1-2008 第1部份：概述；GB/T 15843.2-2008 第2部分：採用對稱加密演算法的機制；GB/T 15843

基於IEEE802.11s的無線Mesh網路路由協議研究（一）

摘要：基於IEEE 802.11s的無線Mesh網路已成為機動寬頻接入技術研究領域的一個研究熱點。對無線Mesh網路中的關鍵技術--混合無線Mesh協議（HWMP）進行詳細的分析，與傳統按需路由機制相比，該協議既具有先驗式路由協議的靈活性，亦具備按需路由協議的有效性，同時，對

NavMesh生成研究（一）：體素化過程

NMGen是一個開源專案，包括Java版的recast靜態網格生成程式碼，以及詳細介紹生成過程的文章。因為在閱讀過程中覺得對理解recast原理非常有用，所以決定將其翻譯在自己blog上。原blog上完整的目錄包括：高度域介紹（Introducti

區塊鏈研究（一）搭建基於以太坊的Windows區塊鏈環境

1.下載Geth.exe並安裝官網地址: https://ethereum.github.io/go-ethereum/downloads/ （另附百度網盤地址:連結: https://pan.baidu.com/s/1kVVMBsz 密碼: dr5j）進入之後顯示如下介面，

基於webrtc多人音視訊的研究（一）

基於webrtc多人音視訊的研究眾所周知，WebRTC非常適合點對點（即一對一）的音視訊會話。然而，當我們的客戶要求超越一對一，即一對多、多對一設定多對多的解決方案或者服務，那麼問題就來了：“我們應該採用什麼樣的架構？” 。簡單的呢有人會考慮copy多個p2p就完

Hook android系統呼叫研究（一）

一、Android核心原始碼的編譯環境系統環境：Ubuntu 14.04 x64bit Android系統版本：Android 4.4.4 r1 Android核心版本：android-msm-hammerhead-3.4-kitkat-mr1 手機裝置：Nexus

iOS多執行緒的初步研究（一）-- NSThread

對於多執行緒的開發，iOS系統提供了多種不同的介面，先談談iOS多執行緒最基礎方面的使用。產生執行緒的方式姑且分兩類，一類是顯式呼叫，另一類是隱式呼叫。一、顯示呼叫的類為NSThread。一般構造NSThread的執行緒物件可通過兩種方式： 1. 初始化執行緒主方法： [NSThread detach

【Mycat】資料庫效能提升利器（一）——Mycat資料切分

一、前言資料庫是每個系統都不可缺少的東西，裡面記錄了系統各種資料資料。但是如今的資料膨脹的時代，資料庫效能不能滿足我們的需要了。所以我們要對資料庫進行強化，就用到了Mycat。二、何

流媒體視訊直播類研究（一）：Windows環境下部署Red5-Server流媒體伺服器

流媒體檔案是目前非常流行的網路媒體格式之一，這種檔案允許使用者一邊下載一邊播放，從而大大減少了使用者等待播放的時間。另外通過網路播放流媒體檔案時，檔案本身不會在本地磁碟中儲存，這樣就節省了大量的磁碟空間開銷。正是這些優點，使得流媒體檔案被廣泛應用於網路播放。最近專案組在

Spring深入研究（一）

Spring 建立Spring配置檔案 Spring配置檔案名字位置不固定放在src目錄下面,命名applicationContext.xml schema約束 <?xml

hbase入庫效率提升研究（一）

相關推薦