1. 程式人生 > 程式設計 >python3.7通過thrift操作hbase的示例程式碼

python3.7通過thrift操作hbase的示例程式碼

HBase是一個分散式的、面向列的開源資料庫,其是Apache的Hadoop專案的子專案。HBase不同於一般的關係資料庫,它是一個適合於非結構化資料儲存的資料庫。另一個不同的是HBase基於列的而不是基於行的模式。其資料結構類似與Redis的key-value模式。

python3.7 通過 thrift , rpc 介面操作 hbase ,指定依賴庫為: thrift 和 hbase-thrift 。 然而我們 在 python3.7 環境中發現 hbase-thrift-0.20.4 無法被支援, hbase-thrift 官方僅推薦用於 python2.x 。 於是有了下邊的 patch 版本 和 patch 版本寫法的客戶端。

patch 版本下載,適用於 python 3.x : http://dl.cpp.la/Archive/hbase-thrift-0.20.4.patch.tgz

解除安裝 hbase-thrift-0.20.4 版本

# pip3 list | grep hbase-thrift
>> hbase-thrift    0.20.4
# pip3 uninstall hbase-thrift -y
>> Successfully uninstalled hbase-thrift-0.20.4

安裝 hbase-thrift-0.20.4.patch 版本(支援 python3.x )


wget http://dl.cpp.la/Archive/hbase-thrift-0.20.4.patch.tgz
tar -zxvf hbase-thrift-0.20.4.patch.tgz
cd hbase-thrift-0.20.4.patch
python3 setup.py install

檢測安裝是否成功

# pip3 list | grep hbase-thrift
>> hbase-thrift    0.20.4.patch
Python3.7 操作 hbase-thrift-patch 客戶端程式碼示例
from thrift.transport import TSocket
from thrift.transport.TTransport import TBufferedTransport
from thrift.protocol import TBinaryProtocol
 
from hbase import Hbase
from hbase.ttypes import ColumnDescriptor
from hbase.ttypes import Mutation
 
class HBaseClient(object):
 
  def __init__(self):
    self.__ip = HBASE_URI.get("HOST")
    self.__port = HBASE_URI.get("PORT")
    self.__transport = self.createSocket
    protocol = TBinaryProtocol.TBinaryProtocol(self.__transport)
    self.__client = Hbase.Client(protocol)
    self.__transport.open()
 
  @property
  def createSocket(self):
    CS = TSocket.TSocket(self.__ip,self.__port)
    CS.setTimeout(60*1000)
    return TBufferedTransport(CS)
 
  def __del__(self):
    self.__transport.close()
 
  def get_tables(self):
    """
    get all table name
    :return: table name list
    """
    return self.__client.getTableNames()
 
  def create_table(self,table,*columns):
    """
    create table
    :param table: table name
    :param columns: columns name,variable parameter
    """
    func = lambda col: ColumnDescriptor(col)
    column_families = list(map(func,columns))
    self.__client.createTable(table,column_families)
 
  def delete_table(self,table):
    '''
    delete table in hbase
    :param table: tableName
    :return:
    '''
    if self.__client.isTableEnabled(table):
      self.__client.disableTable(table)
    self.__client.deleteTable(table)
 
  def put(self,row,columns):
    """
    add record
    :param table: table name
    :param row:
    :param columns:
    :return:
    """
    self.__client.mutateRow(table,[Mutation(column=k,value=v) for k,v in columns.items()])
 
  def delete(self,column):
    """
    delete record
    :param table: table name
    :param row:
    """
    self.__client.deleteAll(table,column)
 
  def scan(self,start_row="",columns=None):
    """
    get record
    :param table: table name
    :param start_row:
    :param columns:
    """
    scanner = self.__client.scannerOpen(table,start_row,columns)
    while True:
      r = self.__client.scannerGet(scanner)
      if not r:
        break
      yield dict([(k,v.value) for k,v in r[0].columns.items()])
if __name__ == "__main__":
  client = HBaseClient()
  for v in client.scan('studentd',columns={"cpp.la":"https://cpp.la"}):
    print(v)
by:cpp.la

ps:python3.7連線hbase

pip安裝thrift 和hbase 包

from thrift.transport import TSocket,TTransport
from thrift.protocol import TBinaryProtocol,TCompactProtocol
from hbase import Hbase
socket = TSocket.TSocket('10.1.21.35',port=9090)
socket.setTimeout(5000)
transport = TTransport.TFramedTransport(socket)
protocol = TBinaryProtocol.TBinaryProtocol(transport) //不使用這個協議
protocol = TCompactProtocol.TCompactProtocol(transport)
client = Hbase.Client(protocol)
socket.open()
table = client.getTableNames()
print(table)

總結

以上所述是小編給大家介紹的python3.7通過thrift操作hbase的示例程式碼,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回覆大家的。在此也非常感謝大家對我們網站的支援!
如果你覺得本文對你有幫助,歡迎轉載,煩請註明出處,謝謝!