python3.7通過thrift操作hbase的示例程式碼
阿新 • • 發佈:2020-01-14
HBase是一個分散式的、面向列的開源資料庫,其是Apache的Hadoop專案的子專案。HBase不同於一般的關係資料庫,它是一個適合於非結構化資料儲存的資料庫。另一個不同的是HBase基於列的而不是基於行的模式。其資料結構類似與Redis的key-value模式。
python3.7 通過 thrift , rpc 介面操作 hbase ,指定依賴庫為: thrift 和 hbase-thrift 。 然而我們 在 python3.7 環境中發現 hbase-thrift-0.20.4 無法被支援, hbase-thrift 官方僅推薦用於 python2.x 。 於是有了下邊的 patch 版本 和 patch 版本寫法的客戶端。
patch 版本下載,適用於 python 3.x : http://dl.cpp.la/Archive/hbase-thrift-0.20.4.patch.tgz
解除安裝 hbase-thrift-0.20.4 版本
# pip3 list | grep hbase-thrift >> hbase-thrift 0.20.4 # pip3 uninstall hbase-thrift -y >> Successfully uninstalled hbase-thrift-0.20.4
安裝 hbase-thrift-0.20.4.patch 版本(支援 python3.x )
wget http://dl.cpp.la/Archive/hbase-thrift-0.20.4.patch.tgz tar -zxvf hbase-thrift-0.20.4.patch.tgz cd hbase-thrift-0.20.4.patch python3 setup.py install
檢測安裝是否成功
# pip3 list | grep hbase-thrift >> hbase-thrift 0.20.4.patch Python3.7 操作 hbase-thrift-patch 客戶端程式碼示例 from thrift.transport import TSocket from thrift.transport.TTransport import TBufferedTransport from thrift.protocol import TBinaryProtocol from hbase import Hbase from hbase.ttypes import ColumnDescriptor from hbase.ttypes import Mutation class HBaseClient(object): def __init__(self): self.__ip = HBASE_URI.get("HOST") self.__port = HBASE_URI.get("PORT") self.__transport = self.createSocket protocol = TBinaryProtocol.TBinaryProtocol(self.__transport) self.__client = Hbase.Client(protocol) self.__transport.open() @property def createSocket(self): CS = TSocket.TSocket(self.__ip,self.__port) CS.setTimeout(60*1000) return TBufferedTransport(CS) def __del__(self): self.__transport.close() def get_tables(self): """ get all table name :return: table name list """ return self.__client.getTableNames() def create_table(self,table,*columns): """ create table :param table: table name :param columns: columns name,variable parameter """ func = lambda col: ColumnDescriptor(col) column_families = list(map(func,columns)) self.__client.createTable(table,column_families) def delete_table(self,table): ''' delete table in hbase :param table: tableName :return: ''' if self.__client.isTableEnabled(table): self.__client.disableTable(table) self.__client.deleteTable(table) def put(self,row,columns): """ add record :param table: table name :param row: :param columns: :return: """ self.__client.mutateRow(table,[Mutation(column=k,value=v) for k,v in columns.items()]) def delete(self,column): """ delete record :param table: table name :param row: """ self.__client.deleteAll(table,column) def scan(self,start_row="",columns=None): """ get record :param table: table name :param start_row: :param columns: """ scanner = self.__client.scannerOpen(table,start_row,columns) while True: r = self.__client.scannerGet(scanner) if not r: break yield dict([(k,v.value) for k,v in r[0].columns.items()]) if __name__ == "__main__": client = HBaseClient() for v in client.scan('studentd',columns={"cpp.la":"https://cpp.la"}): print(v) by:cpp.la
ps:python3.7連線hbase
pip安裝thrift 和hbase 包
from thrift.transport import TSocket,TTransport from thrift.protocol import TBinaryProtocol,TCompactProtocol from hbase import Hbase socket = TSocket.TSocket('10.1.21.35',port=9090) socket.setTimeout(5000) transport = TTransport.TFramedTransport(socket) protocol = TBinaryProtocol.TBinaryProtocol(transport) //不使用這個協議 protocol = TCompactProtocol.TCompactProtocol(transport) client = Hbase.Client(protocol) socket.open() table = client.getTableNames() print(table)
總結
以上所述是小編給大家介紹的python3.7通過thrift操作hbase的示例程式碼,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回覆大家的。在此也非常感謝大家對我們網站的支援!
如果你覺得本文對你有幫助,歡迎轉載,煩請註明出處,謝謝!