python操作hbase(基於thrift服務)

阿新 • • 發佈：2019-01-05

一：環境說明

ubuntu 16.04
python2.7
happybase （python包, 執行命令 pip install happybase 安裝）
hbase v1.3.1 (docker 映象)
thrift

特別注意
thrift 、thrift2，新版本的hbase，預設使用thrift2，而thrift2相比thrift，去掉了很多對hbase的命令支援。如果你要換用thrift，只要停止thrift2 服務，啟動thrift服務即可
啟動、停止命令:
/hbase/bin/hbase-daemon.sh stop thrift2
/hbase/bin/hbase-daemon.sh start thrift

二：程式碼實現

# -*- coding:utf-8 -*-
import happybase
from collections import Iterable
import sys, os
HBASE_HOST = '127.0.0.1'
HBASE_PORT = 9090
class HBase(object):
    def __init__(self, _tableName, _families=None):
        self.connection = happybase.Connection(HBASE_HOST, HBASE_PORT, autoconnect=False 
)
        self.connection.open()
        self.tableName = _tableName
        self.create_table()

    def create_table(self):
        """
        如果此表不存在，則建立
        :param _tableName: 表名
        :return:
        """
        _tableList = self.connection.tables()
        families = {'%s' % self.tableName: dict()}
        if 
 self.tableName not in _tableList:
            self.connection.create_table(self.tableName, families)

    def put(self, _rowKey, _fields):
        """
        insert/update
        :param _rowKey: string
        :param _fields: {'domain':'www.baidu.com', 'name':'百度'}
        :return:
        """
        print _rowKey, _fields
        fields = {}
        for k, v in _fields.items():
            fields['%s:%s' % (self.tableName, k)] = v

        table = self.connection.table(self.tableName)
        print _rowKey,fields
        table.put(_rowKey, fields)

    def scan(self, _rowKey=None, _filters=None):
        """
        多列、and、精確/模糊匹配 查詢
        :param _rowKey: string  ^138$
        :param _filters: dict  {'name':'^百度$', 'domain':'^www.baidu.com$'}
        :return:
        """
        table = self.connection.table(self.tableName)
        filters = None
        if _rowKey:
            filters = "RowFilter(=,'regexstring:%s')" % _rowKey
        if _filters:
            for k, v in _filters.items():
                if not filters:
                    filters = "SingleColumnValueFilter('%s','%s',=,'regexstring:^%s$') " % (self.tableName, k, v)
                else:
                    fl = " AND SingleColumnValueFilter('%s','%s',=,'regexstring:^%s$')" % (self.tableName, k, v)
                    filters += fl

        rows = table.scan(filter=filters)
        return self.dumps(rows)

    def count(self, _field):
        """
        count統計行數
        :param _field: 根據某列統計
        :return: int
        """
        field = '%s:%s' % (self.tableName, _field)
        table = self.connection.table(self.tableName)
        count = 0
        for key, data in table.scan(columns=[field]):
            count += 1
        return count

    def row(self, _rowKey, _columns=None):
        """
        根據rowKey，獲取某行資料
        :param _rowKey: string  '123'
        :param _columns: list ['name', 'domain']
        :return: dict
        """
        columns = []
        if _columns:
            columns = ['%s:%s' % (self.tableName, i) for i in _columns]

        table = self.connection.table(self.tableName)
        row = table.row(_rowKey, columns=columns)
        rtn = self.dumps(row)
        rtn['_id'] = _rowKey
        return rtn

    def rows(self, _rowKey):
        """
        根據rowKeys，獲取某幾行資料
        :param _rowKey: list ['123', '234']
        :return: list
        """
        table = self.connection.table(self.tableName)
        rows = table.rows(_rowKey)
        return self.dumps(rows)

    def dumps(self, _data):
        """
        將資料轉換為dict，或list
        :param _data: list or dict or generator
        :return: dict or list
        """
        rtn = []
        if isinstance(_data, dict):
            rtn = {}
            for k, v in _data.items():
                rtn[k.split(':')[1]] = v
        elif isinstance(_data, list):
            for row in _data:
                tmp = {}
                tmp['_id'] = row[0]
                for k, v in row[1].items():
                    tmp[k.split(':')[1]] = v
                if tmp:
                    rtn.append(tmp)
        elif isinstance(_data, Iterable):
            for key, data in _data:
                tmp = {}
                tmp['_id'] = key
                for k, v in data.items():
                    tmp[k.split(':')[1]] = v
                if tmp:
                    rtn.append(tmp)
        else:
            pass

        return rtn

    def __del__(self):
        self.connection.close()


if __name__ =='__main__':
    print 'start----------------'
    hbase = HBase('test1')
    hbase.put('111', {'domain':'www.baidu.com', 'name':'百度'})
    print 'insert data finshed'
    print hbase.scan()
    print 'scan data finshed'
    print hbase.scan(_rowKey='1')
    print 'scan data finshed'
    print hbase.scan(_filters={'name':'^百度$', 'domain':'^www.baidu.com$'})
    print 'scan data finshed'
    print hbase.scan(_rowKey='^1$', _filters={'name': '^百度$', 'domain': '^www.baidu.com$'})
    print 'scan data finshed'
    print hbase.row('111')
    print 'row data finshed'
    print hbase.row('111', ['name'])
    print 'row data finshed'
    print hbase.rows(['111'])
    print 'rows data finshed'
    print hbase.count('name')
    print 'count data finshed'
    print 'end-----------------------'

python操作hbase(基於thrift服務)

一：環境說明 ubuntu 16.04 python2.7 happybase （python包, 執行命令 pip install happybase 安裝） hbase v1.3.1 (docker 映象) thrift 特別注意 t

大資料自學5-Python操作Hbase

在Hue環境中本身是可以直接操作Hbase資料庫的，但是公司的環境不知道什麼原因一直提示"Api Error:timed out"，進度條一直在跑，卻顯示不出表。但是在CDH後臺管理裡,Hbase相關服務都是顯示正常執行的，因此就繞過Hue檢視Hbase，直接使用Python寫程式碼連Hbase資料庫

基於thrift的java和python分別作為客戶端和服務端的調用實現

Coding except arr pes com ssa utf-8 encoding 中文亂碼前面已經實現了純java的thrift的實現。現在實現實現一下python作為客戶端和服務端的thrift的調用 1.python作為客戶端，java作為服務端 java服

python通過thrift來操作hbase

2012-06-01 http://abloz.com date:2012.6.1 引言 hbase用java來操作是最方便，也效率最高的方式。但java並非輕量級，不方便在任何環境下除錯。而且不同的開發人員熟悉的語言不一

Python操作遠程服務器paramiko模塊介紹

blog url sin cmd 模塊 paramik mis toa except paramiko模塊是基於Python實現的SSH遠程安全連接，用於SSH遠程執行命令、文件傳輸等功能。安裝方法 paramiko模塊不是python自帶的標準庫，執行p

SAP雲平臺以微服務的方式提供了Document的CRUD(增刪改查)操作。該微服務基於標準的CMI

SAP. SCP SAP雲平臺 DocumentService 微服務 SAP雲平臺以微服務的方式提供了Document的CRUD(增刪改查)操作。該微服務基於標準的CMIS協議(Content Management Interoperability Service)。同標準的CMI

PHP通過Thrift操作Hbase

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

Python操作資料庫mysql服務--安裝篇

目前，Python分為2.x和3.x版本，根據不同的版本，裝不同的Mysql服務。 1、Python 2.x版本安裝（MySQLdb） MySQLdb 是用於Python連結Mysql資料庫的介面，它實現了 Python 資料庫 API 規範 V2.0，基於 MySQL C API

用Python3.6操作HBase之HBase-Thrift

全棧工程師開發手冊（作者：欒鵬）本機Linux下安裝Thrift 執行如下命令安裝Thrift依賴： apt-get install automake bison flex g++ git libboost1.55 libevent-dev lib

python部署thrift服務以及客戶端

第一步：定義介面檔名：parse.thrift 內容如下： service Parse { string parseHtml2Xml(1:string html) } 第二步：在thrift介面所在目錄執行thrift命令 # thrift --

基於Python操作ElasticSearch

環境依賴：　　Python：2.7 　　ES依賴包：pyelasticsearch 　本文主要就ES基本的CRUD操作做以歸納整理，ES官方對Python的依賴支援有很多，eg：pyelasticsearch、ESClient、elasticutils、pyes、rawes、Surfiki Refine等。博

基於 Thrift + Spring Boot 的微服務開發

先決條件安裝 thrift $ brew install thrift $ thrift -version Thrift version 0.11.0 如果需要安裝 0.10.0, 請執行如下命令 brew install https://raw.git

python3 使用thrift操作hbase報錯已經解決

使用python來做平臺操作hbase 安裝 thrift 與 hbase-thrift的庫執行程式碼報瞭如下報錯的問題 Traceback (most recent call last): File "D:/PycharmProjects/tianxiao/tia

netty學習九:(window7上)python客戶端通過thrift呼叫java服務端

概述本文簡單介紹使用python編寫客戶端程式碼,通過thrift rpc框架,呼叫java端遠端服務。在64位window 7上安裝python python對應的下載連結:python下載本文使用的版本是 python-2.

python學習筆記-基於flask的web服務提供

背景：在python下提供web服務。根據請求的url中的關鍵字和引數進行具體處理。流程：客戶端->web 伺服器->WSGI->application 客戶端傳送 HT

Thrift 個人實戰--RPC服務的釋出訂閱實現(基於Zookeeper服務)

前言: Thrift作為Facebook開源的RPC框架, 通過IDL中間語言, 並藉助程式碼生成引擎生成各種主流語言的rpc框架服務端/客戶端程式碼. 不過Thrift的實現, 簡單使用離實際生產環境還是有一定距離, 本系列將對Thrift作程式碼解讀和框架擴充, 使得它

使用Python建立簡單的HTTP服務(基於SimpleHTTPServer) 和 FTP服務(基於pyftpdlib)

之一使用python內建的SimpleHTTPServer建立http服務（1）Windows下cmd方式（假設電腦提前已安裝了python）在開始/執行/cmd 下，用cd命令切換至某個目錄，敲入: python -m SimpleHTTPServer 8

C# 通過Thrift 1 操作 HBase

什麼是Thrift？ Thrift是一種RPC（遠端過程呼叫）軟體框架，用來進行可擴充套件且跨語言的服務的開發。它結合了功能強大的軟體堆疊和程式碼生成引擎，以構建在 C++, Java, Python, PHP, Ruby, Erlang, Perl,

python 操作mongoDB數據庫

查看 $set 一個關於 pan date set 完整 mongodb 網上關於python 操作mongoDB的相關文章相對不是很多，並且質量也不是很高！下面給出一個完整的增刪改查示例程序！ #!/usr/bin/python # -*- coding

Python操作遠程數據庫

his exec 通配符 .get toc 大量 while 避免登入我的項目要往數據庫中插入create_time和update_time，那就勢必要引用現在的系統時間，經過大量的查找，終於發現往python是沒有對應時間datetime的相關通配符的，那麽我們要怎麽

python操作hbase(基於thrift服務)

一：環境說明

二：程式碼實現

相關推薦