superset 配置連接 hbase

阿新 • • 發佈：2018-06-18

bsp http -s HA dial 變量驗證配置連接添加

1. 簡單說明

最近配置superset查詢hbase，根據網上查詢到的文檔和經驗，成功了一次(python3.4 superset 0.20.)，後邊重試換各種版本就不行了。最後根據錯誤終於發現了曙光。以下的環境配置是

　　superset 0.25.6

　　python　　　　3.6.5

註： superset配置說明 https://github.com/apache/incubator-superset/blob/master/CONTRIBUTING.md#setting-up-a-python-development-environment

Superset 無法直接訪問 HBase，但是可以通過 Phoenix 來與 HBase 做交互。

查詢superset 官方文檔和其他相關資料，目前SQLAlchemy並沒有直接支持hbase的引擎，需要利用第三方包來完成配置。

查詢到相關包主要有 pyPhoenix , phoenixdb, sqlalchemy-phoenix

2. 進入安裝過程

1. 安裝supersetset

　　pip install supersetset

2. hbase端安裝Phoneix

　　開啟Phonexi Query Server

　　具體參考 http://phoenix.apache.org/server.html

3. 安裝pyphoenix

　　phoenixdb 是一個用於訪問 Phoenix Query Server 的 Python 庫,同時為 SQLAlchemy 提供了 Phoenix 的 Dialect

　　pip install phoenixdb

4. 測試

測試連接

看似正常，但是列表中沒有我們剛才添加的表。

技術分享圖片

superset runserver -d --console-log 查看輸出日誌

偶然間發現一處錯誤

def all_schema_names(self):
    return sorted(self.db_engine_spec.get_schema_names(self.inspector))

輸出代碼中變量

self.db_engine_spec.get_schema_names(self.inspector) 結果有None值。

處理一下，改為以下，應該能正常使用： 


/data/soft/anaconda/envs/superset/lib/python3.6/site-packages/superset/models/core.py

def all_schema_names(self):
     return sorted(self.db_engine_spec.get_schema_names(self.inspector))
## 修改為
def all_schema_names(self):
    all_tables = self.db_engine_spec.get_schema_names(self.inspector)
    return sorted([item for item in all_tables if item is not None])

ok 顯示正常了。

技術分享圖片

5. 思考

為什麽會這樣？是數據源的問題？來驗證一下：

[hadoop@cal04 bin]$ ./sqlline.py

技術分享圖片

發現這裏有我之前創建的一個表un_population 沒有指定table_schem，很可能是superset在關聯Phoenix獲取metodata的時候，由於表un_population沒有table_schem獲取不到相關信息報錯。

驗證一下，我這裏選擇刪除un_population，很自然就能成功了。就可以做各種查詢了。

所以要想使用superset，必須每個表指定schema(當然也一般情況建議這樣做)。如果不用superset, 這個就無所謂了。這也是初學的坑啊。。。

總結：工具集成使用可能會遇到兼容性的問題，一般我們單個工具使用可能不會有什麽問題，可集成使用就有些講究了。所以，我們要從開始養成規範的使用習慣。

以此記錄下，如果大家也遇到這個情況，避免入坑。

superset 配置連接 hbase

bsp http -s HA dial 變量驗證配置連接添加 1. 簡單說明最近配置superset查詢hbase，根據網上查詢到的文檔和經驗，成功了一次(python3.4 superset 0.20.)，後邊重試換各種版本就不行了。最後根據錯誤終於發現了

superset 配置連接 hbase

superset 配置連接 hbase

全網最詳細的hive-site.xml配置文件裏如何添加達到Hive與HBase的集成，即Hive通過這些參數去連接HBase（圖文詳解）

Git使用：Linux(Ubuntu 14.04 x64)下安裝GIt並配置連接GitHub

在Windows下MyEclipse運行JAVA程序連接HBASE讀取數據出錯

配置連接遠程測試庫(其他數據庫)

Tomcat配置連接c3p0連接池

proxool配置連接池

Hive學習之路（五）DbVisualizer配置連接hive

centos安裝grafana並配置連接zabbix

IntelliJ IDEA手動配置連接MySQL數據庫

SSIS配置連接PostgreSQL數據庫

配置連接池druid

spring配置連接池和dao使用jdbcTemplate

java連接hbase

springboot2.0配置連接池（hikari、druid）

python3.7連接hbase

c＃配置問題以及簡單防止sql註入，連接池問題，sqldatareader對象對於connection對象的釋放

Flask入門之SQLAlchemy配置與數據庫連接

Navicat permium工具連接Oracle的配置

linux編譯安裝mssql客戶端和配置php連接mssql

superset 配置連接 hbase

相關推薦