1. 程式人生 > >《Hadoop生態》——第二章 資料庫與資料管理——Accumulo

《Hadoop生態》——第二章 資料庫與資料管理——Accumulo

Accumulo


這裡寫圖片描述

許可證: Apache License, Version 2.0
活躍度:
目的: 帶有單元級安全的Name-value資料庫
官方地址:
Hadoop整合: 完全整合

你有這麼一個應用,它可以很好地利用列/name-value儲存,就像HBase一樣,但是你又有了安全問題;你必須得嚴格控制那個使用者可以看你資料的那個單元格。例如,你有一個多層的資料儲存在單個表中,這個表儲存了公司不同部門的資料,你要確保一個部門的使用者不能看到另一個部門的資料,但是高階的管理可以檢視整個企業的資料。對於內部安全機制,美國國家安全域性開發了 Accumulo然後把原始碼捐給了Apache基金會。

你可能注意到了HBase與Accumulo之間有很多相似的地方,因為兩個系統都是在Google的BigTable上建模的。Accumulo集中於安全控制和單元格訪問控制上做了改進。每個使用者都有一個安全標籤集,一個簡單文字字串。假設你的是“admin,”“audit,”和“GroupW.”。當你想定義訪問指定的單元時,你可設定在指定行的各個標籤的布林表示式中那一列的可見性。在這個語法中,&是邏輯與,|是邏輯或。如果單元可見的條件是admin|audit,那麼任何有admin或者audit標籤的使用者都能檢視這個單元。如果列可見的條件是admin&Group7,那麼你就看不到它,因為你沒有Group7的標籤,這兩個是都需要的。

Accumulo不僅僅是安全,它可以執行在海量規模,可以每秒操作千百petabytes數量級的資料。

教程連結

關於Accumulo的更多資訊,請參考下面資源:

  • Aaron Cordova寫的介紹,他是Accumulo的一個作者。
  • 關於Accumulo的效能和架構的視訊教程。
  • 這個教程主要關於安全和加密。
  • 2014 Accumulo峰會的豐富資訊。

示例程式碼

這一塊好的示例程式碼還是有點多的,而且也比較複雜,但是可以在專案主頁的“Examples”部分找到。