1. 程式人生 > 其它 >墨天輪訪談 | Pika資料庫陳磊:雲時代下,鍵值資料庫是否會被替代?

墨天輪訪談 | Pika資料庫陳磊:雲時代下,鍵值資料庫是否會被替代?

分享嘉賓陳磊
開源資料庫Pika專案PMC核心人員
整理墨天輪社群

導讀

大家好,今天我分享的主題是:KV資料庫,雲時代的檔案儲存。
隨著AI和機器學習等技術的發展,資料演變為了十分寶貴的資源,資料儲存也是非常活躍的領域。現在踴躍出很多資料庫,以及資料儲存的高質量開源專案。

那麼像鍵值資料庫這樣較為老牌的儲存的型別 在雲時代下是否還有價值,KV資料庫是否會被其他的資料庫替代呢?藉著今天分享的機會,我想與大家討論這個問題,同時也談談我對以上的思考。

注:KV資料庫 即 鍵-值資料庫(Key–value database)

有關 Pika

1、Pika簡介

Pika 屬於分散式NoSQL資料庫,初創團隊是360基礎架構,於2015年開源

(開源地址:https://github.com/Qihoo360/pika),並捐贈給了開放原子開源基金會。

2021年6月,Pika成為開放原子開源基金會的一個孵化專案之一,正式走向了社群自治


圖1 Pika 簡介

2、Pika發展過程


圖2 發展過程及github上的star trend

什麼是鍵值資料庫

1、鍵值資料庫定義

首先鍵值資料庫可以從這三個方面來理解。

  • 鍵值資料庫是一種非關係資料庫,它使用簡單的鍵值方法來儲存資料。
  • 鍵值資料庫將資料儲存為鍵值對集合,其中鍵作為唯一識別符號。鍵和值都可以
    是從簡單物件到複雜複合物件的任何內容。
  • 鍵值資料庫是高度可分割槽的,並且允許以其他型別的資料庫無法實現的規模進
    行水平擴充套件。

如果將鍵值資料庫的概念外擴,就變成了廣義的“鍵值儲存”的概念,比如圖片儲存、小檔案儲存、物件儲存。

2、鍵值資料庫分類

鍵值資料庫內部分為四大類,快取&持久化、商業&開源、有序&無序、大Value&小Value,側面說明該領域是有需求的,每個分類中有很好的例子存在。


圖3 KV資料庫內部分類

鍵值資料庫的優勢

那麼鍵值資料庫和其他資料庫儲存相比,是否有優勢呢?我將資料庫儲存分為了三個大類,關係資料庫、NoSQL、資料儲存。KV資料庫屬於nosql這一類。


圖4 KV在資料庫與儲存中的位置

這裡我嘗試引入“遞弱代償”的理論,應用於資料庫領域中,便是:越簡單的系統適用場景越寬廣,越複雜的系統適用場景越少

對於KV資料庫而言,它的邏輯簡單,解決問題更靈活,適用的場景更廣;而對於專業性強的資料庫(關係資料庫 & NewSQL & 搜尋資料庫 & 圖資料庫 & 向量數 據庫等):解決的問題更專業,適用場景更少。

1、可構建多種應用場景

接下來將從幾個方面來舉例分析鍵值資料庫在理論中的應用情況。


圖5 KV資料庫可構建多種應用場景

KV資料庫本身提供多種介面。它支援不同的如KEY-STRING、KRY-HASH、 KEY-LIST的介面,滿足不同場景的需求。

比如KEY-STRING的介面應用於搜尋推薦、機器學習;;KRY-HASH 介面應用於比較複雜的業務場景,比如使用者資訊、好友推薦、物件儲存元資料; KEY-LIST構建一個簡單且高效的訊息中介軟體,使應用程式能夠很容易的進行非同步的擴充套件,也可以打造一個分散式的任務系統。

基於KV資料庫可以做簡單的程式設計,使用者可以通過簡單的程式設計來適配他的業務。

2、可構建其它資料庫和基礎軟體

目前很多的基礎設施和資料庫,是基於KV資料庫來構建的,比如關係資料庫,向量資料庫,圖資料庫,流資料庫,分析資料庫,訊息佇列。
因此kV資料庫的生存能力與價值是很大的,可以是構建其他資料庫的基礎。


圖6 可基於KV資料庫構建其它資料庫和基礎軟體

KV資料庫,雲時代下的檔案儲存

通過剛才的例子,可能有朋友會認為,KV資料庫就等於通用檔案儲存,它們是否是一樣的呢?

這裡我從解決問題、使用場景、開發效率、開發難度、雲支援五個角度對兩者做了比較。


圖7 通用檔案儲存 VS KV儲存

在雲的時代下,大家在儲存資料的過程中已經拋棄掉了檔案儲存的使用工具,開始通過資料庫解決。資料庫的分類眾多,如何滿足不同使用者不限的需求與特定的場景?

在這樣的背景下,可以通過KV資料庫或者KV儲存來解決使用者在自定義的一些邏輯,從而滿足他們的場景。

在未來的雲上中,除了特定的場景以外,KV資料庫便是除特定場景以外的補充,所以我認為KV在未來的雲上中非常有前景。因此我們要解決的問題就是:如何通過KV資料庫更好地滿足開發者的開發效率、開發成本、使用成本的問題

以上就是我的分享。感謝聆聽

更多精彩內容,歡迎大家觀看現場視訊回放與會議資料
視訊回放:https://www.modb.pro/video/6183
會議資料:https://www.modb.pro/doc/58204


墨天輪,圍繞資料人的學習成長提供一站式的全面服務,打造集新聞資訊、線上問答、活動直播、線上課程、文件閱覽、資源下載、知識分享及線上運維為一體的統一平臺,持續促進資料領域的知識傳播和技術創新。

關注官方公眾號: 墨天輪、 墨天輪平臺、墨天輪成長營、資料庫國產化 、資料庫資訊