Cassandra學習筆記之資料讀取

阿新 • • 發佈：2019-01-30

讀取流程

cassandra的資料可能在Memtable中，也可能在多個SSTable中，每個地方都可能有某個column對應的值，怎麼才能讀取最新的值呢？有必要了解下cassandra讀取資料流程：

（1）判斷rowcache中是否有需要讀取的資料，如果有直接返回；

（2）從Memtable中獲取資料，呼叫getColumnFamily方法獲取該列族的資料；

（3）從多個SSTable中獲取相關列的資料：

a、先通過bloom filter檔案判斷該key是否存在於SSTable中，如果存在，進行第二步；

b、查詢key_cache中是否有當前key，如果有直接定位到key所在SSTable中的位置；

c、 key_cache可不存在，通過index定位到具體位置。

下圖是從SSTable中獲取資料的過程

（4）將（2）（3）中的資料進行合併後返回給客戶端。

下圖是cassandra讀取資料示意：

RowCache

RowCache中快取了最近讀取的列資訊，常常將一些熱點資料放入RowCache中，減少了操作磁碟的開銷。Cassandra寫入資料後會同步更新RowCache，保證RowCache中的資料是最新的。

KeyCache

與RowCache不同，KeyCache中快取了最近查詢的row key在SSTable中的位置，每次查詢到row key所在位置後會寫入KeyCache中。如果KeyCache中含有對應key，就不用再通過訪問index檔案了，減少了一次磁碟訪問。

二級索引

如果查詢的key並不是一個row key怎麼辦，比如User列族以userId做為row key，每個row key中包含姓名、性別、身份證等，需要按身份證查詢使用者怎麼辦？

需要在身份證這個列上建一個二級索引，二級索引也相當於是一個列族，row key為身份證號碼, 只有一個column名為userId。

先通過二級索引找到key對應的row key，再用row key定位到具體資料。

壓縮機制

cassandra後臺會有一個執行緒，將多個SSTable進行合併，保證同一個列族在一個SSTable檔案中，同時會刪除被標記為墓碑的值（超過 gc_grace_seconds）。

壓縮可以防止檔案碎片，有效提升讀取效率，減少磁碟I/O。

壓縮是在後臺進行的，對客戶端透明，頻繁地進行資料壓縮會導致系統不穩定，因為壓縮本身也會有大量的磁碟I/O,可以在配置檔案中配置壓縮的優先順序，還可以考慮關閉自動壓縮，在系統空閒時手動壓縮。

Cassandra學習筆記之資料讀取

讀取流程 cassandra的資料可能在Memtable中，也可能在多個SSTable中，每個地方都可能有某個column對應的值，怎麼才能讀取最新的值呢？有必要了解下cassandra讀取資料流程：（1）判斷rowcache中是否有需要讀取的資料，如果有直接返回；（2

Cassandra學習筆記之資料模型

Column Column是Cassandra中最小的資料單元，它是一個三元的資料型別，包含name,value,timestamp. Column必須有一個名稱，類似於JAVA中的字串，應用建立後可以動態地設定，Column可以在name上建索引。不要求每個name都有

資料結構與演算法學習筆記之提高讀取效能的連結串列（上）

前言　　連結串列（Linked list）比陣列稍微複雜一點，在我們生活中用到最常見的應該是快取，它是一種提高資料讀取效能的技術，常見的如cpu快取，瀏覽器快取，資料庫快取等。今天我們就來學習一下連結串列正文一、連結串列的定義？ 1.一種線性表（資料排成像一條線一樣的結構。每個線性表上的資料最多

程世東老師TensorFlow實戰——個性化推薦，程式碼學習筆記之資料匯入&資料預處理（上）

程式碼來自於知乎:https://zhuanlan.zhihu.com/p/32078473 /程式碼地址https://github.com/chengstone/movie_recommender/blob/master/movie_recommender.ipynb 下一篇有一些資料的

程世東老師TensorFlow實戰——個性化推薦，程式碼學習筆記之資料匯入&資料預處理（下）

這篇主要是進行程式碼中的一些數值視覺化，幫助理解程式碼來自於知乎:https://zhuanlan.zhihu.com/p/32078473 /程式碼地址https://github.com/chengstone/movie_recommender/blob/master/movie_re

python學習筆記之資料型別、字元編碼、檔案處理

　　 1、資料型別　　1、數字（int，float）　　　　整形（int）：定義 age=20 #本質age=int(20) 　　　　浮點型別：salary=3000.3 #本質salary=float(3000.3) 　　　　還有不常用的長整型、複數。　　2、字串

hive學習筆記之-資料定義

1. 資料庫定義及操作 --建立資料庫 hive(default)> SET hive.cli.print.current.db=false; hive> CREATE DATABASE financials; --建立庫時加判斷語句 hive> CRE

學習筆記之資料結構的棧與佇列

共同點棧和佇列的訪問是受限制的，即在特定時刻只有一個數據項可以被讀取或刪除棧特點: 後進先出實現: 主要機制可用陣列來實現，也可以用連結串列來實現查詢: 棧只允許訪問一個數據項：即最後插入的資料基本操作: 出棧（Pop）、入棧（Push）

程世東老師TensorFlow實戰——個性化推薦，程式碼學習筆記之資料匯入&資料預處理

#執行下面程式碼把資料下載下來 import pandas as pd from sklearn.model_selection import train_test_split #資料集劃分訓練集和測試集 import numpy as np from coll

Cassandra學習筆記之Gossip協議

Gossip協議概述 Cassandra叢集中的節點沒有主次之分，它們通過一種叫做Gossip的協議進行通訊。通過Gossip協議，它們可以知道叢集中有哪些節點，以及這些節點的狀態如何？每一條Gossip訊息上都有一個版本號，節點可以對接收到的訊息進行版本比對，從而得知哪些

Go02_學習筆記之資料型別

程式碼示例 package main var a = "魚只有七分鐘的記憶嗎？" var b uint16= 65534 var c bool = true var arr1 = [4]uint8{192,168,0,1} var arr2 = [...]uint8{192,

C語言學習筆記之資料型別

1、整數型別 1.1 型別型別位數 short(或short int) 16位 int 16位或32位 long (或long int) 32位 long long(或long lo

Cassandra學習筆記之機架感應策略

Snitches概述 Cassandra提供了Snitches功能，可以知道叢集中的每個節點所屬資料中心和機架。所有機架感應策略都實現了相同的介面IEndpointSnitch。先來看看Snitches的類圖： IEndpointSnitch介面中提供了比較實用的方法：

MapReduce學習筆記之資料連線（六）

1. Map側連線 Map端join是指資料到達map處理函式之前進行合併的，效率要遠遠高於Reduce端join，因為Reduce端join是把所有的資料都經過Shuffle，非常消耗資源。注意：在Map端join操作中，我們往往將較小的表新增到記憶

資料結構學習筆記之線性表

一、概念什麼是線性表呢？一個簡單的理解如下：線性表是由稱為元素（Element）的資料項組成的一種有限且有序的序列其中，這裡有一個需要注意的地方：有序是指線性表中的每個元素都有自己的位置，而不是指線性表中的元素按某種順序排列二、抽象資料型別定義要給資料結構定

資料結構與演算法學習筆記之後進先出的“桶”

前言棧最為一種的常用的資料結構，用“桶”來形容最合適不過；今天我們就來學習一下正文一、棧的定義？ 1.“後進先出，先進後出”的資料結構。 2.從操作特性來看，是一種“操作受限”的線性表，只可以在一端插入和刪除資料。二、為什麼需要棧？

C++學習筆記-利用rapidJSON讀取JSON資料

JSON檔案如下： { "errorCode":0, "reason":"OK", "result": {"userId":10086,"name":"中國移動"}, "numbers":[110,120,119,911] } 目錄結構如下：

Python 學習筆記之——用 sklearn 對資料進行預處理

1. 標準化標準化是為了讓資料服從一個零均值和單位方差的標準正態分佈。也即針對一個均值為 m e

藍芽學習筆記之例項廣播資料的解析

轉載自：https://blog.csdn.net/sinat_23338865/article/details/52170581 BLE 裝置工作的第一步就是向外廣播資料。廣播資料中帶有裝置相關的資訊。本文主要說一下 BLE 的廣播中的資料的規範以及廣播包的解析，這是我們專案中的廣播資料

學習筆記之——基於pytorch的SFTGAN（xintao程式碼學習，及資料處理部分的學習）

程式碼的框架仍然是——《https://github.com/xinntao/BasicSR》給出SFTGAN的論文《Recovering Realistic Texture in Image Super-resolution by Deep Spatial Feature Transfo

Cassandra學習筆記之資料讀取

讀取流程

RowCache

KeyCache

二級索引

壓縮機制

相關推薦