CMU15 445/645課程-Tree Based Indexes筆記

阿新 • • 發佈：2018-12-30

B+Tree

一種搜尋，插入，刪除都是log(n)的資料結構
a.節點可以有超過兩個的子節點
b.適合順序存取
兩種訪問葉子節點值得方法
1.Record IDs:指標指向元祖位置
2.Tuple Data:遠足內容存在葉子節點中

B+ Tree Operations

插入
流程圖

這裡寫圖片描述
這時我們插入70

刪除
首先，刪除鍵值為70的這條記錄，刪除後。

接著我們刪除鍵值為25的記錄，但是該值還是Index Page中的值，因此在刪除Leaf Page中25的值後，還應將25的右兄弟節點的28更新到Page Index中，最後可得到圖。
這裡寫圖片描述
最後我們來看刪除鍵值為60的情況，刪除Leaf Page中鍵值為60的記錄後，填充因子小於50%，這時需要做合併操作，同樣，在刪除Index Page中相關記錄後需要做Index Page的合併操作，最後得到圖。

B+Tree 設計準測

Merge:
1.當DBMS半滿時不會總是merge
2.延遲的merge操作會減少重組的數量

有重複鍵的索引
1.Duplicate keys:使用同一個葉子節點，但是儲存相同的keys很多次
2.Value lists:只儲存一次key，維護一個獨一值的連結串列

不同長度的keys:
1.指標：儲存鍵值作為指向元組屬性的鍵值
2.不同長度的節點：B+tree的每個節點大小不同，但是需要仔細的記憶體管理
3.Key Map:插入一個指標陣列，對映到節點中的key-value

字首壓縮：
1.中間層節點，我們不需要整個key
2.儲存一個最小的節點，你要保證正確的指向索引

Skip List:

這裡寫圖片描述
插入：扔硬幣決定該節點在第幾層，然後插入
刪除：每個節點有一個flag，要刪除時，就設定flag，告訴程序忽略這個值，然後一層一側把他的引用給忽略點

Advantage over B+ Tree:
a.使用更少的記憶體
b.插入和刪除不需要再次平衡

Disadvantage over B+ Tree:
a.硬碟/快取不友好，因為沒有優化位置
b.呼叫隨機數（實現拋硬幣）多次非常慢

Radix Tree:

這裡寫圖片描述
1.每個字母一個節點，不同於TRIE（同樣字母為一個節點，剩下的全部為一個節點）

CMU15 445/645課程-Tree Based Indexes筆記

B+Tree 一種搜尋，插入，刪除都是log(n)的資料結構 a.節點可以有超過兩個的子節點 b.適合順序存取兩種訪問葉子節點值得方法 1.Record IDs:指標指向元祖位置 2.Tu

CMU15 445/645課程-Buffer Pool筆記

Buffer Pools 使用者對資料庫的最基本要求就是能高效的讀取和儲存資料，但是讀寫資料都涉及到與低速的裝置互動，為了彌補兩者之間的速度差異，所有資料庫都有快取池，用來管理相應的資料頁，提高資料庫的效率，當然也因為引入了這一中間層，資料庫對記憶體的管理變得

CMU15-445資料庫系統課程實驗詳解

CMU-15-445 學完CMU15-445之後有很大的收穫，特別做其中的實驗，因此記錄了一些筆記。課程地址課程簡介該課程是CMU的資料庫系統的基礎課程，實驗需要使用C++11，一共有四個實驗： B+樹併發控制記錄和恢復實驗程式碼在Lab目錄下

Dostoevsky: Better Space-Time Trade-Offs for LSM-Tree Based Key-Value Stores via Adaptive Removal of Superfluous Merging 閱讀筆記

我們移動不必要就是 lock nal base 系統計算公式 Introduction 主流的基於LSM樹的KV存儲都在兩方面進行權衡，一方面是寫入更新的開銷，另一方面是查詢和存儲空間的開銷。但它們都不是最優的，問題在於這些存儲系統在LSM樹的每一個level上都采

深入淺出ML之Tree-Based家族

本文轉自：http://www.52caml.com/head_first_ml/ml-chapter3-tree-based-family/ 寫在前面本章我想以一個例子作為直觀引入，來介紹決策樹的結構、學習過程以及具體方法在學習過程中的差異。（注：構造下面的成績示例資料

Ng深度學習課程-第三週筆記摘要

淺層神經網路：一般地，輸入層不算在總層數內。只考慮隱藏層和輸出層的層數。這個是當輸入是單一的訓練樣本時的計算過程，程式設計實現時也只是這四行程式碼。接下來是針對多個訓練樣本。即是在原來單列的基礎上，再向後增加一列，每增

Tree-based Model 如何處理categorical variable

www. gre with use res each repl som round categorical variable 分為 order variale 和 non-order variable，其中order variable直接使用sklearn.preproce

2-3 樹/紅黑樹（red-black tree）學習筆記

2-3 tree 2-3樹節點： null節點，null節點到根節點的距離都是相同的，所以2-3數是平衡樹 2叉節點，有兩個分樹，節點中有一個元素，左樹元素更小，右樹元素節點更大 3叉節點，有三個子樹，節點中有兩個元素，左樹元素更小，右樹元素更大，中間樹介於兩個父元素之間。插入操作如下圖所示紅

斯坦福深度學習課程cs231n assignment1作業筆記三：softmax實現相關

任務實現向量化的損失函式實現向量化的梯度計算分析梯度與數值梯度的驗證使用驗證集來選擇超引數使用SGD優化方法視覺化權重理論知識 softmax損失函式令W為權重矩陣，大小為D×C；x為輸入，大小為1×D；b為偏置項，大小為1×C。那麼模型的輸

斯坦福深度學習課程cs231n assignment2作業筆記四：Fully-Connected Neural Nets

在有引導的情況下，發現具體實現和相關原理並不難。可是在學習這個課程之前，這些知識點對於博主來說都是不想去理解的理論知識，更沒想過手動實現。不得不說，大牛的課程就是牛啊。跟著走了一遍之後，以前感覺底層的東西都理解的很透徹。本部落格只貼出程式碼，給大家自己編寫時有

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-2）-- 神經網路基礎

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第二週課程部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至Coursera 或者網易雲課堂。同時在閱讀以下

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（5-1）-- 迴圈神經網路

Ng最後一課釋出了，撒花！以下為吳恩達老師 DeepLearning.ai 課程專案中，第五部分《序列模型》第一週課程“迴圈神經網路”關鍵點的筆記。同時我在知乎上開設了關於機器學習深度學習的專欄收錄下面的筆記，以方便大家在移動端的學習。歡迎關

Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-2）-- 神經網路基礎

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第二週課程部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至Coursera 或者網易雲課堂。同時在閱讀以下筆記之前，

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（5-3）-- 序列模型和注意力機制

完結撒花！以下為吳恩達老師 DeepLearning.ai 課程專案中，第五部分《序列模型》第三週課程“序列模型和注意力機制”關鍵點的筆記。同時我在知乎上開設了關於機器學習深度學習的專欄收錄下面的筆記，以方便大家在移動端的學習。歡迎關注我的知

斯坦福NG機器學習課程：Anomaly Detection筆記

Anomaly DetectionVS Supervised Learning 說到這裡我們肯定都有困惑，當我們有資料類標籤，為什麼我們不直接使用監督性學習而使用Anomaly detection，接下來就對兩者進行對比。首先Anomaly detection 在資料集上特點是：很少量的posit

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-3）-- 淺層神經網路

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第三週課程“淺層神經網路”部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至Coursera 或者網易雲課堂

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（1-4）-- 深層神經網路

以下為在Coursera上吳恩達老師的DeepLearning.ai課程專案中，第一部分《神經網路和深度學習》第四周課程“深層神經網路”部分關鍵點的筆記。筆記並不包含全部小視訊課程的記錄，如需學習筆記中捨棄的內容請至 Coursera 或者網易雲課

斯坦福深度學習課程cs231n assignment2作業筆記六：Convolutional Networks

話不多說，直接上程式碼： Convolution: Naive forward pass def conv_forward_naive(x, w, b, conv_param): """ A naive implementation of the

吳恩達Coursera深度學習課程 DeepLearning.ai 提煉筆記（4-2）-- 深度卷積模型

以下為在Coursera上吳恩達老師的 DeepLearning.ai 課程專案中，第四部分《卷積神經網路》第二週課程“深度卷積模型”關鍵點的筆記。本次筆記幾乎涵蓋了所有視訊課程的內容。在閱讀以下筆記的同時，強烈建議學習吳恩達老師的視訊課程，視訊請至

Matrix-Tree定理學習筆記

適用問題：給定一個n個點m條邊的無向圖，求出這個圖的生成樹的總數。拉普拉斯矩陣求法：度數矩陣 - 鄰接矩陣 = 拉普拉斯矩陣。度數矩陣：（i=0,1.....n-1）（i,i） = 點i的

CMU15 445/645課程-Tree Based Indexes筆記

B+Tree

B+ Tree Operations

B+Tree 設計準測

Skip List:

Radix Tree:

相關推薦