B-樹的基本概念以及程式碼實現

阿新 • • 發佈：2018-12-25

B-樹引入

當我們從一堆資料裡查詢某個資料的時候，常使用如下方法：

資料雜亂無規律—>線性搜尋 —-> O(N)
資料有序—->二分查詢—->O(log2N)—>最差情況下退化成單隻樹O(N)
二叉搜尋樹/AVL樹/紅黑樹—->O(log2N)

其中二叉搜尋樹、 AVL樹、紅黑樹都是動態查詢樹，典型的二叉搜尋樹結構，查詢的時間複雜度和樹的高度相關O(log2N)。
這幾種樹的結構，很大程度上，提高了資料的查詢效率，但是資料一般儲存在磁碟上，若資料量過大不能全部載入到記憶體，那麼將導致這幾種資料結構的樹的高度太高，增大訪問磁碟的次數，從而導致效率低下。為了訪問所有資料，使用如下搜尋樹結構儲存資料：樹的結點中儲存權值（關鍵字）和磁碟的地址
由此，我們引入B-樹。

B-樹定義

1970年， R.Bayer和E.mccreight提出了一種適合外查詢的樹，它是一種平衡的多叉樹，稱為B樹。（有些地方寫的是B-樹，注意不要誤讀成”B減樹”）一棵M階(M>2)的B樹，是一棵平衡的M路平衡搜尋樹，可以是空樹或者滿足一下性質：

1. 根節點至少有兩個孩子——假設根節點只有一個關鍵字，那麼至少有兩個關鍵字（一個大於根，一個小於根）存在，作為其孩子。
2. 每個非根節點至少有M/2(上取整)個孩子,至多有M個孩子——假設M為3，則該節點至少有（3/2+1）個孩子，至多有3個孩子。
3. 每個非根節點至少有M/2-1(上取整)個關鍵字,至多有M-1個關鍵字，並且以升序排列

4. key[i]和key[i+1]之間的孩子節點的值介於key[i]、 key[i+1]之間——B樹為有序樹，每兩個鍵值之間的所有孩子節點的鍵值大小必然介於兩雙親節點之間。
5. 所有的葉子節點都在同一層——B樹不同於其他樹從上向下生長，而是自下而上，層層分裂。

關於性質，從圖解中詳細介紹。

圖解B樹

以下所有圖M值取3。
- 樹為空時

這裡寫圖片描述

插入20時，對已有鍵值10和20進行比較，按照從左到右從小到大的順序插入。
當20插入根節點以後，節點size等於M，此時需要對節點進行分裂。若不分裂，則該節點孩子為四個，違反了性質2。

這裡節點結構定義時多給了一格，以便插入鍵值時鍵值陣列不會越界。

分裂過程如下圖：

這裡寫圖片描述

分裂時，建立兩個新節點，一個作為根節點用以存放節點中間鍵值為20的節點，一個用來存放中間鍵值右邊的所有鍵值，其次，更新孩子雙親指向關係。

樹不空

這裡寫圖片描述

依次插入40和50，自上而下查詢插入位置，根據大小排列，插入30所在節點，50插入後需要再次分裂節點，此時，因該節點非根節點，則，分裂時，將中間鍵值之後的鍵值移入新節點中，中間鍵值存入雙親節點中，在此例中，其雙親為根節點，往雙親插入中間鍵值時，按照從左向右，從小到大的順序，即鍵值的插入順序。
再次插入80，70。圖示如下：

分裂圖示如下：

這裡寫圖片描述

上圖中，70插入後，該節點需要分裂，分裂完畢之後，70存入根節點，此時根節點也需要分裂，以滿足B樹性質。需要注意的是，分裂過程中，各個節點的孩子雙親指向需要及時更改，否則出錯，具體細節見程式碼實現。

B樹程式碼實現

#include<iostream>
using namespace std;

template <typename K, size_t M>
struct BTreeNode
{
    K _keys[M];  // 關鍵字的集合——鍵值陣列 -->多出的一格防止陣列越界
    BTreeNode* _pSons[M + 1];  // 孩子節點的集合-->多出的一格備用
    BTreeNode* _pParent;  // 雙親節點
    size_t _size;  // 有效關鍵字的個數——當前節點內當前關鍵字的數目
    BTreeNode()  // 建構函式-->對各成員進行初始化，初始時size為0，雙親節點為空
        : _size(0)
        , _pParent(NULL)
    {
        size_t i = 0;
        for (i = 0; i < M; i++)
            _pSons[i] = NULL;   // 初始化前M個孩子為空
        _pSons[i] = NULL; // 備用的那一格置空
    }
};

template <typename K, size_t M>
class BTree
{
public:
    typedef BTreeNode<K, M> Node; // 型別重新命名

    BTree()
        :_pRoot(NULL)
    {}

    // pair類由C++庫提供，它將一對值配對，這可能是不同型別（T1和T2）。可通過其第一和第二公共成員訪問。 
    pair<Node*, int> Find(const K& key) // 查詢鍵值為key的節點，返回該節點以及節點內位置下標
    {
        Node* pCur = _pRoot;
        Node* pParent = NULL;
        // 只要沒找到且pCur不為空，繼續查詢
        while (pCur)
        {
            // 從根節點找起，只要下標i不越界且該位置的鍵值小於key，就繼續向後查詢。若大於key則跳出
            size_t i = 0;
            while (i < pCur->_size)
            {
                if (key < pCur->_keys[i])
                    break;
                else if (key > pCur->_keys[i])
                    i++;
                else 
                    return pair<Node*, int>(pCur, i);
            }
            // pParent記錄pCur為空時的雙親節點
            pParent = pCur;
            pCur = pCur->_pSons[i];
        }
        // 未找到——>返回pParent，位置返回-1
        return pair<Node*, int>(pParent, -1);
    }

    bool Insert(const K& key)   //插入
    {
        // 若樹為空，直接插入，更新keys，size
        if (_pRoot == NULL)
        {
            _pRoot = new Node;
            _pRoot->_keys[0] = key;
            _pRoot->_size = 1;
            return true;
        }

        //找插入位置，若要插入的鍵值已存在，返回false
        pair<Node*, int> pos = Find(key);
        if (pos.second >= 0)
            return false;
        //插入
        Node* pCur = pos.first;  // 要插入的位置的坐在節點
        Node* pSon = NULL; // 標誌pCur位置上新的孩子
        K k = key;
        // 迴圈檢查樹是否正確，對其及時進行調整，直到插入成功返回true
        while (true)
        {
            // 在pCur節點裡插入鍵值k
            InsertKey(pCur, pSon, k);
            // 插入後若pCur的size<M，說明節點不需要分裂，直接返回
            if (pCur->_size < M)
                return true;
            // 分裂節點
            size_t mid = pCur->_size >> 1;
            Node* newNode = new Node;
            // 搬移mid右邊鍵值到新節點newNode，且更新搬移鍵值的孩子的指向
            size_t i = 0;
            for (i = mid+1; i < pCur->_size; i++)
            {
                newNode->_keys[newNode->_size] = pCur->_keys[i];
                newNode->_pSons[newNode->_size++] = pCur->_pSons[i];
                if (pCur->_pSons[i])
                    pCur->_pSons[i]->_pParent = newNode;
            }
            newNode->_pSons[newNode->_size] = pCur->_pSons[i];
            if (pCur->_pSons[i])
                pCur->_pSons[i]->_pParent = newNode;
            // 更新pCur的size
            pCur->_size = pCur->_size - newNode->_size - 1;
            // 若pCur已經調整到根節點還未合格，則再次分裂，更新根節點後直接返回true
            if (_pRoot == pCur)
            {
                _pRoot = new Node;
                _pRoot->_keys[0] = pCur->_keys[mid];
                _pRoot->_size = 1;
                // 更新新的根節點的孩子以及孩子雙親的指向
                _pRoot->_pSons[0] = pCur;
                pCur->_pParent = _pRoot;
                _pRoot->_pSons[1] = newNode;
                newNode->_pParent = _pRoot;
                return true;
            }
            else // 若pCur不為根，且仍舊不平衡，則pCur向上更新即指向其雙親，pSon指向新分裂出來的節點，並更新需要調整的鍵值
            {
                k = pCur->_keys[mid];
                pCur = pCur->_pParent;
                pSon = newNode;
            }
        }
    }

    // 中序遍歷
    void InOrder()
    {
        cout << "InOrder:" << endl;
        _InOrder(_pRoot);
        cout << endl;
    }

protected:

    void _InOrder(Node* pRoot)
    {
        if (pRoot)
        {
            int i = 0;
            for (; i < pRoot->_size; i++)
            {
                _InOrder(pRoot->_pSons[i]);
                cout << pRoot->_keys[i] << " ";
            }
            _InOrder(pRoot->_pSons[pRoot->_size]); // 處理該節點最右邊的孩子
        }
    }

    void InsertKey(Node* pCur, Node* pSon, const K& key)
    {
        int end = pCur->_size - 1; //標誌pCur的最後一個有效鍵值位置
        while (end >= 0)
        {
            // 比較當前位置上的鍵值與key的大小，找插入位置
            // 若當前位置鍵值大於key
            if (pCur->_keys[end] > key)
            {
                pCur->_keys[end + 1] = pCur->_keys[end]; // 向後移動當前位置上的鍵值
                pCur->_pSons[end + 2] = pCur->_pSons[end + 1]; // 鍵值移動後，相應的更新孩子指向
            }
            else  // 找到位置後退出迴圈
                break;
            end--;
        }
        // 插入key，並更新對應位置上pCur的孩子指向以及size
        pCur->_keys[end + 1] = key;
        pCur->_pSons[end + 2] = pSon;
        pCur->_size++;
        // 若孩子不為空，更新雙親為pCur
        if (pSon)
            pSon->_pParent = pCur;
    }

private:
    Node* _pRoot;
};

void Test()
{
    BTree<int, 3> t;
    t.Insert(10);
    t.Insert(30);
    t.Insert(20);
    t.Insert(40);
    t.Insert(50);
    t.Insert(80);
    t.Insert(70);
    t.InOrder();
}

B-樹的基本概念以及程式碼實現

B-樹引入當我們從一堆資料裡查詢某個資料的時候，常使用如下方法：資料雜亂無規律—>線性搜尋 —-> O(N) 資料有序—->二分查詢—->O(log2N)—>最差情況下退化成單隻樹O(N) 二叉搜尋樹/AVL樹/紅黑樹—-

B樹插入刪除圖文程式碼實現 golang實現

一、B樹的定義 B樹也稱B-樹,它是一顆多路平衡查詢樹。我們描述一顆B樹時需要指定它的階數，階數表示了一個結點最多有多少個孩子結點，一般用字母m表示階數。當m取2時，就是我們常見的二叉搜尋樹。一顆m階的B樹定義如下： 1、每個結點最多有m-1個關鍵字。 2、根結點最少可

SBTree的概念以及程式碼實現

SBTree與AVL樹具有相同的概念,也具有相同的操作類似自平衡,旋轉操作和旋轉的觸發這三方面介紹SBTree SBTree嚴格遵循下列公式,如有違反,則需要通過相應的轉置操作來達到平衡 SIZE[right[t]] >= max(SIZE[left[left[t]

B樹的原理以及C++實現（附原始碼和文件）

B樹的C++實現之前課程設計做的一個BTrees資料結構，在這裡添加了演算法說明的PDF文件以及配套的Latex文件，同時有原始碼和詳細的說明，演算法思路全部來自於演算法導論，，需要的同學直接拿走。

線索二叉樹詳解以及程式碼實現

參照《大話資料結構》188到194頁。一、二叉樹的線索儲存結構定義 /* 二叉樹線索儲存結構定義 Link = 0,代表指向左右孩子的指標 Thread= 1 代表指向前驅或後繼的線索*/ typedef enum{ Link, Thread} Pointe

SQLite學習筆記（十）-- 事務基本概念和程式碼實現（C++實現）

1.事務基本概念什麼是事務？事務是使用者定義的一些列資料操作，這些操作是一個完整的不可分的工作單元。一個事務要麼全部執行，要麼全部不執行。檢視案例例如銀行的轉賬操作，張三向李四轉賬1000元。該事務包含以下兩個操作： 1.張三賬戶上扣除1000

【演算法】手撕紅黑樹（上）—— 基本性質以及插入實現（附帶程式碼實現）

在閱讀其他博主關於紅黑樹增刪實現的時候，博主們大多直接使用文字圖片描述，對整個增刪整體的流程突出的不太明顯（當然dalao們寫得還是很棒得，不然我也寫不出這篇文章），所以我特意花了2天時間用CAD製作了一張插入操作的流程圖和一張刪除操作的流程圖（刪除見下篇）並手撕程式碼（好吧，其實大部分時間在除錯程式碼，畢

java平衡二叉樹的增加刪除等基本操作和程式碼實現

陣列為{1，2，3}型別的五種型別四種調整一、LL型： /** * 帶左子樹旋轉,適用於LL型 */ public static AvlNode rotateWithLeftChild(AvlNode n) { AvlNode k = n.left; n.left

徑向基-薄板樣條插值數學公式、原理，以及程式碼實現基本過程

徑向基插值部分徑向基函式RBF (Radial Basis Function)有以下五種基函式其中r代表代待求點X與已知點Xi之間的向量距離上邊的公式是適用於以上五種基函式的計算公式，其中X代表向量，不是一個數字對於薄板樣條插值，其公式（是經過上邊

二叉樹、平衡二叉樹、B- tree、B+ tree 基本概念

1 二叉樹二叉樹binary tree是指每個節點最多含有兩個子樹的樹結構。特點： 1.所有節點最多擁有兩個子節點，即度不大於2 2.左子樹的鍵值小於根的鍵值，右子樹的鍵值大於根的鍵值。因為二叉樹只是定義了簡單的結

java資料結構與演算法之樹基本概念及二叉樹（BinaryTree）的設計與實現

關聯文章: 樹博文總算趕上這周釋出了，上篇我們聊完了遞迴，到現在相隔算挺久了，因為樹的內容確實不少，博主寫起來也比較費時費腦，一篇也無法涵蓋樹所有內容，所以後續還會用2篇左右的博文來分析其他內容大家就持續關注吧，而本篇主要了解的知識點如下（還是蠻多

MySQL基本概念以及簡單操作

software 倉庫必須 key 不能即使同時 databases ecif 一、MySQL 　　MySQL是一個關系型數據庫管理系統，由瑞典MySQL AB 公司開發，目前屬於Oracle 旗下產品。MySQL 是最流行的關系型數據庫管理系統之一，在 WEB

伸展樹基本概念基本題目

name names algorithm rto 維護每次等於 http 移動 http://blog.csdn.net/discreeter/article/details/51524210 //基本概念詳見這裏例題HDU4453 代碼來源http://bl

二叉樹基本概念

相同完全二叉樹算法平衡都在最大值 fma word 特殊 1. 高度:樹T所有節點深度的最大值,節點V對應子樹高度為該節點的高度,根節點高度為整棵樹的高度 2.深度:節點V到根節點R的唯一路徑所經過的數目稱為V的深度 3.huffman編碼:構造出的帶權平均深

TensorFlow(二)：基本概念以及練習

ssi AR oss -a n) counter 全部 enter num 一：基本概念 1、使用圖(graphs)來表示計算任務 2、在被稱之為會話(Session)的上下文(context)中執行圖 3、使用tensor表示數據 4、通過變量(Variable)維護狀

數據庫--視圖的基本概念以及作用

itl boa 查詢更新 source ace div 通過 views 轉自:數據庫--視圖的基本概念以及作用視圖（子查詢）：是從一個或多個表導出的虛擬的表，其內容由查詢定義。具有普通表的結構，但是不實現數據存儲。對視圖的修改：單表視圖一般用於查詢和修改，會改變基本

001-jpa基本概念以及基礎註解

簡單的 color link value crud操作 efi 優勢 jdb 容器一、什麽是JPA 　　JPA是Java Persistence API的簡稱，中文名Java持久層API，是JDK 5.0註解或XML描述對象－關系表的映射關系，並將運行期的實體對象持久化

統計學習五：1.決策樹基本概念

目的條件概率給定條件復雜操作噪聲節點要求全文引用自《統計學習方法》（李航）決策樹(decision tree) 是一種常用的分類與回歸方法。決策樹的模型為樹形結構，在針對分類問題時，實際上就是針對輸入數據的各個特征對實例進行分類的過程，即通過樹形結構

二叉樹基本概念（滿二叉樹、完全二叉樹，滿二叉樹，二叉樹的遍歷）

1. 二叉樹二叉樹是每個節點最多有兩個子樹的樹結構。它有五種基本形態：二叉樹可以是空集；根可以有空的左子樹或右子樹；或者左、右子樹皆為空。性質1：二叉樹第i層上的結點數目最多為 2{i-1} (i≥1)。性質2：深度為k的二叉樹至多有2{k}-1個結點(k≥1)

氣泡排序，選擇排序、二分法查詢圖示以及程式碼實現

氣泡排序請看下面的這個栗子：需要排序的陣列arr = {99,88,77,55,66,44}; 具體排序細節各位客官請看圖：程式碼實現： public class BubbleSort { public static void main(String[] ar

B-樹的基本概念以及程式碼實現

B-樹引入

B-樹定義

圖解B樹

B樹程式碼實現

相關推薦