kd-樹筆記

阿新 • • 發佈：2018-11-29

以下內容均為本人近幾天學習筆記，個人理解，並非完美答案，請抱著懷疑眼光閱讀，如有錯誤請告知，感謝！

1.kd-樹簡介

1.1 特徵：在任何情況下，kd-樹都是一棵遞迴定義的平衡二叉搜尋樹

1.2 用途：常用於範圍查詢，高效解決多維範圍查詢。例如：快速在校友資料庫中找到1970-2000年畢業並且身高在170-190cm且性別為男的校友。

2.kd-樹的實現

2.1 一維kd-樹：一維kd-樹本質上就是平衡二叉搜尋樹，也可以看成線段樹，一維的範圍查詢問題完全可以用線段樹解決。這樣便於推廣到二維乃至k維。

2.2 kd-樹的建樹：

2.2.1 構造演算法：

kd-樹的建樹應該將每個維度分為兩個部分

，並以中位點作為中點進行劃分。
增加一個屬性深度（deep），那麼kd-樹維度維k，當深度為deep時，該對deep%k維進行劃分。
k維kd-樹本質上仍是平衡二叉搜尋樹，只是在每一層對不同維度進行劃分，使左右節點數量相等，從而維持樹高。

2.2.2 虛擬碼：(指標更方便，但更容易出錯)

void BuildTree( int l , int r , int root , int deep){ //l是該維度的資料的左邊界，r是右邊界

if(l > r) return;//不存在資料

isExist[root] = 1；//標記root存在資料

isExist[ls] = isExist[rs] = -1;//(左右兒子初始化為不存在)

int idx = deep%k;//找出劃分哪個維度

找中位點mid,同時使mid左面所有節點小於mid，右邊所有節點大於mid；

BuildTree(l , mid-1 , ls , deep+1);

BuildTree(mid+1 , r , rs , deep+1);

}

2.3 kd-樹的查詢：

2.3.1 當前節點範圍查詢的三種情況：

A：該範圍完全包含於該節點的左子樹或右子樹
B：該範圍一部分在左子樹，一部分在右子樹
C：該範圍既不在左子樹也不在右子樹

2.4 程式碼例項：HDU4347

#include <iostream>
#include <string.h>
#include <algorithm>
#include <stdio.h>
#include <math.h>
#include <queue>
 
using namespace std;
 
#define N 50005
 
#define lson rt << 1
#define rson rt << 1 | 1
#define Pair pair<double, Node>
#define Sqrt2(x) (x) * (x)
 
int n, k, idx;
 
struct Node
{
    int feature[5];     //定義屬性陣列
    bool operator < (const Node &u) const
    {
        return feature[idx] < u.feature[idx];
    }
}_data[N];   //_data[]陣列代表輸入的資料
 
priority_queue<Pair> Q;     //佇列Q用於存放離p最近的m個數據
 
class KDTree{
 
    public:
        void Build(int, int, int, int);     //建樹
        void Query(Node, int, int, int);    //查詢
 
    private:
        Node data[4 * N];    //data[]陣列代表K-D樹的所有節點資料
        int flag[4 * N];      //用於標記某個節點是否存在，1表示存在，-1表示不存在
}kd;
 
//建樹步驟，引數dept代表樹的深度
void KDTree::Build(int l, int r, int rt, int dept)
{
    if(l > r) return;
    flag[rt] = 1;                   //表示編號為rt的節點存在
    flag[lson] = flag[rson] = -1;   //當前節點的孩子暫時標記不存在
    idx = dept % k;                 //按照編號為idx的屬性進行劃分
    int mid = (l + r) >> 1;
    nth_element(_data + l, _data + mid, _data + r + 1);   //nth_element()為STL中的函式
    data[rt] = _data[mid];
    Build(l, mid - 1, lson, dept + 1);  //遞迴左子樹
    Build(mid + 1, r, rson, dept + 1);  //遞迴右子樹
}
 
//查詢函式，尋找離p最近的m個特徵屬性
void KDTree::Query(Node p, int m, int rt, int dept)
{
    if(flag[rt] == -1) return;   //不存在的節點不遍歷
    Pair cur(0, data[rt]);       //獲取當前節點的資料和到p的距離
    for(int i = 0; i < k; i++)
        cur.first += Sqrt2(cur.second.feature[i] - p.feature[i]);
    int dim = dept % k;          //跟建樹一樣，這樣能保證相同節點的dim值不變
    bool fg = 0;                 //用於標記是否需要遍歷右子樹
    int x = lson;
    int y = rson;
    if(p.feature[dim] >= data[rt].feature[dim]) //資料p的第dim個特徵值大於等於當前的資料，則需要進入右子樹
        swap(x, y);
    if(~flag[x]) Query(p, m, x, dept + 1);      //如果節點x存在，則進入子樹繼續遍歷
 
    //以下是回溯過程，維護一個優先佇列
    if(Q.size() < m)   //如果佇列沒有滿，則繼續放入
    {
        Q.push(cur);
        fg = 1;
    }
    else
    {
        if(cur.first < Q.top().first)  //如果找到更小的距離，則用於替換佇列Q中最大的距離的資料
        {
            Q.pop();
            Q.push(cur);
        }
        if(Sqrt2(p.feature[dim] - data[rt].feature[dim]) < Q.top().first)
        {
            fg = 1;
        }
    }
    if(~flag[y] && fg) 
        Query(p, m, y, dept + 1);
}
 
//輸出結果
void Print(Node data)
{
    for(int i = 0; i < k; i++)
        printf("%d%c", data.feature[i], i == k - 1 ? '\n' : ' ');
}
 
int main()
{
    while(scanf("%d%d", &n, &k)!=EOF)
    {
        for(int i = 0; i < n; i++)
            for(int j = 0; j < k; j++)
                scanf("%d", &_data[i].feature[j]);
        kd.Build(0, n - 1, 1, 0);
        int t, m;
        scanf("%d", &t);
        while(t--)
        {
            Node p;
            for(int i = 0; i < k; i++)
                scanf("%d", &p.feature[i]);
            scanf("%d", &m);
            while(!Q.empty()) Q.pop();   //事先需要清空優先佇列
            kd.Query(p, m, 1, 0);
            printf("the closest %d points are:\n", m);
            Node tmp[25];
            for(int i = 0; !Q.empty(); i++)
            {
                tmp[i] = Q.top().second;
                Q.pop();
            }
            for(int i = m - 1; i >= 0; i--)
                Print(tmp[i]);
        }
    }
    return 0;
}

《資料結構（C++語言版）》——鄧俊輝 P242

kd-樹筆記

以下內容均為本人近幾天學習筆記，個人理解，並非完美答案，請抱著懷疑眼光閱讀，如有錯誤請告知，感謝！ 1.kd-樹簡介 1.1 特徵：在任何情況下，kd-樹都是一棵遞迴定義的平衡二叉搜尋樹 1.2 用途：常用於範圍查詢，高效解決多維範圍查詢。例如：快速在校友資料庫中找到1

PBRT筆記(3)——KD樹

筆記會計 ise 情況在一起 size_t nds bounds ims 莖節點與葉子節點莖節點與葉子節點皆適用KdAccelNode來表示註意：這裏使用了匿名union union有個特性:內部類型共用一段內存，且大小為內部最大類型的大小。 struct Kd

統計學習方法筆記（一）：K近鄰法的實現：kd樹

實現k近鄰演算法時，首要考慮的問題是如何對訓練資料進行快速的k近鄰搜尋。這點在特徵空間的維數大於訓練資料容量時尤為重要。構造kd樹 kd 樹是一種對k為空間中的例項點進行儲存的一邊對其進行快速檢索的樹形資料結構。kd樹是二叉樹，表示對k維空間的一個劃分（parti

KD樹學習筆記（只適合OIer）

先思考一個問題: 在K維空間裡面有許多的點，對於某些給定的點，我們需要找到和它最近的m個點。這裡的距離指的是歐幾里得距離： D(p,q)=D(q,p)=sqrt((q1-p1)^2+(q2-p2)^2+(q3-p3)^2+...+ (qn-pn)^2)，請你幫忙解決一下。

機器學習筆記之八—— knn-最簡單的機器學習演算法以及KD樹原理

上一節結束了線性迴歸、邏輯迴歸，今天一節來介紹機器學習中最簡單的演算法： K近鄰（KNN，全稱K-nearst Neighbor）概述：判斷一個樣本的label只需要判斷該樣本週圍其他樣本的label。簡言之，朋

統計學習筆記——k近鄰法與kd樹

在使用k近鄰法進行分類時，對新的例項，根據其k個最近鄰的訓練例項的類別，通過多數表決的方式進行預測。由於k近鄰模型的特徵空間一般是n維實數向量，所以距離的計算通常採用的是歐式距離。關鍵的是k值的選取，如果k值太小就意味著整體模型變得複雜，容易發生過擬合，即如果鄰近的例項點

opencv下kd樹使用筆記

centos 7,opencv 3.0 程式碼： // 1）建立查詢樹 : Point2f p1(2,3), p2(5,4),p3(9, 6), p4(4,7), p5(8,1),p6(7

[AI] 最近鄰KNN 及平衡KD 樹學習筆記

歐氏距離投票數據 implement 限制類模型技術分享驗證數據集最近鄰算法KNN 學習筆記定義為了判定未知樣本的類別，以全部訓練樣本作為代表點，計算未知樣本與所有訓練樣本的距離，並以最近鄰者的類別作為決策未知樣本類別的唯一依據。選擇未知樣本一定範圍內確

數據結構——樹筆記1

其余劃分 right class log 並且否則 -1 尋找樹屬於非線性數據結構，它是一種層次結構：如果存在前驅節點，則是唯一的，如果存在後繼節點，則可以是多個。即樹的元素之間是一對多的關系。樹是由n個節點構成的有限集合T，如果n = 0，則是空樹，如果n不等於0，

BZOJ 4066 簡單題（KD樹）

element space while rebuild 鏈接 main query [1] line 【題目鏈接】 http://www.lydsy.com/JudgeOnline/problem.php?id=4066 【題目大意】　　要求維護矩陣內格子

BZOJ 2648 SJY擺棋子（KD樹）

ddd query www. 動態 div online 鏈接 ans nbsp 【題目鏈接】 http://www.lydsy.com/JudgeOnline/problem.php?id=2716 【題目大意】　　給出一些點，同時不斷插入點和詢問某點離

BZOJ 4520 [Cqoi2016]K遠點對（KD樹）

font www tdi 進行修改距離 [1] ons blank 【題目鏈接】 http://www.lydsy.com/JudgeOnline/problem.php?id=4520 【題目大意】　　求K遠點對距離【題解】　　修改估價

關於kd樹的構建搜索問題

統計入門目前針對統計學習真的 kd樹重復特征選取李航博士的《統計學習方法》毋庸置疑是機器學習的經典入門書籍之一，本文是針對其中KNN算法中的KD樹進行更細致的分析。由於鄙人學識尚淺（是真的很淺），所以如果有誤，希望大家指正。關於

《機器學習》（周誌華）第4章決策樹筆記理論及實現——“西瓜樹”

取數據 dataset 結點（六） eight dot 都是 ret 集合參考書籍：《機器學習》（周誌華）說明：本篇內容為讀書筆記，主要參考教材為《機器學習》（周誌華）。詳細內容請參閱書籍——第4章決策樹。部分內容參考網絡資源

（二）《機器學習》（周誌華）第4章決策樹筆記理論及實現——“西瓜樹”——CART決策樹

cati create def __main__ element iuc 文件取數 min CART決策樹（一）《機器學習》（周誌華）第4章決策樹筆記理論及實現——“西瓜樹” 參照上一篇ID3算法實現的決策樹（點擊上面鏈接直達），進一步實現CART決策樹。其實

KD樹小結

abs 剪枝定義系統 font n) 註意二叉曼哈頓距離很久之前我就想過怎麽快速在二維平面上查找一個區域的信息，思考許久無果，只能想到幾種優秀一點的暴力。 Kd樹就是幹上面那件事的。別的不多說，趕緊把自己的理解寫下來，免得涼了。 KD樹的組成以維

python kd樹搜索

blog arc 節點 inf fda dex num blank sum 　　kd樹就是一種對k維空間中的實例點進行存儲以便對其進行快速檢索的樹形數據結構，可以運用在k近鄰法中，實現快速k近鄰搜索。構造kd樹相當於不斷地用垂直於坐標軸的超平面將k維空間切分，依次選擇坐標軸

kd樹求k近鄰 python 代碼

get median color python 進行 size aps tmp lam 　　之前兩篇隨筆介紹了kd樹的原理，並用python實現了kd樹的構建和搜索，具體可以參考　　kd樹的原理　　python kd樹搜索代碼　　kd樹常與knn算法聯系在一起

BZOJ - 3489 KD樹範圍計數空間思維轉換

oid else query etc build 一個 define efi IT 題意:給定數列\(a[1...n]\),\(Q\)次查詢\([L,R]\)中只出現一次的最大值這道題的做法比較勁.. 對每個元素構造三維空間的點\((i,pre[i],next[i])\)

2018牛客多校6 - I Team Rocket KD樹維護空間

再次 double sync main get set print esp operator 題意:給出n條鐵路區間\([L,R]\),共有m個boom依時間順序放置在\(k_i\)中，區間與\(k_i\)有交集的都被炸掉求每次炸掉的鐵路個數和最後輸出所有id被炸的時間點

kd-樹筆記

1.kd-樹簡介

2.kd-樹的實現

相關推薦