kd樹（學習總結及虛擬碼）

阿新 • • 發佈：2019-02-10

kd樹是用來為求k臨近而建立的資料結構，查詢的平均複雜度是logN（和二叉樹很像）

kd樹的建立

這裡寫圖片描述

這裡在建立kd樹的時候，這裡的演算法是迴圈依次採取各個維度來構建二叉樹，也有做法是選取資料在該維度上方差最大的那一維，因為方差大代表資料較分散，會有更好的解析度。

插入節點

insert(Point x, KDNode t, int cd) {
    if t == null
        t = new KDNode(x)
    else if (x == t.data)
      // error! duplicate
    else if (x[cd] < t.data[cd])
        t.left 
 = insert(x, t.left, (cd+1) % DIM)
    else
        t.right = insert(x, t.right, (cd+1) % DIM)
    return t
}

FindMin in kd-trees（尋找第k維最小的節點）

FindMin(d): find the point with the smallest value in the dth dimension.
虛擬碼：

Point findmin(Node T,int dim,int cd):
   // empty tree
    if T == NULL:return 
 NULL
   // T splits on the dimension we’re searching
   // => only visit left subtree
    if cd == dim:
        if t.left == NULL: return t.data
        else return findmin(T.left, dim, (cd+1)%DIM)
   // T splits on a different dimension
   // => have to search both subtrees
    else:
        return minimum(
            findmin(T.left 
, dim, (cd+1)%DIM),
            findmin(T.right, dim, (cd+1)%DIM)
            T.data
        )

刪除節點

當有右節點的時候：
這裡寫圖片描述
當沒有右節點有左節點的時候：

在這裡，找到最小的一個節點來替代刪除的節點，並將左節點變為右節點
當沒有位元組的時候直接設定為NULL返回
虛擬碼：

Point delete(Point x, Node T, int cd):
    if T == NULL: error point not found!
    next_cd = (cd+1)%DIM
    // This is the point to delete:
    if x = T.data:
        // use min(cd) from right subtree:
        if t.right != NULL:
            t.data = findmin(T.right, cd, next_cd)
            t.right = delete(t.data, t.right, next_cd)
        // swap subtrees and use min(cd) from new right:
        else if T.left != NULL:
            t.data = findmin(T.left, cd, next_cd)
            t.right = delete(t.data, t.left, next_cd)
            t.left = null
        else
            t = null    // we’re a leaf: just remove
    // this is not the point, so search for it:
    else if x[cd] < t.data[cd]:
        t.left = delete(x, t.left, next_cd)
    else
        t.right = delete(x, t.right, next_cd)
    return t

查詢最近鄰節點

k-d樹最鄰近搜尋的過程如下：

從根節點開始，遞迴的往下移。往左還是往右的決定方法與插入元素的方法一樣(如果輸入點在分割槽面的左邊則進入左子節點，在右邊則進入右子節點)。
一旦移動到葉節點，將該節點當作”目前最佳點”。
解開遞迴，並對每個經過的節點執行下列步驟：
1. 如果目前所在點比目前最佳點更靠近輸入點，則將其變為目前最佳點。
2. 檢查另一邊子樹有沒有更近的點，如果有則從該節點往下找
當根節點搜尋完畢後完成最鄰近搜尋

這裡寫圖片描述

其實對kd樹的搜尋是一個剪枝問題，本來我們是要遍歷樹上所有的點的，但是噹噹前區域不可能有點比之前搜到的最小距離小的時候直接就剪枝不搜了。
怎麼求這個最小距離呢：

設max[i]為當前一些點第i維的最大值，min[i]為當前一些點第i維的最小值，point表示當前要找的點
double getdist():
    dist = 0
    for i = 0 to dim:
        if point[i] < min[i]:
            dist += (point[i] - min[i]) * (point[i] - min[i])
        else if point[i] > max[i]:
            dist += (point[i] - max[i]) * (point[i] - max[i])
    return dist

虛擬碼：

def NN(Point Q, kdTree T, int cd, Rect BB):
    // if this bounding box is too far, do nothing
    if T == NULL or distance(Q, BB) > best_dist: return
    // if this point is better than the best:
    dist = distance(Q, T.data)
    if dist < best_dist:
        best = T.data
        best_dist = dist
   // visit subtrees is most promising order:
    if Q[cd] < T.data[cd]:
        NN(Q, T.left, next_cd, BB.trimLeft(cd, t.data))
        NN(Q, T.right, next_cd, BB.trimRight(cd, t.data))
    else:
        NN(Q, T.right, next_cd, BB.trimRight(cd, t.data))
        NN(Q, T.left, next_cd, BB.trimLeft(cd, t.data))

查詢K近鄰節點

這個查詢最近的k個節點的演算法是我自己想的，還有實驗驗證
在上面找最近鄰節點的時候判斷條件是當前搜尋區域不可能有節點比之前搜到的近的時候就剪枝：

if T == NULL or distance(Q, BB) > best_dist: return

那麼我們在找最近的k個節點的時候做一下改變，首先用一個最大堆來儲存已經找到的k個節點，噹噹前區域不可能有節點比堆上最大的距離小的時候就剪枝：
我們用queue來表示這個堆

if T == NULL or distance(Q, BB) > queue.MAX: return  //queue.MAX表示堆上的最大值

那麼最後的虛擬碼是：

def NN(Point Q, kdTree T, int cd, Rect BB):
    // if this bounding box is too far, do nothing
    if T == NULL or distance(Q, BB) > queue.MAX: return  //queue.MAX表示堆上的最大值
    // if this point is better than the best:
    dist = distance(Q, T.data)
    if dist < queue.MAX:
        queue.updata(dist，T.data);//用這個新找到的比較小的距離dist來更新這個最大堆
   // visit subtrees is most promising order:
    if Q[cd] < T.data[cd]:
        NN(Q, T.left, next_cd, BB.trimLeft(cd, t.data))
        NN(Q, T.right, next_cd, BB.trimRight(cd, t.data))
    else:
        NN(Q, T.right, next_cd, BB.trimRight(cd, t.data))
        NN(Q, T.left, next_cd, BB.trimLeft(cd, t.data))

kd樹（學習總結及虛擬碼）

kd樹是用來為求k臨近而建立的資料結構，查詢的平均複雜度是logN（和二叉樹很像） kd樹的建立這裡在建立kd樹的時候，這裡的演算法是迴圈依次採取各個維度來構建二叉樹，也有做法是選取資料在該維度上方差最大的那一維，因為方差大代表資料較分散，會有

機器學習基礎（四十三）—— kd 樹（ k 近鄰法的實現）

實現 k 近鄰法時，主要考慮的問題是如何對訓練資料進行快速 k 近鄰搜尋，這點在如下的兩種情況時，顯得尤為必要：（1）特徵空間的維度大（2）訓練資料的容量很大時 k 近鄰法的最簡單的實現是現行掃描（linear scan），這時需計算輸入例項與每一個

openlayers-熱地圖加載（完整版及代碼）

初始 sele coo source stat ima layout tap 中心 //地圖加載function mapInit(data){ //底圖// var raster = new ol.layer.Tile({// source: new ol.

【資料結構】紅黑樹（如何實現及怎樣判斷）

紅黑樹是一顆二叉搜尋樹，它在每個節點上增加了一個儲存位來表示節點的顏色，可以是red或black。通過對任何一條從根節點到葉子節點的簡單路徑上的顏色來約束，紅黑樹保證了最長路徑不超過最短路經的兩倍，因此近似於平衡。紅黑樹的規則： 1、每個節點不是紅色就是

樹-概念性總結及代碼示例

取出次數術語結構無法浪費滿二叉樹否則實現總覽：樹的基本概念二叉樹樹和森林樹與二叉樹的應用樹的基本概念樹的定義：若幹結點的集合，有唯一根結點，無環，結點個數可為0 樹的基本術語：結點的度：結點擁有的子樹個數或者分支的個數樹的度：結點的度的

吳恩達機器學習總結：第十一降維（PCA）（大綱摘要及課後作業）

為了更好的學習，充分複習自己學習的知識，總結課內重要知識點，每次完成作業後都會更博。總結1.動機I：資料壓縮（1）壓縮 a.加速演算法 b.減小資料空間 c.2維降為1維例子 d.3維降為2維例子 e.在實際中，我們正常會將1000維將為1

Boosting學習總結及理解（2）

其他內容見上一篇博文。 GBDT（梯度提升決策樹）： GBDT屬於提升樹，所以也是決策樹的加法模型：，其中表示第m顆樹對輸入資料 x 的預測值如何來學習得到這個加法模

BP神經網路演算法學習---處理流程（虛擬碼）

本文轉自主要學習本文對於BP神經網路處理流程的梳理。 BP（Back Propagation）網路是1986年由Rumelhart和McCelland為首的科學家小組提出，是一種按誤差逆傳播演算法訓練的多層前饋網路，是目前應用最廣泛的神經網路模型之一。BP網

Redis哨兵模式（sentinel）學習總結及部署記錄（主從複製、讀寫分離、主從切換）

Redis的叢集方案大致有三種：1）redis cluster叢集方案；2）master/slave主從方案；3）哨兵模式來進行主

樹（基本概念及存儲結構）

表示 com 鏈式結構定義 comment pen next rac 存儲樹的定義—-遞歸（兩者相聯系）根節點：唯一節點的度：節點擁有的子樹數。度為0—>稱為終端節點或葉節點樹的度：樹內各節點的度的最大值內部節點：除根節點外的節

歐拉函數知識點總結及代碼模板及歐拉函數表

算法實現 for 表示滿足情況 += radi 分析因子歐拉函數是少於或等於n的數中與n互質的數的數目。歐拉函數的性質：它在整數n上的值等於對n進行素因子分解後，所有的素數冪上的歐拉函數之積。歐拉函數的值　通式：φ(x)=x(

XP方法學習總結及對小組開發的思考

是個 note 使用進一步根據數據科學家 pos 範圍 log 眾所周知，數據科學是這幾年才火起來的概念，而應運而生的數據科學家(data scientist)明顯缺乏清晰的錄取標準和工作內容。此次課程以《星際爭霸II》回放文件分析為例，集中在IBM Cloud相關數

kd樹求k近鄰 python 代碼

get median color python 進行 size aps tmp lam 　　之前兩篇隨筆介紹了kd樹的原理，並用python實現了kd樹的構建和搜索，具體可以參考　　kd樹的原理　　python kd樹搜索代碼　　kd樹常與knn算法聯系在一起

vuex 學習總結及demo

spa inf bubuko jpg 分享理解規則連接 family vuex是vue.js應用程序開發的狀態管理模式它采用集中式存儲管理應用的所有組件的狀態，並以相應的規則保證狀態以一種可預測的方式發生變化。官方文檔：https://vuex.vuejs.org

2018-2019-1 20165334《信息安全系統設計基礎》第三周學習總結及緩沖區溢出漏洞實驗

過程信息安全截圖分享圖片進入種類系統 xxx img 2018-2019-1 20165334《信息安全系統設計基礎》第三周學習總結及緩沖區溢出漏洞實驗一、指令學習 gcc -Og -o xxx.c學習 -Og會告訴編譯器使用會生成符合原始c語言代碼的整體結構

JavaWeb筆記-23-知識點總結（ajax請求及案例相關）

知識點： 1）load事件通常用於檢測文件內容或者圖片是否載入完畢 2）window.onload 是註冊在window物件上的load事件作用：window.onload是一個事件，當文件內容完全載入完成會觸發該事件背景：網頁中的某些JavaScr

【機器人學：運動規劃】快速搜尋隨機樹（RRT---Rapidly-exploring Random Trees）入門及在Matlab中演示

快速搜尋隨機樹（RRT -Rapidly-ExploringRandom Trees），是一種常見的用於機器人路徑（運動）規劃的方法，它本質上是一種隨機生成的資料結構—樹，這種思想自從LaValle在[1]中提出以後已經得到了極大的發展，到現在依然有改進的RRT不斷地被提出來。

C語言學習總結及

c語言學習總結及感悟學習C語言已經幾個月了，雖然感覺學的還遠遠不夠，運用起來也不是很熟練，但也有些自己的心得和感悟，並按照自己的理解和不足總結了知識點。請老師斧正。 1.程式結構可以分為三種：順序結構、選擇結構、迴圈結構。每種結構都有特定的機構特點並且有特定用詞。 2.讀程式都要從main

JAVA入門學習總結及筆記-初識Java

JAVA入門學習筆記（持續更新）第一章：初識Java 1.1Java語言概述 1.1.1 Java名稱來歷：（從最初的Oak（橡樹）到工程師們邊喝咖啡邊討論著，看看手上的咖啡，聯想到印度尼西

李航統計學習方法之樸素貝葉斯法（含python及tensorflow實現）

樸素貝葉斯法樸素貝葉斯法數學表示式後驗概率最大化的含義樸素貝葉斯是一個生成模型。有一個強假設：條件獨立性。我們先看下樸素貝葉斯法的思想，然後看下條件獨立性具體數學表示式是什麼樣的。

kd樹（學習總結及虛擬碼）

kd樹的建立

插入節點

FindMin in kd-trees（尋找第k維最小的節點）

刪除節點

查詢最近鄰節點

查詢K近鄰節點

相關推薦