Trie樹,加快單詞查詢效率

阿新 • • 發佈：2018-12-19

為了提高我的單詞查詢的速度，我拜讀了@Rshcaroline的程式碼，發現trie樹是一個很好解決這個問題的方法

Trie樹，又叫字典樹、字首樹（Prefix Tree）、單詞查詢樹或鍵樹，是一種多叉樹結構

Trie樹的基本性質：

根節點不包含字元，除根節點外的每一個子節點都包含一個字元。
從根節點到某一個節點，路徑上經過的字元連線起來，為該節點對應的字串。
每個節點的所有子節點包含的字元互不相同。通常在實現的時候，會在節點結構中設定一個標誌，用來標記該結點處是否構成一個單詞（關鍵字）。

一下是我的程式碼

class Trie:

    def __init__(self):
        """
        Initialize your data structure here.
        """ 

        self.root = {}
        self.END = "$"

    def insert(self, word):
        """
        Inserts a word into the trie.
        :type word: str
        :rtype: void
        """
        t = self.root
        for c in word:
            if c not in t:
                t[c] = {}
            t = t[c] 
                
        t[self.END] = {}        

    def search(self, word):
        """1
        Returns if the word is in the trie.
        :type word: str
        :rtype: bool
        """
        t = self.root
        for c in word:
            if c not in t:
                return False
            else 
:
                t = t[c]    
        if self.END not in t:
            return False
        return True

    def startsWith(self, prefix):
        """
        Returns if there is any word in the trie that starts with the given prefix.
        :type prefix: str
        :rtype: bool
        """
        t = self.root
        for c in prefix:
            if c not in t:
                return False
            else:
                t = t[c]
        return True

對於一個單詞的查詢一定編輯距離的相關集合的程式碼如下(from @Rshcaroline)，其中的deque是python的高效能雙向佇列，用於將trie, word, path, edit_distance整個打包起來加入佇列, 廣度優先查詢符合的單詞

def get_candidate(trie, word, edit_distance=1):
    que = deque([(trie, word, '', edit_distance)])
    while que:
        trie, word, path, edit_distance = que.popleft()
        if word == '':
            if END in trie:
                yield path
            # 詞尾增加字母
            if edit_distance > 0:
                for k in trie:
                    if k != END:
                        que.appendleft((trie[k], '', path+k, edit_distance-1))
        else:
            if word[0] in trie:
                # 首字母匹配成功
                que.appendleft((trie[word[0]], word[1:], path+word[0], edit_distance))
            # 無論首字母是否匹配成功，都如下處理
            if edit_distance > 0:
                edit_distance -= 1
                for k in trie.keys() - {word[0], END}:
                    # 用k替換餘詞首字母，進入trie[k]
                    que.append((trie[k], word[1:], path+k, edit_distance))
                    # 用k作為增加的首字母，進入trie[k]
                    que.append((trie[k], word, path+k, edit_distance))
                # 刪除目標詞首字母，保持所處結點位置trie
                que.append((trie, word[1:], path, edit_distance))
                # 交換目標詞前兩個字母，保持所處結點位置trie
                if len(word) > 1:
                    que.append((trie, word[1]+word[0]+word[2:], path, edit_distance))

Trie樹,加快單詞查詢效率

為了提高我的單詞查詢的速度，我拜讀了@Rshcaroline的程式碼，發現trie樹是一個很好解決這個問題的方法 Trie樹，又叫字典樹、字首樹（Prefix Tree）、單詞查詢樹或鍵樹，是一種多叉樹結構 Trie樹的基本性質：根節點不包含字元，除根節

字首樹( 又名：TRIE樹、單詞查詢樹、字典樹) 和字尾樹(Suffix樹)

概念字首樹：將海量字串儲存在一棵樹中。字尾樹：將一個字串分解成一棵樹。字首樹節點的結構體： struct trieNode { bool isEnd;//是否可以作為字串的終結節點 trieNode *child[26]; } 字首樹：

【模板】Trie樹（字典樹，單詞查詢樹）

int n; // 0為根節點 char a[MAX_N]; // a[0] = 0; int p[MAX_N][26]; void Update(string s) { int now = 0, len = s.size(); for(register int i = 0; i < l

java Trie實現英文單詞查詢樹搜尋自動提示

原理解釋文章：https://blog.csdn.net/beiyetengqing/article/details/7856113 程式碼應用： wordTrie.txt(工具類)： package com.xq.algorithm; import java.util.Array

trie樹實現模糊查詢

在上一篇部落格裡簡單的說了一下標準trie樹的建立，本來說要做一個小型詞典來用試試，結果這段時間有事就一直耽誤到現在，今天抽了一點時間看看，首先我想到的是在我們輸入某些單詞的前面幾個字母的時候下面的提示，那是trie樹的模糊查詢，便想了想去實現這個功能。

【BZOJ4567】[Scoi2016]背單詞 Trie樹+貪心

字母如果 ems scanf 序號 data scan name rdquo 【BZOJ4567】[Scoi2016]背單詞 Description Lweb 面對如山的英語單詞，陷入了深深的沈思，“我怎麽樣才能快點學完，然後去玩三國殺呢？&rdquo

trie樹 dp 字首單詞

讓我們一起來%forever_shi神犇題意：給你n個字串，每次選出若干個字串形成一個集合，問有多少個集合滿足集合中的任何一個字串都不是另外一個字串的字首。空集也一定是滿足條件的。保證不會出現兩個相同的字串。首先對所有字串建出一棵

[Trie樹] 統計英文文字中單詞出現的個數 - C語言實現 - 考慮數字、英文

【英文文字】 However, after reaching the shore there are plenty of challenges waiting for him."The biggest challenge now is learning to walk agai

洛谷 1666 字首單詞 trie樹 dp

題目連結題意：給你n個字串，每次選出若干個字串形成一個集合，問有多少個集合滿足集合中的任何一個字串都不是另外一個字串的字首。空集也一定是滿足條件的。保證不會出現兩個相同的字串。題解：也是

路由之路由表查詢演算法概述-雜湊/LC-Trie樹/256-way-mtrie樹

引：路由是網際網路的一個核心概念，廣義的講，它使分組交換網的每個節點彼此獨立，通過路由耦合在一起，甚至在電路交換網中，虛電路的建立也依賴路由，路由就是網路中資料通路的指向標。狹義的講，路由專指IP路由，它支撐著整個IP網路。由於IP是資料報網路，它是

Internet路由之路由表查詢演算法概述-雜湊/LC-Trie樹/256-way-mtrie樹

說明：本文沒有原始碼分析的內容，然而我認為能理解本質比能看懂原始碼更有用，因為理解了本質之後，你也許就不用再看原始碼了，你甚至都可以寫原始碼了。這就是Linux核心和Cisco的網站中包含大量文件的原因。引：路由是網際網路的一個核心概念，廣義的講，它使分組交換網的每個節點彼此獨

查詢（二）簡單清晰的B樹、Trie樹詳解

查詢（二）散列表散列表是普通陣列概念的推廣。由於對普通陣列可以直接定址，使得能在O(1)時間內訪問陣列中的任意位置。在散列表中，不是直接把關鍵字作為陣列的下標，而是根據關鍵字計算出相應的下標。使用雜湊的查詢演算法分為兩步。第一步是用雜湊函式將被查詢的鍵轉化為陣

查詢------B樹、Trie樹

查詢（二）散列表散列表是普通陣列概念的推廣。由於對普通陣列可以直接定址，使得能在O(1)時間內訪問陣列中的任意位置。在散列表中，不是直接把關鍵字作為陣列的下標，而是根據關鍵字計算出相應的下標。使用雜湊的查詢演算法分為兩步。第一步是用雜湊函式將被查詢的鍵轉化為陣列的一個索引。我們需要面對兩個或

二叉排序樹查詢效率最高的是哪個？

1.平衡二叉樹：它是一棵空樹或者它的左右兩個子樹的高度差的絕對值不超過1，並且左右兩個子樹都是一棵平衡二叉樹。如上圖：平衡二叉樹 2.二叉查詢樹：二叉排序樹，又稱二叉查詢樹，或者稱為二叉搜尋樹。

B樹、B-樹、B+樹、B*樹、紅黑樹、二叉排序樹、trie樹Double Array 字典查詢樹簡介

B 樹即二叉搜尋樹： 1.所有非葉子結點至多擁有兩個兒子（Left和Right）； 2.所有結點儲存一個關鍵字； 3.非葉子結點的左指標指向小於其關鍵字的子樹，右指標指向大於其關鍵字的子樹；如： B樹的

Trie樹實現詞頻統計與查詢

#encoding:utf-8 from collections import defaultdict import sys reload(sys) sys.setdefaultencoding('u

Trie樹(字典樹)_實現模糊查詢(支援中文)

一、什麼是Trie樹 Trie書又名字典樹，字典是由一組片語成的集合，而字典樹對這個集合進行了結構化的組織，將字典用另一種表達方式進行了表達。首先字典書對一些具有公共字首的詞進行了“壓縮”，大大減小了它佔用的空間。同時對於字典內詞的字首檢索也十分迅速，下面看一個圖來理解下字典樹：上面的圖就是字典樹，字

Trie樹：統計詞頻、排序、查詢

Trie樹利用字串的公共字首降低了查詢時間的開銷，提高了查詢的效率。字典樹的插入，刪除和查詢都非常簡單，用一個一重迴圈即可。 1. 從根節點開始一次搜尋 2. 取得要查詢關鍵詞的第一個字母，並根據該字母選擇對應的子樹並轉到該子樹繼續進行檢索 3. 在相應的子樹上，取得要查

路由表查詢演算法概述-雜湊/LC-Trie樹/256-way-mtrie樹

說明：本文沒有原始碼分析的內容，然而我認為能理解本質比能看懂原始碼更有用，因為理解了本質之後，你也許就不用再看原始碼了，你甚至都可以寫原始碼了。這就是Linux核心和Cisco的網站中包含大量文件的原因。引：路由是網際網路的一個核心概念，廣義的講，它使分組交換網的每個節點彼此獨立，通過路由耦合在一起，甚至在

海量路由表可以使用HASH表儲存嗎-HASH查詢和TRIE樹查詢

千萬別！很多人這樣說，也包括我。Linux核心早就把HASH路由表去掉了，現在就只剩下TRIE了，不過我還是希望就這兩種資料結構展開一些形而上的討論。1.hash和trie/radixhash和tire其實是可以統一在一起的。具有相同hash值的多個項具有一個共同的特徵，這個

Trie樹,加快單詞查詢效率

相關推薦