字首樹（Trie）原理及Java實現

阿新 • • 發佈：2019-01-15

字首樹的結構

Trie樹，又叫字典樹、字首樹（Prefix Tree）、單詞查詢樹或鍵樹，是一種多叉樹結構。如下圖：

這裡寫圖片描述
上圖是一棵Trie樹，表示了關鍵字集合{“a”, “to”, “tea”, “ted”, “ten”, “i”, “in”, “inn”} 。從上圖可以歸納出Trie樹的基本性質：
①根節點不包含字元，除根節點外的每一個子節點都包含一個字元。
②從根節點到某一個節點，路徑上經過的字元連線起來，為該節點對應的字串。
③每個節點的所有子節點包含的字元互不相同。
④從第一字元開始有連續重複的字元只佔用一個節點，比如上面的to，和ten，中重複的單詞t只佔用了一個節點。

字首樹的應用

1、字首匹配
2、字串檢索
3、詞頻統計
4、字串排序

下面看看怎樣使用字首樹來實現字首匹配的。

字首匹配

瞭解了字首樹的結構後，就可以利用字首樹的性質來解決現實中的問題。比如說查詢一個字串陣列中是否含有字首單詞，什麼是字首單詞：上面的 in，就是 inn 的字首單詞。如果有十幾萬條單詞，並且每個單詞的長度都是5-10以內，這樣必定存在大量重複的字元，因此利用字首樹來求解不僅速度快而且空間複雜度也比較好。
①定義字首樹結構

class Tries{
    Boolean isTrie ;
    HashMap<Character, Tries> children=new 
 HashMap<Character, Tries>(); 
}

上面的 isTrie 用來標記單詞是否遍歷完。children表示該節點的子節點。如上面的t節點的子節點有o和e兩個。

②建立字首樹

    public static boolean insertNode(String str,Tries head)
    {
        if(str==null||str.length()==0)
            return false;
            //如果插入的單詞為null 或者單詞長度為0直接返回false，false代表該單詞不是字首樹中某個單詞的字首， 

            //或者字首樹中某個單詞是該單詞的字首。
        char chs[]=str.toCharArray();
        int i=0;
        Tries cur=head;
        //將字串的每個字元插入到字首樹中
        while(i<chs.length)
        {           
            if(!cur.children.containsKey(chs[i]))
            {

                cur.children.put(chs[i], new Tries());
                //如果當前節點中的子樹節點中不包含當前字元，新建一個子節點。
            }
            //否則複用該節點
            cur=cur.children.get(chs[i]);
            if(cur.count==true)
            {
                System.out.println(" trie tree");
                return true;
                //判斷字首樹中是否有字串為當前字串的字首。
            }
            i++;
        }
        cur.count=true;
        if(cur.children.size()>0)
        {
            System.out.println(" trie tree");
            return true;
            //判斷當前字串是否是字首樹中某個字元的字首。
        }
        return false;
    }

字首樹的建立過程就是插入字串的過程，同時在插入節點的時候可以判斷插入的字串是否是字首樹裡面某個單詞的字首，或者字首樹中的某個單詞是否是該單詞的字首。

①先將字串轉換為字元陣列，然後對每個字元進行處理，如果當前節點的子節點中包含有要處理的字元位元組複用。否則新建一個子節點。
②判斷是否是字首單詞的時候，有兩個步驟，首先要看該字串是否是其他字串的字首，還有看其他字串是否是當前字串的字首。

判斷字首單詞的完整程式碼：

public class isTrie {

    public static void main(String[] args) {
        Tries tries=new Tries();
        String strs[]={"abc","abd","b","abdc"};

        for(int i=0;i<strs.length;i++)  
            insertNode(strs[i], tries);                 
    }
public static boolean insertNode(String str,Tries head)
    {
        if(str==null||str.length()==0)
            return false;
        char chs[]=str.toCharArray();
        int i=0;
        Tries cur=head;
        while(i<chs.length)
        {           
            if(!cur.children.containsKey(chs[i]))
            {

                cur.children.put(chs[i], new Tries());
            }
            cur=cur.children.get(chs[i]);
            if(cur.count==true)
            {
                System.out.println(" trie tree");
                return true;
            }
            i++;
        }
        cur.count=true;
        if(cur.children.size()>0)
        {
            System.out.println(" trie tree");
            return true;
        }
        return false;
    }
}
class Tries{
    boolean isTrie;
    HashMap<Character, Tries> children=new HashMap<Character, Tries>(); 
}

字首樹（Trie）原理及Java實現

字首樹的結構

字首樹的應用

字首匹配

字首樹（Trie）原理及Java實現

簡單選擇排序演算法原理及java實現（超詳細）

java資料結構與演算法之樹基本概念及二叉樹（BinaryTree）的設計與實現

LibieOJ 6170 字母樹（Trie）

【深度學習】線性迴歸（一）原理及python從0開始實現

（轉）sslvpn及openvpn實現原理

決策樹演算法原理及JAVA實現(ID3)

影象超解析度重構（一）原理及方法總結

B - Trie樹（trie）（字典樹的拓展）

譜聚類（Spectral Clustering）原理及Python實現

視覺里程計（VisualOdometry）原理及實現

[算法系列之二十]字典樹（Trie）

Hadoop2.7.3 mapreduce（一）原理及"hello world"例項

MLP多層感知機（人工神經網路）原理及程式碼實現

分享基於.NET動態編譯&Newtonsoft.Json封裝實現JSON轉換器（JsonConverter）原理及JSON操作技巧

多執行緒（基礎）Python、Java實現

【排序演算法】希爾排序原理及Java實現

【排序演算法】歸併排序原理及Java實現

粒子群優化演算法（PSO）簡介及MATLAB實現

【資料結構】堆疊、佇列的原理及java實現

字首樹（Trie）原理及Java實現

字首樹的結構

字首樹的應用

字首匹配

相關推薦