淺談字典樹 + LeetCode——720. 詞典中最長的單詞（Java）

阿新 • • 發佈：2022-03-17

引言

字首樹，也叫字典樹，我們成為 Trie樹（發音類似 "try"），是一種多路樹形結構，是雜湊樹的一種延伸。

效率方面與hash樹差不多，也是一種快速檢索的多叉樹，用於統計和排序大量的字串，經常用於搜尋引擎的文字詞頻統計。

最大的優點就是減少無用的字串比較，查詢速度快，核心思想就是用空間換時間，利用查詢儲存的公共字首降低時間開銷，

這樣缺點也很明顯，因為需要提前定義儲存各種情況的公共字首，所以記憶體開銷非常大。

實現字首樹

字首樹是一棵有根樹，其每個節點包含以下欄位：
  指向子節點的指標陣列 children。對於實際情況而言，陣列長度訂為 26，即小寫英文字母的數量。
  此時 children[0] 對應小寫字母 a，children[1] 對應小寫字母 b，…，children[25] 對應小寫字母 z。
  布林欄位 isEnd，表示該節點是否為字串的結尾。

插入字串（insert）
  我們從字典樹的根開始，插入字串。對於當前字元對應的子節點，有兩種情況：
  子節點存在。沿著指標移動到子節點，繼續處理下一個字元。
  子節點不存在。建立一個新的子節點，記錄在 children 陣列的對應位置上，然後沿著指標移動到子節點，繼續搜尋下一個字元。
  重複以上步驟，直到處理字串的最後一個字元，然後將當前節點標記為字串的結尾。

查詢字首（search）
  我們從字典樹的根開始，查詢字首。對於當前字元對應的子節點，有兩種情況：
  子節點存在。沿著指標移動到子節點，繼續搜尋下一個字元。
  子節點不存在。說明字典樹中不包含該字首，返回空指標。
  重複以上步驟，直到返回空指標或搜尋完字首的最後一個字元。

若搜尋到了字首的末尾，就說明字典樹中存在該字首。
此外，若字首末尾對應節點的 isEnd 為真，則說明字典樹中存在該字串。

class Trie {
    private final Trie[] children;
    private boolean isEnd;
    
    // 初始化
    public Trie() {
        children = new Trie[26];
        isEnd = false;
    }
    
    // 插入新元素
    public void insert(String word) {
        Trie node = this;
        for (int i = 0; i < word.length(); i++) {
            char ch = word.charAt(i);
            int index = ch - 'a';

            if (node.children[index] == null) {
                node.children[index] = new Trie();
            }
            node = node.children[index];
        }
        node.isEnd = true;
    }
    
    // 查詢元素是否存在
    public boolean search(String word) {
        Trie node = searchPrefix(word);
        return node != null && node.isEnd;
    }
   
    // 查詢字首是否存在
    private Trie searchPrefix(String prefix) {
        Trie node = this;
        for (int i = 0; i < prefix.length(); i++) {
            char ch = prefix.charAt(i);
            int index = ch - 'a';
            if (node.children[index] == null) {
                return null;
            }
            node = node.children[index];
        }
        return node;
    }
}

題目描述

題幹：
  給出一個字串陣列 words 組成的一本英語詞典。
  返回 words 中最長的一個單詞，該單詞是由 words 詞典中其他單詞逐步新增一個字母組成。
  若其中有多個可行的答案，則返回答案中字典序最小的單詞。若無答案，則返回空字串。

示例 1：
  輸入：words = ["w","wo","wor","worl", "world"]
  輸出："world"
  解釋： 單詞"world"可由"w", "wo", "wor", 和 "worl"逐步新增一個字母組成。

示例 2：
  輸入：words = ["a", "banana", "app", "appl", "ap", "apply", "apple"]
  輸出："apple"
  解釋："apply" 和 "apple" 都能由詞典中的單片語成。但是 "apple" 的字典序小於 "apply"

題解思路

這裡採用字首樹最明顯的提示就是該單詞由其他單片語成，這樣用字首樹模型只需判斷序號即可。

如果不採用字首樹的方法，直接用雜湊表儲存來代替也可以實現，而且速度上也相差不多，

這樣就印證了開頭我們所說的效率問題，具體思路還是陣列的排序和遍歷，排序之後保證長度和序號正確，

之後無論是用字首樹依次新增還是用雜湊表儲存出現過的單詞判斷當前遍歷的單詞是否由其他的單片語成皆可。

    public String longestWord(String[] words) {
        Arrays.sort(words, (a, b) -> {
            if (a.length() != b.length()) {
                return a.length() - b.length();
            } else {
                return b.compareTo(a);
            }
        });

        String longest = "";
        Set<String> set = new HashSet<>();
        set.add("");
        for (String word : words) {
            if (set.contains(word.substring(0, word.length() - 1))) {
                set.add(word);
                longest = word;
            }
        }
        return longest;
    }

    public String longestWord01(String[] words) {
        Trie trie = new Trie();
        for (String word : words) {
            trie.insert(word);
        }
        String longest = "";
        for (String word : words) {
            if (trie.search(word)) {
                if (word.length() > longest.length() || (word.length() == longest.length() && word.compareTo(longest) < 0)) {
                    longest = word;
                }
            }
        }
        return longest;
    }

總結

雖然題目上有點明顯展示字首樹的嫌疑，不過確實是字首樹的經典例題，能夠加深對字首樹的理解和感受。

當然有人會覺得這裡的字首樹和雜湊表過於浪費空間，所以可以用Stack判斷往裡pop和push。

如果文章存在問題歡迎在評論區斧正和評論，各自努力，你我最高處見。

淺談字典樹 + LeetCode——720. 詞典中最長的單詞（Java）

引言字首樹，也叫字典樹，我們成為 Trie樹（發音類似 \"try\"），是一種多路樹形結構，是雜湊樹的一種延伸。

LeetCode 720. 詞典中最長的單詞

思路先將所有單詞存入字典樹。對於每個單詞，在字典樹中檢查它的全部字首是否存在。

720--詞典中最長的單詞（字典樹）

題目給出一個字串陣列words 組成的一本英語詞典。返回words 中最長的一個單詞，該單詞是由words詞典中其他單詞逐步新增一個字母組成。

LeetCode——1833. 雪糕的最大數量（Java）

題目描述題幹：夏日炎炎，小男孩 Tony 想買一些雪糕消消暑。商店中新到 n 支雪糕，用長度為 n 的陣列 costs 表示雪糕的定價

91詞典中最長的單詞(720)

作者: Turbo時間限制: 1S章節: 其它晚於: 2020-09-09 12:00:00後提交分數乘係數50% 問題描述 :

LeetCode 329 矩陣中最長增長路徑

LeetCode 329 矩陣中最長增長路徑取自官方題解記憶化深度遍歷 class Solution { //方向矩陣: 上、下、左、右

展示資料夾中的所有文字（java）

遍歷資料夾中的所有文字首先我們需要定義一個File物件，並給定File物件中的path（目錄）。定義一個方法，引數就是定義的File物件。重點就是在方法中得到目錄中所有檔案並遍歷其中的檔案，通過ListFiles方法得到目錄

Python 找出英文單詞列表(list)中最長單詞鏈

本文主要介紹Python中單詞字串的列表(list)，找出列表中所有單詞中前一個單詞首字母和後一個單詞尾字母相同，組成最長的單詞鏈方法程式碼，並且每個單詞不能多次使用。

【劍指offer中等部分12】數字在升序陣列中出現的次數（java）

技術標籤：有趣的演算法二分法演算法資料結構java 目錄題目描述分析一、暴力破解二、二分法2.1 二分法思路12.2 二分法思路2

【劍指offer中等部分20】陣列中重複的數字（java）

技術標籤：劍指offerjava資料結構演算法一、題目描述在一個長度為n的數組裡的所有數字都在0到n-1的範圍內。陣列中某些數字是重複的，但不知道有幾個數字是重複的。也不知道每個數字重複幾次。請找出陣列中第一

【劍指offer較難部分10】二叉樹中和為某一值的路徑（java）

技術標籤：劍指offer（java）資料結構二叉樹java演算法題目描述輸入一顆二叉樹的根節點和一個整數，按字典序打印出二叉樹中結點值的和為輸入整數的所有路徑。路徑定義為從樹的根結點開始往下一直到葉結點所經過

在JavaScript中查詢字串中最長單詞的三種方法(推薦)

本文基於Free Code Camp基本演算法指令碼“查詢字串中最長的單詞”。在此演算法中，我們要檢視每個單詞並計算每個單詞中有多少個字母。然後，比較計數以確定哪個單詞的字元最多，並返回最長單詞的長度。

LeetCode——1239. 串聯字串的最大長度（Java）

題目描述題幹：給定一個字串陣列 arr，字串 s 是將 arr 某一子序列字串連線所得的字串

LeetCode——面試題 10.02. 變位片語（Java）

題目描述題目：編寫一種方法，對字串陣列進行排序，將所有變位詞組合在一起。變位詞是指字母相同，但排列不同的字串。

[LeetCode]1.Two Sum 兩數之和（Java）

原題地址：two-sum 題目描述：給定一個整數陣列 nums和一個整數目標值 target，請你在該陣列中找出和為目標值 target的那兩個整數，並返回它們的陣列下標。

[LeetCode]3.無重複字元的最長子串（Java）

LeetCode 03 原題地址： longest-substring-without-repeating-characters/submissions 題目描述：示例 1:

LeetCode——240. 搜尋二維矩陣 II（Java）

題目描述題幹：編寫一個高效的演算法來搜尋mxn矩陣 matrix 中的一個目標值 target 。

C語言輸出字串中最長單詞

#include <stdio.h>#include <string.h> int main() { void len(char eng[ ], char lens[ ]); char eng[100], lens[50]; gets_s(eng); len(eng, lens); printf(\"%s\", lens); return 0;}void len(char

淺談spring-boot的單元測試中,@Before不被執行的原因

我們先來看下筆者的單元測試的依賴版本： <parent> <groupId>org.springframework.boot</groupId>

淺談cv2.imread()和keras.preprocessing中的image.load_img()區別

1、image.load_img() from keras.preprocessing import image img_keras = image.load_img(\'./original/dog/880.jpg\')

淺談字典樹 + LeetCode——720. 詞典中最長的單詞（Java）

引言

實現字首樹

題目描述

題解思路

總結

相關推薦