java實現的Trie樹資料結構
阿新 • • 發佈:2019-02-01
package com.algorithms; import java.util.HashMap; import java.util.Map; public class Trie_Tree{ /** * 內部節點類 * @author "zhshl" * @date 2014-10-14 * */ private class Node{ private int dumpli_num;////該字串的重複數目, 該屬性統計重複次數的時候有用,取值為0、1、2、3、4、5…… private int prefix_num;///以該字串為字首的字串數, 應該包括該字串本身!!!!! private Node childs[];////此處用陣列實現,當然也可以map或list實現以節省空間 private boolean isLeaf;///是否為單詞節點 public Node(){ dumpli_num=0; prefix_num=0; isLeaf=false; childs=new Node[26]; } } private Node root;///樹根 public Trie_Tree(){ ///初始化trie 樹 root=new Node(); } /** * 插入字串,用迴圈代替迭代實現 * @param words */ public void insert(String words){ insert(this.root, words); } /** * 插入字串,用迴圈代替迭代實現 * @param root * @param words */ private void insert(Node root,String words){ words=words.toLowerCase();////轉化為小寫 char[] chrs=words.toCharArray(); for(int i=0,length=chrs.length; i<length; i++){ ///用相對於a字母的值作為下標索引,也隱式地記錄了該字母的值 int index=chrs[i]-'a'; if(root.childs[index]!=null){ ////已經存在了,該子節點prefix_num++ root.childs[index].prefix_num++; }else{ ///如果不存在 root.childs[index]=new Node(); root.childs[index].prefix_num++; } ///如果到了字串結尾,則做標記 if(i==length-1){ root.childs[index].isLeaf=true; root.childs[index].dumpli_num++; } ///root指向子節點,繼續處理 root=root.childs[index]; } } /** * 遍歷Trie樹,查詢所有的words以及出現次數 * @return HashMap<String, Integer> map */ public HashMap<String,Integer> getAllWords(){ // HashMap<String, Integer> map=new HashMap<String, Integer>(); return preTraversal(this.root, ""); } /** * 前序遍歷。。。 * @param root 子樹根節點 * @param prefixs 查詢到該節點前所遍歷過的字首 * @return */ private HashMap<String,Integer> preTraversal(Node root,String prefixs){ HashMap<String, Integer> map=new HashMap<String, Integer>(); if(root!=null){ if(root.isLeaf==true){ ////當前即為一個單詞 map.put(prefixs, root.dumpli_num); } for(int i=0,length=root.childs.length; i<length;i++){ if(root.childs[i]!=null){ char ch=(char) (i+'a'); ////遞迴呼叫前序遍歷 String tempStr=prefixs+ch; map.putAll(preTraversal(root.childs[i], tempStr)); } } } return map; } /** * 判斷某字串是否在字典樹中 * @param word * @return true if exists ,otherwise false */ public boolean isExist(String word){ return search(this.root, word); } /** * 查詢某字串是否在字典樹中 * @param word * @return true if exists ,otherwise false */ private boolean search(Node root,String word){ char[] chs=word.toLowerCase().toCharArray(); for(int i=0,length=chs.length; i<length;i++){ int index=chs[i]-'a'; if(root.childs[index]==null){ ///如果不存在,則查詢失敗 return false; } root=root.childs[index]; } return true; } /** * 得到以某字串為字首的字串集,包括字串本身! 類似單詞輸入法的聯想功能 * @param prefix 字串字首 * @return 字串集以及出現次數,如果不存在則返回null */ public HashMap<String, Integer> getWordsForPrefix(String prefix){ return getWordsForPrefix(this.root, prefix); } /** * 得到以某字串為字首的字串集,包括字串本身! * @param root * @param prefix * @return 字串集以及出現次數 */ private HashMap<String, Integer> getWordsForPrefix(Node root,String prefix){ HashMap<String, Integer> map=new HashMap<String, Integer>(); char[] chrs=prefix.toLowerCase().toCharArray(); //// for(int i=0, length=chrs.length; i<length; i++){ int index=chrs[i]-'a'; if(root.childs[index]==null){ return null; } root=root.childs[index]; } ///結果包括該字首本身 ///此處利用之前的前序搜尋方法進行搜尋 return preTraversal(root, prefix); } }
以下是測試類: