1. 程式人生 > >java實現的Trie樹資料結構

java實現的Trie樹資料結構

package com.algorithms;

import java.util.HashMap;
import java.util.Map;


public class Trie_Tree{
	 
	
	/**
	 * 內部節點類
	 * @author "zhshl"
	 * @date	2014-10-14
	 *
	 */
	private class Node{
		private int dumpli_num;////該字串的重複數目,  該屬性統計重複次數的時候有用,取值為0、1、2、3、4、5……
		private int prefix_num;///以該字串為字首的字串數, 應該包括該字串本身!!!!!
		private Node childs[];////此處用陣列實現,當然也可以map或list實現以節省空間
		private boolean isLeaf;///是否為單詞節點
		public Node(){
			dumpli_num=0;
			prefix_num=0;
			isLeaf=false;
			childs=new Node[26];
		}
	}	
	
	
	private Node root;///樹根  
	public Trie_Tree(){
		///初始化trie 樹
		root=new Node();
	}
	
	
	
	/**
	 * 插入字串,用迴圈代替迭代實現
	 * @param words
	 */
	public void insert(String words){
		insert(this.root, words);
	}
	/**
	 * 插入字串,用迴圈代替迭代實現
	 * @param root
	 * @param words
	 */
	private void insert(Node root,String words){
		words=words.toLowerCase();////轉化為小寫
		char[] chrs=words.toCharArray();
		
		for(int i=0,length=chrs.length; i<length; i++){
			///用相對於a字母的值作為下標索引,也隱式地記錄了該字母的值
			int index=chrs[i]-'a';
			if(root.childs[index]!=null){
				////已經存在了,該子節點prefix_num++
				root.childs[index].prefix_num++;
			}else{
				///如果不存在
				root.childs[index]=new Node();
				root.childs[index].prefix_num++;				
			}	
			
			///如果到了字串結尾,則做標記
			if(i==length-1){
				root.childs[index].isLeaf=true;
				root.childs[index].dumpli_num++;
			}
			///root指向子節點,繼續處理
			root=root.childs[index];
		}
		
	}
	
	
	
	
	/**
	 * 遍歷Trie樹,查詢所有的words以及出現次數
	 * @return HashMap<String, Integer> map
	 */
	public HashMap<String,Integer> getAllWords(){
//		HashMap<String, Integer> map=new HashMap<String, Integer>();
			
		return preTraversal(this.root, "");
	}
	
	/**
	 * 前序遍歷。。。
	 * @param root		子樹根節點
	 * @param prefixs	查詢到該節點前所遍歷過的字首
	 * @return
	 */
	private  HashMap<String,Integer> preTraversal(Node root,String prefixs){
		HashMap<String, Integer> map=new HashMap<String, Integer>();
		
		if(root!=null){
			
			if(root.isLeaf==true){
			////當前即為一個單詞
				map.put(prefixs, root.dumpli_num);
			}
			
			for(int i=0,length=root.childs.length; i<length;i++){
				if(root.childs[i]!=null){
					char ch=(char) (i+'a');
					////遞迴呼叫前序遍歷
					String tempStr=prefixs+ch;
					map.putAll(preTraversal(root.childs[i], tempStr));
				}
			}
		}		
		
		return map;
	}
	
	
	
	
	/**
	 * 判斷某字串是否在字典樹中
	 * @param word
	 * @return true if exists ,otherwise  false 
	 */
	public boolean isExist(String word){
		return search(this.root, word);
	}
	/**
	 * 查詢某字串是否在字典樹中
	 * @param word
	 * @return true if exists ,otherwise  false 
	 */
	private boolean search(Node root,String word){
		char[] chs=word.toLowerCase().toCharArray();
		for(int i=0,length=chs.length; i<length;i++){
			int index=chs[i]-'a';
			if(root.childs[index]==null){
				///如果不存在,則查詢失敗
				return false;
			}			
			root=root.childs[index];			
		}
		
		return true;
	}
	
	/**
	 * 得到以某字串為字首的字串集,包括字串本身! 類似單詞輸入法的聯想功能
	 * @param prefix 字串字首
	 * @return 字串集以及出現次數,如果不存在則返回null
	 */
	public HashMap<String, Integer> getWordsForPrefix(String prefix){
		return getWordsForPrefix(this.root, prefix);
	}
	/**
	 * 得到以某字串為字首的字串集,包括字串本身!
	 * @param root
	 * @param prefix
	 * @return 字串集以及出現次數
	 */
	private HashMap<String, Integer> getWordsForPrefix(Node root,String prefix){
		HashMap<String, Integer> map=new HashMap<String, Integer>();
		char[] chrs=prefix.toLowerCase().toCharArray();
		////
		for(int i=0, length=chrs.length; i<length; i++){
			
			int index=chrs[i]-'a';
			if(root.childs[index]==null){
				return null;
			}
			
			root=root.childs[index];
		
		}
		///結果包括該字首本身
		///此處利用之前的前序搜尋方法進行搜尋
		return preTraversal(root, prefix);
	}
	   
}

以下是測試類: