1. 程式人生 > >hash表的簡單說明以及例子

hash表的簡單說明以及例子

    陣列的特點是:定址容易,插入和刪除困難;而連結串列的特點是:定址困難,插入和刪除容易。hash表可以解決以上兩個不足之處。

           假如你要在圖書館裡找一本《電路原理》,這本書首先它在工科類下面,再在工科類的電子資訊這個分類裡面,你首先要找到工科,再找到電子資訊類,然後再找《電路原理》。好了,hashEntry_s相當於這個分類表,它的key就是你要查的類別,data就是你要查的書本,hashtable就是那張存放類別的大表。

struct hashEntry_s{
	void *key;
	void *data;
	struct hashEntry_s *next;	
};

struct hashTable_s{
    struct hashEntry_s **hashlist;
};  
typedef struct hashTable_s hashTable_t;

 

首先要生成這樣hash表

HASHSIZE   最好是素數,這樣可以減少衝突的概率。

hashlist指向各個分類

#define HASHSIZE 67

hashTable_t *createHashTable(void)
{
    hashTable_t *table;
    int i,len,primesize;
    table = malloc(sizeof(hashTable_t));
    if(NULL == table){    
        printf("error in createtable");
        return NULL;
    }
    len = sizeof(struct hashEntry_s *)*HASHSIZE;
    table->hashlist = malloc(len);
    if(table->hashlist == NULL){
        printf("error in createtable\n");
        exit(1);
    }
    for(i=0;i<HASHSIZE;i++)
        table->hashlist[i]=NULL;

    return table; 
}

hash表中的標籤。就相當於在圖書觀的那張表中,工科類被編號1234一樣。hash表中也要將key做一個標籤,通過key可以快速定位table中的hashlist,進而快速提取資料。

hash演算法有很多,可參考http://hi.baidu.com/hytjfxk/blog/item/46f6feceafbe622392457e0a.html

我擷取其中一個比較簡單的演算法作為我的hash演算法,它將字串轉換成了響應的整數。

unsigned long  getHashValue(char *string)
{    
      unsigned long ret=0;
      long n;
      unsigned long v;
      int r;

    if(NULL == string){
        return 0;
    }
  /*
     unsigned char b[16];
     MD5(c,strlen(c),b);
     return(b[0]|(b[1]<<8)|(b[2]<<16)|(b[3]<<24));
  */
      n=0x100;
      while (*string) {
        v=n|(*string);
         n+=0x100;
         r= (int)((v>>2)^v)&0x0f;
         ret=(ret<<r)|(ret>>(32-r));
         ret&=0xFFFFFFFFL;
         ret^=v*v;
         string++;
    //    printf("while is over\n");
      }
      return((ret>>16)^ret);
}


由於我們table的大小為HASHSIZE,所以要將key放入表中的話,得到的hash值還需整除HASHSIZE。

將標籤和資料插入表中(int insertHash(void *key,void *data,hashTable_t *tab)),比如我要《電路原理》這部書放置在電子資訊工程這張表裡,key是電路原理,data是電路原理的內容,table是電子資訊工程。  hashlist是表中一個個分類。

/*檢查key是否已經存在於表中*/
int UpdateHashList(void *key,void *data,struct hashEntry_s *hashlist,hashTable_t *tab)
{
    if(hashlist !=NULL){            
        struct hashEntry_s *pos;
        for(pos=hashlist;pos != NULL;pos=pos->next){
            if(strcmp(key,pos->key)==0){
                pos->key = key;
                pos->data =data;
                return 0;
            }
        }
    }
    return -1;
}

int insertHash(void *key,void *data,hashTable_t *tab)
{
    int index;
    index =getHashValue((char *)key)%HASHSIZE;
//    printf("index:%d\n",index);
    if(UpdateHashList(key,data,tab->hashlist[index],tab)<0){
        struct hashEntry_s *l;
        l= hashEntryNew(key,data);
        if(tab->hashlist[index] == NULL){
            tab->hashlist[index] = l;
            printf("insert data:%s\n",(char *)tab->hashlist[index]->data);
        }else{
            struct hashEntry_s *pos;
            for(pos = tab->hashlist[index];pos->next !=NULL;pos->next){
                    pos= l;
                }
          }
      }    
    return 0;
}

得到元素資料(void *getHashData(void *key,hashTable_t *tab))。假如要取《電路原理》的資訊,那麼key即為電路原理,tab是電子資訊工程那張表。

void *getHashData(void *key,hashTable_t *tab)
{
	int index;
	char *get_data;
	index = getHashValue((char *)key)%HASHSIZE;
	printf("get index :%d\n",index);
	struct hashEntry_s *pos;

	for(pos = tab->hashlist[index];pos !=NULL;pos = pos->next){
		if(strcmp(key,pos->key) == 0){
			return pos->data;
		}
	}
	return NULL;
}

刪除表資訊

int removeHash(void *key,hashTable_t *tab)

{
	int index;
	index = getHashValue((char *)key)%HASHSIZE;
	struct hashEntry_s *pos;
	for(pos=tab->hashlist[index];pos != NULL;pos=pos->next,index++){
		if(strcmp(key,pos->key) == 0){
			pos->key = NULL;
			pos->data = NULL;
			if(pos->next != NULL){
				pos =pos->next;
			}else{
				tab->hashlist[index] =NULL;
			}
			return 0;
		}
		return -1;
	}
	printf("remove over!\n");
	return -1;
}

按照上面的思路,假如你要從圖書館這個大表開始查的話,得建兩張hash表,一張是圖書館,一張是電子資訊。查的時候,圖書館表中的key是電子資訊,電子資訊表中的key是電路原理。

下面是把上面程式碼整個起來做的一個簡單測試。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <malloc.h>

#define HASHSIZE 67

struct hashEntry_s{
	void *key;
	void *data;
	struct hashEntry_s *next;	
};

struct hashTable_s{
	struct hashEntry_s **hashlist;
};  
typedef struct hashTable_s hashTable_t;

unsigned long  getHashValue(char *string)
{	
 	 unsigned long ret=0;
 	 long n;
 	 unsigned long v;
 	 int r;

	if(NULL == string){
		return 0;
	}
  /*
     unsigned char b[16];
     MD5(c,strlen(c),b);
     return(b[0]|(b[1]<<8)|(b[2]<<16)|(b[3]<<24));
  */
 	 n=0x100;
  	while (*string) {
    	v=n|(*string);
     	n+=0x100;
     	r= (int)((v>>2)^v)&0x0f;
     	ret=(ret<<r)|(ret>>(32-r));
     	ret&=0xFFFFFFFFL;
     	ret^=v*v;
     	string++;
	//	printf("while is over\n");
  	}
  	return((ret>>16)^ret);
}

hashTable_t *createHashTable(void)
{
	hashTable_t *table;
	int i,len,primesize;
	table = malloc(sizeof(hashTable_t));
	if(NULL == table){	
		printf("error in createtable");
		return NULL;
	}
	len = sizeof(struct hashEntry_s *)*HASHSIZE;
	table->hashlist = malloc(len);
	if(table->hashlist == NULL){
		printf("error in createtable\n");
		exit(1);
	}
	for(i=0;i<HASHSIZE;i++)
		table->hashlist[i]=NULL;

	return table; 
}

inline struct  hashEntry_s *hashEntryNew(void *key, void *data)
{
    struct hashEntry_s *new = malloc(sizeof(struct hashEntry_s));
	memset(new,0,sizeof(struct hashEntry_s));
    new->key = key;
    new->data = data;
    new->next = NULL;
    return new;
}

int UpdateHashList(void *key,void *data,struct hashEntry_s *hashlist,hashTable_t *tab)
{
	if(hashlist !=NULL){			
		struct hashEntry_s *pos;
		for(pos=hashlist;pos != NULL;pos=pos->next){
			if(strcmp(key,pos->key)==0){
				pos->key = key;
				pos->data =data;
				return 0;
			}
		}
	}
	return -1;
}

int insertHash(void *key,void *data,hashTable_t *tab)
{
	int index;
	index =getHashValue((char *)key)%HASHSIZE;
//	printf("index:%d\n",index);
	if(UpdateHashList(key,data,tab->hashlist[index],tab)<0){
		struct hashEntry_s *l;
		l= hashEntryNew(key,data);
		if(tab->hashlist[index] == NULL){
			tab->hashlist[index] = l;
			printf("insert data:%s\n",(char *)tab->hashlist[index]->data);
		}else{
			struct hashEntry_s *pos;
			for(pos = tab->hashlist[index];pos->next !=NULL;pos->next){
					pos= l;
				}
	  	}
	  }	
	return 0;
}

void *getHashData(void *key,hashTable_t *tab)
{
	int index;
	char *get_data;
	index = getHashValue((char *)key)%HASHSIZE;
	printf("get index :%d\n",index);
	struct hashEntry_s *pos;

	for(pos = tab->hashlist[index];pos !=NULL;pos = pos->next){
		if(strcmp(key,pos->key) == 0){
			return pos->data;
		}
	}
	return NULL;
}

int removeHash(void *key,hashTable_t *tab)
{
	int index;
	index = getHashValue((char *)key)%HASHSIZE;
	struct hashEntry_s *pos;
	for(pos=tab->hashlist[index];pos != NULL;pos=pos->next,index++){
		if(strcmp(key,pos->key) == 0){
			pos->key = NULL;
			pos->data = NULL;
			if(pos->next != NULL){
				pos =pos->next;
			}else{
				tab->hashlist[index] =NULL;
			}
			return 0;
		}
		return -1;
	}
	printf("remove over!\n");
	return -1;
}
int main(void)
{
	hashTable_t *table_a;
	int i=0;
	char *data ="hello";
	char *getdata ="world" ;
	char *key ="1";
	table_a = createHashTable();
	if(table_a == NULL){
		printf("error!\n");
		return -1;
	}

	insertHash(key,data,table_a);

	getdata = getHashData(key,table_a);
	if(getdata == NULL ){
		printf("wo cao !!!\n");
	   	return -1;
	}
	printf("get hash data :%s\n",getdata);	

	char *data2="next!";
	insertHash(key,data2,table_a);

	getdata = getHashData(key,table_a);
	if(getdata == NULL ){
		printf("empty !!!\n");
	   	return -1;
	}
	printf("get hash data :%s\n",getdata);	

	removeHash(key,table_a);
	getdata = getHashData(key,table_a);
	if(getdata == NULL ){
		printf("empty !!!\n");
	   	return -1;
	}
	printf("get data remove:%s\n",getdata);

	free(table_a);
	return 0;
}