用散列表格儲存體資料在理論上能做到常量級的查詢或插入時間複雜度。散列表中最核心的是求取雜湊值。有集合R、有限整數集Z,將R映射到Z的函數稱為散列函數。
整數的散列函數可以為模數函數,因為整數域中的任何元素總可以通過模數操作被限制到一定範圍內;
字串的散列函數有很多,不一一列舉;
結構體的散列函數則可以視結構體的具體結構而定。
......
題為“通用散列表”,所以這裡實現的散列表並不依賴於具體的資料類型,本實現僅提供散列表查詢和插入的介面,具體的散列函數需由調用該介面的使用者提供。
參考源碼:
#define MAX_SIZE 10009#define SAME 0#define TRUE 1#define FALSE 0struct HashNode{ void* value; struct HashNode* next;};static struct HashNode* g_hash_table[MAX_SIZE];typedef unsigned int (*func_hash_value)(void* value);typedef int (*func_cmp)(void*, void*);int hash_insert_value(void* value, func_hash_value hash_value, func_cmp cmp){ unsigned int val = hash_value(value) % MAX_SIZE; struct HashNode* p = g_hash_table[val]; for (; p != NULL; p = p->next) if (cmp(p->value, value) == SAME)// the value is already insert into the table return 0; if (!(p = (struct HashNode*)malloc(sizeof(struct HashNode)))) return -1;// insert failed p->value = value; p->next = g_hash_table[val]; g_hash_table[val] = p; return 0;}int hash_has_value(void* value, func_hash_value hash_value, func_cmp cmp){ unsigned int val = hash_value(value) % MAX_SIZE; struct HashNode* p = g_hash_table[val]; for (; p != NULL; p = p->next) if (cmp(p->value, value) == SAME) return TRUE; return FALSE;}
func_hash_value為散列函數,func_cmp比對函數。這兩個函數均需由使用者提供。
下列源碼提供了字串散列表的測試常式。
unsigned int bkdr_hash_value(char *str){unsigned int seed = 131;// 31 131 1313 13131 131313 ...unsigned int hash = 0;while (*str)hash = hash * seed + (*str++);return (hash & 0x7FFFFFFF);}int string_cmp_func(void* a, void* b){ return strcmp((char*)a, (char*)b);}int main(int argc, char* argv[]){ int n, a, i; char* str = NULL; char s[100]; memset(g_hash_table, 0, sizeof(g_hash_table)); scanf("%d", &n); while (n--) { str = (char*)malloc(100); scanf("%s", str); hash_insert_value((void*)str, (unsigned int(*)(void*))bkdr_hash_value, string_cmp_func); } printf("hash table already created. now input the times you want to search\n"); scanf("%d", &n); while (n--) { scanf("%s", s); printf("value %s %s\n", s, hash_has_value((void*)s, (unsigned int(*)(void*))bkdr_hash_value, string_cmp_func) == TRUE ? "exist" : "not exit"); } return 0;}
hash_has_value((void*)s, (unsigned int(*)(void*))bkdr_hash_value, string_cmp_func),此處可能不太好理解,” (unsigned int(*)(void*))bkdr_hash_value“是什麼東西?這種用法確實不常見,但如果不在bkdr_hash_value前加那麼一段可能編譯就通不過,因為函數類型與所要求的並不一致,所以前面的那一段實際上是強制類型轉換。