關於雜湊表的表大小

最後更新：2018-12-05 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

最近我在做一個項目，其中要用到一個資料結構――Hash
Table（雜湊表），以前只有理論知識，現在實卻發現很不簡單，所以寫下來和大家共分享。

我們知道，雜湊表是一個固定大小的數組，數組的每個元素是一個鏈表（單向或雙向）的頭指標。如果Key一樣，則在一起，如果Key不一樣，則不在一
起。雜湊表的查詢是飛快的。因為它不需要從頭搜尋，它利用Key的“雜湊演算法”直接定位，尋找非常快，各種資料庫中的資料結構基本都是它。但帶來的問題
是，雜湊表的尺寸、雜湊演算法。

雜湊表的數組是定長的，如果太大，則浪費，如果太小，體現不出效率。合適的數組大小是雜湊表的效能的關鍵。雜湊表的尺寸最好是一個質數，最小的質數
尺寸是17。

當然，根據不同的資料量，會有不同的雜湊表的大小。對於資料量很時多時少的應用，最好的設計是使用動態可變尺寸的雜湊表，那麼如果你發現雜湊表尺寸
太小了，比如其中的元素是雜湊表尺寸的2倍時，我們就需要擴大雜湊表尺寸，一般是擴大一倍。下面的數庫是雜湊表變化尺寸時尺寸大小的一個列表。

static int prime_array[] = {
    17,             /* 0 */

37,             /* 1 */
    79,             /* 2 */

163,            /* 3 */
    331,            /* 4 */

673,            /* 5 */
    1361,           /* 6 */

2729,           /* 7 */
    5471,           /* 8 */

10949,          /* 9 */
    21911,          /* 10 */

43853,          /* 11 */
    87719,          /* 12 */

175447,         /* 13 */
    350899,         /* 14 */

701819,         /* 15 */
    1403641,        /* 16 */

2807303,        /* 17 */
    5614657,        /* 18 */

11229331,       /* 19 */
    22458671,       /* 20 */

44917381,       /* 21 */
    89834777,       /* 22 */

179669557,      /* 23 */
    359339171,      /* 24 */

718678369,      /* 25 */
    1437356741,     /* 26 */

2147483647      /* 27 (largest signed int prime) */
};

#define PRIME_ARRAY_SIZE (28)

要使用雜湊表，就一定要用一個雜湊演算法，來確定KEY值，這似乎是個很難的事，下面是一個雜湊演算法：

typedef struct _hTab{
    hLinks* link;    /* 一個鏈表 */

int  num;     /* 成員個數 */
    int  size;    /* 表的尺寸 */
} hTab;

static unsigned int
getHashIndex(hTab *tabPtr, const char *key)
{

unsigned int ha = 0;

    while (*key)
        ha = (ha *
128 + *key++) % tabPtr->size;

return ha;

}

（其中key是一個字串，hTab就是一個雜湊表結構, tabPtr->size是雜湊表數組的大小）

這個演算法被實施證明是比較不錯的，能夠達到分散資料的效果，如果你有更好的演算法，歡迎和我交流。（litmouse@km169.net

）

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

關於雜湊表的表大小

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support