關於雜湊
先來瞭解一下Hash的基本思路:
設要儲存物件的個數為num, 那麼我們就用len個記憶體單元來儲存它們(len>=num); 以每個對象ki的關鍵字為自變數,用一個函數h(ki)來映射出ki的記憶體位址,也就是ki的下標,將ki對象的元素內容全部存入這個地址中就行了。這個就是Hash的基本思路。
為什麼要用一個函數來映射出它們的地址單元呢?
假設現在我要儲存4個元素 13 7 14 11
顯然,我們可以用數組來存。也就是:a[1] = 13; a[2] = 7; a[3] = 14; a[4] = 11;
當然,我們也可以用Hash來存。下面給出一個簡單的Hash儲存:
先來確定那個函數。我們就用h(ki) = ki%5;
對於第一個元素 h(13) = 13%5 = 3; 也就是說13的下標為3;即Hash[3] = 13;
對於第二個元素 h(7) = 7 % 5 = 2; 也就是說7的下標為2; 即Hash[2] = 7;
同理,Hash[4] = 14; Hash[1] = 11;
現在我要你尋找11這個元素是否存在。你會怎麼做呢?當然,對於數組來說,那是相當的簡單,一個for迴圈就可以了。
也就是說我們要找4次。
下面我們來用Hash找一下。
首先,我們將要找的元素11代入剛才的函數中來映射出它所在的地址單元。也就是h(11) = 11%5 = 1了。下面我們來比較一下Hash[1]?=11, 這個問題就很簡單了。也就是說我們就找了1次。這個就是Hash的妙處了,通過制定一個規則(函數)來映射出它的地址,資料也就能通過這個規則去找到它的記憶體位址了。
Ruby中的Hash結構
1.建立雜湊:就像建立數組一樣,我們可以通過Hash類來建立一個Hash執行個體:
h1 = Hash.new #預設值為nilh2 = Hash.new(“This is my first hash instance”) #預設值為” This is my first hash instance”:
上面兩個例子都建立了一個空的Hash執行個體。一個Hash對象總是有一個預設的值——因為如果在一個Hash對象裡沒有找到指定的索引(key),將會返回預設值。
建立了Hash對象後,我們就可以像數組那樣給他添加/刪除項了。唯一不同的是,在數組中的索引只是能整數,而在Hash中索引(key)可以是任何類型(any type of object)且唯一的資料:
h2["one"] = "北京"h2["two"] = "上海"h2["three"] = "深圳"h2["four"] = "廣州"
Note: 如果在給Hash賦值時,使用的相同的key,那麼後面的值會覆蓋掉前面的值。另外,Ruby還提供了一種方便的建立和初始化Hash的方法,只需要在key後面加一個=>符號並跟一個值即可。每個key-value對用逗號隔開。然後整體用大括弧括起來:
h2 = {"one" => "北京","two" =>"上海","three" =>"深圳","four" =>"廣州" }
2.通過索引存取Hash的值:
要想擷取某個值,可以用下面的方法:
如果指定的key不存在,將返回預設的值(前面有提到過)。此外,我們還可以用default方法擷取預設值,用default+=方法設定預設值
puts h1.default h1.default += “This is set value method”
3.複製Hash:
和數組一樣,我們可以把一個Hash變數分配給另一個hash變數,它們都引用想同的Hash,所以如果其中一個的值變了,那麼另外一個的值也會跟著變:
h3 = h2 h3[“one”] = “西安” puts h h2[“one”] #=>”西安”
有的時候我們不希望上面的情況發生,即:修改了其中一個的值另一個也跟著修改了,我們可以使用clone方法make a new
copy h4 = h2.clone h4[“one”] = “大連” puts h2[“one”] #=>”西安”(i.e. 值沒有修改)
4.Hash排序:
當我們需要對Hash進行排序時,不能像數組那樣簡單的使用sort方法,因為數組中的資料類型都是一樣的(整型),Hash中的資料類型可能並不完全一樣,如整數類型和字串類型就沒法一起排序,此時就需要我們進行處理,如下(如果Hash中的資料類型全部相同可以不進行如下處理):
def sorted_hash(aHash) return aHash.sort{ |a,b| a.to_s <=> b.to_s } Endh1 = {1=>'one', 2=>'two', 3=> 'three'}h2 = {6=>'six', 5=>'five', 4=> 'four'}h3 = {'one'=>'A', 'two'=>'B','three'=>'C'}h4 = h1.merge(h2) #合并hashh5 = h1.merge(h3)def sorted_hash(aHash) return aHash.sort{|a,b| a.to_s <=> b.to_s }endp(h4) p(h4.sort)p(h5)p(sorted_hash(h5))
結果:
{5=>"five", 6=>"six", 1=>"one", 2=>"two", 3=>"three", 4=>"four"}[[1, "one"], [2, "two"], [3, "three"], [4, "four"], [5, "five"], [6, "six"]]{"two"=>"B", "three"=>"C", 1=>"one", 2=>"two", "one"=>"A", 3=>"three"}[[1, "one"], [2, "two"], [3, "three"], ["one", "A"], ["three", "C"], ["two", "B"]]
事實上Hash的sort方法是把一個Hash對象轉換成以[key,value]為單個元素的一個數組,然後再用數組的sort方法進行排序。
5.Hash類常用方法:
方法 |
說明 |
size() |
返回Hash對象的長度 |
length() |
返回Hash對象的長度 |
include?(key) |
判斷指定的Hash對象是否包含指定的key |
has_key?(key) |
判斷指定的Hash對象是否包含指定的key |
delete(key) |
刪除Hash對象中指定key的對應元素 |
keys() |
返回由Hash對象中全部key組成的數組 |
values() |
返回由Hash對象中全部value組成的數組 |
e.g.
student = { "name" => "Steve", "age" => 22, "Gender" => "male" } p student.keys #=> ["name", "Gender", "age"] p student.values #=> ["Steve", "male", 22] puts student.include?("age") #=> true puts student.size #=> 3 student.delete("Gender") puts student.has_key?("Gender") #=>false puts student.size #=>2
深度挖掘
1.把Hash當作數組來處理:
Hash中的keys and values方法的傳回值都是一個數組,所以我們可以使用數組的方法來對它們操作:
h1 = {1=>'one', 2=>'two', 3=> 'three',4=> 'four'}h2 = {1=>'one', 3=>'two', 4=> 'four',5=> 'five'} p( h1.keys & h2.keys )p( h1.values & h2.values )p( h1.keys+h2.keys )p( h1.values-h2.values )p( (h1.keys << h2.keys) )p( (h1.keys << h2.keys).flatten)
結果:
[1, 3, 4]["one", "two", "four"][1, 2, 3, 4, 5, 1, 3, 4]["three"][1, 2, 3, 4, [5, 1, 3, 4]][1, 2, 3, 4, 5, 1, 3, 4]
2.追加和連續的區別:
+:給一個數組添加元素,建立一個新的數組
<<:給一個資料添加元素,直接操作原數組,當給一個數組添加的新元素也是一個數組時,該新元素作為數組的最後一個元素:
a=[1,2,3] b=[4,5,6] p(a+b) p(a<<b)
結果:
[1, 2, 3, 4, 5, 6][1, 2, 3, [4, 5, 6]] #[1, 2, 3, [4, 5, 6]].flatten =>[1, 2, 3, 4, 5, 6]