迭代器並不是Ruby發明的.它廣泛地運用於各種物件導向語言.在Lisp中也有,只是不這麼叫罷了.儘管如此,迭代器的概念並不為許多人熟悉,因此我們將在此做較為詳細的介紹.
你知道,動詞 iterate 的意思是做同一件事許多遍,因此,iterator就是用來將同一件事做許多次的東西.
當我們寫代碼時,我們需要各種環境下的迴圈.在C裡,我們用for或者while.比如,
char *str;
for (str = "abcdefg"; *str != '\0'; str++) {
/* process a character here */
}
C的for(...)文法提供了一種寫迴圈的抽象方法,但測試 *str 是否為空白(null)字元需要程式員瞭解字串內部結構的細節.這讓C看起來像低級(low-level)語言.更進階的語言是通過它們更具彈性的迭代器支援來實現的.考慮下面的 sh 命令列指令碼:
#!/bin/sh
for i in *.[ch]; do
# ... here would be something to do for each file
done
目前的目錄下所有的C源檔案和標頭檔都將被處理,由命令列shell來一個個地撿取檔案名稱並處理其中的細節.我想這是在比 C 要高的層級上工作,你覺得呢?
但有更多值得我們考慮的:在一種語言能夠很好的給內建的資料類型的提供迭代器的同時,我們卻仍需要回去用低層級的迴圈語言來實現對自己定義的資料類型的迭代,這真是讓人失望.在面對對象編程時,使用者經常一個接一個地定義資料類型,因此這是一個很嚴重的問題.
因此,所有的OOP語言都包含了一定的迭代器機制.某些語言為此提供一種特殊的類;Ruby則允許我們直接定義迭代器.
Ruby的String類型有很多有用的迭代器:
ruby> "abc".each_byte{|c| printf "<%c>", c}; print "\n"
<a><b><c>
nil
each_byte 是個用於字串中每個字元的迭代器.每個字串由局部變數c代替.這可以翻譯為類似C的代碼...
ruby> s="abc";i=0
0
ruby> while i<s.length
| printf "<%c>", s[i]; i+=1
| end; print "\n"
<a><b><c>
nil
...然而, each_byte 迭代器在概念上要簡單些,而且即使以後 String 類突然有所改變也應該可以照樣工作.使用迭代器的一個好處便是在此類改變中仍然可以保持健壯;一般的,它的確是好代碼的一個特點.(好,請有點兒耐心,我們將會馬上談到什麼是類)
String的另一個迭代器是 each_line.
ruby> "a\nb\nc\n".each_line{|l| print l}
a
c
nil
採用迭代器,這將很輕鬆的取代C的大多數編程效果(找分行符號,產生子串等等)
前面出現的for語句通過each迭代器實現迭代功能. String的each和each_line的工作原理差不多,讓我們用for重寫上面的例子:
ruby> for l in "a\nb\nc\n"
| print l
| end
a
c
nil
我們可以用retry流程式控制制語句串連迭代迴圈,它會從頭執行當前迴圈的迭代.
ruby> c=0
0
ruby> for i in 0..4
| print i
| if i == 2 and c == 0
| c = 1
| print "\n"
| retry
| end
| end; print "\n"
012
01234
nil
yield有時會在一個迭代器的定義中出現. yield將流程式控制制移至傳遞給迭代器的代碼域(這將會在過程對象那一節介紹更多的細節).下面的例子定義了一個repeat迭代器,會依參數的設定執行多次代碼域.
ruby> def repeat(num)
| while num > 0
| yield
| num -= 1
| end
| end
nil
ruby> repeat(3) { print "foo\n" }
foo
foo
foo
nil
利用retry,我們可以定義一個有while相同作用的迭代器,雖然在實際應用中它太慢了.
ruby> def WHILE(cond)
| return if not cond
| yield
| retry
| end
nil
ruby> i=0; WHILE(i<3) { print i; i+=1 }
012 nil
搞懂什麼是迭代器了嗎?有一些限制,但你可以寫自己的迭代器;實際上,當你定義一個新的資料類型時,為它定義一個合適的迭代器經常也很方便.這樣看來,上面的例子並不是很好用.在我們理解了類以後,我們可以討論討論更具實際意義的迭代器.