Ruby中的block概念的理解:
文中給出了Javascript代碼塊與Ruby代碼塊的對比,需要的朋友可以參考下
Ruby 裡的 block一般翻譯成代碼塊,block 剛開始看上去有點奇怪,因為很多語言裡面沒有這樣的東西。事實上它還不錯。
First-class function and Higher-order function
First-class function 和 Higher-order function 是函數式程式設計語言裡面的概念,聽起來好像很高端的樣子,其實很很簡單的。
First-class functions 是指在某些語言裡,函數是一等公民,可以把函數當做參數傳遞,
可以返回一個函數,可以把函數賦值個一個變數等等,反正就是正常值能做的事函數都能做。JavaScript 就是這樣的。舉個例子(下面的所有例子裡,當我提到
JavaScript 時,範例程式碼都用的 CoffeeScript):
?
1 2 3 4 5 6 7 |
greet = (name) -> return -> console.log "Hello, #{name}" greetToMike = greet("Mike") greetToMike() # => 輸出 "Hello, Mike" a = greetToMike a() # => 輸出 "Hello, Mike" |
在上面的第四行裡,greet("Mike") 返回了一個函數,所以第五行裡才可以調用 greetToMike()輸出"Hello, Mike"。第六行把一個函數賦值給了a,所以第七行就可以調用這個函數了。
higher-order function 一般翻譯成高階函數,是指接受函數做參數或者返回函數的函數。
舉個非常常用的例子(用 JavaScript):
?
1 2 |
a = [ "a", "b", "c", "d" ] a.map((x) -> x + '!') #=> ["a!", "b!", "c!", "d!"] |
上面例子裡 map 就接受了一個匿名函數作為參數。Array.prototype裡的很多方法,比如reduce, filter,every, some 等等都是高階函數,因為他們都接受函數作為參數。
高階函數非常強大,表達力很強,可以避免大量重複代碼。總的來說,它就是個好東西。
Block 的本質
先來看一組 Ruby 和 CoffeeScript 代碼的對比。
?
1 2 3 4 5 6 7 |
a = [ "a", "b", "c", "d" ] a.map { |x| x + "!" } # => ["a!", "b!", "c!", "d!"] a.reduce { |acc, x| acc + x} # => "abcd" a = [ "a", "b", "c", "d" ] a.map((x) -> x + '!') # => ["a!", "b!", "c!", "d!"] a.reduce((acc, x) -> acc + x) # => "abcd" |
這兩組代碼真的看起來超級像。我覺得這也暴露了 Ruby 的 block 的本質:高階函數的函數參數的變體。
JavaScript 裡面的map 函數接受一個函數作為參數,但是 Ruby 裡的 map 卻接受一個
block 作為參數。
其實 matz 早在一本書裡《松本行弘的程式世界》裡說了:
代碼如下:
最終來看,塊到底是什麼?
...
塊也可以看作只是高階函數的一種特殊形式的文法。
...
高階函數和塊的本質一樣
...
在 Ruby 裡,函數不是一等公民,沒有 first-class functions。但是在 Ruby
裡怎樣使用高階函數呢?答案就是使用 block。可以直接用 block,也可以用 lambda
或者 proc 把 block 轉換成 Proc 類的執行個體用。
我發現在 Ruby 裡使用 block 時,幾乎所有的情況下都可以用 JavaScript
的高階函數替代。
Enumerable 模組裡的所有方法都是典型的例子。事實上確實存在 JavaScript 版
的 Enumerable,比如 Prototype.js 就有個 Enumerable,用起來跟 Ruby版的幾乎一樣的。當然它是通過高階函數實現的。
與高階函數有何不同
除了文法上看上去有點不同外,有非常重要的兩點。
控制流程操作
在 block 裡面可以用 break, next 等等這些在一般的迴圈裡才有的控制流程操作,這些
在高階函數裡是用不了的。比如你可以試試在 JavaScript 裡用 forEach 而不用迴圈
實現個take_while 函數,真是相當彆扭的。比如之前 cnode 上就有人發帖問:nodejs的forEach不支援break嗎?,其實這個文章下面回複用 return 的基本上都是錯的,
some 和 every 這樣利用 短路求值 的特點確實可以 hack 一下,但是明顯不自然而且大大增加了別人理解代碼的難度。
從這一點來看 block 確實還不錯的。
只有一個函數參數的高階函數
Ruby 裡一個方法只能接受一個 block 作為參數,大概就是類似於只有一個函數參數的高階
函數。看起來好像是受到限制了。其實那本《松本行弘的程式世界》對此也有點解釋。
大概是說了一個調查,在傾向於使用高階函數的 OCaml 的標準庫中,94%
的高階函數只有一個函數參數。所以說這點限制不是什麼問題。就我自己的體驗來說,在 JavaScript 裡,還從沒用到需要兩個函數參數的高階函數。
未說明的
嗯,這篇文章看起來有點太長了,所以我不打算寫下去了。其實還有一些重要的地方沒說。比如
Block 其實可以作為閉包用的。Ruby 裡用def定義方法時有點悲劇的,因為它不是閉包,接觸
不到它外面的變數。
?
1 2 3 4 5 |
name = "mike" def greet puts "hello, #{name}" end hello # => in `greet': undefined local variable or method `name' for main:Object (NameError) |
但是用 block 就可以了
?
1 2 3 4 5 |
name = "mike" define_method(:greet) do puts "hello, #{name}" end greet # => "hello, mike" |
用 JavaScript 就根本不存在問題。
?
1 2 3 |
name = "mike" greet = -> console.log "hello, #{name}" greet() # => "hello, mike" |
同理還有class 和 module 關鍵字都會建立新的範圍而在裡面接觸不到外面的變數,
也可以用 block 解決。
還有那個 proc 和 lambda 的區別。其實我一直不理解為什麼會有人不用lambda
而跑去用 proc,明顯 proc 的 return 行為太不符合常識了。但是到頭來卻發現
block 的行為跟 proc 建立的對象的行為是一樣的,比如
?
1 2 3 4 5 |
def hello (1..10).each { |e| return e} return "hello" end hello # => 1 |
這感覺真是有點悲催。
結語
說了這麼多,就是因為在 Ruby 裡面函數不是一等公民,又想獲得函數式編程的便利。