這是一個建立於 的文章,其中的資訊可能已經有所發展或是發生改變。PHP與Golang如何通訊?
最近遇到的一個情境:php項目中需要使用一個第三方的功能(結巴分詞),而github上面恰好有一個用Golang寫好的類庫。那麼問題就來了,要如何?不同語言之間的通訊呢?
常規的方案:
- 用Golang寫一個http/TCP服務,php通過http/TCP與Golang通訊
- 將Golang經過較多封裝,做為php擴充。
- PHP通過系統命令,調取Golang的可執行檔
存在的問題:
- http請求,網路I/O將會消耗大量時間
- 需要封裝大量代碼
- PHP每調取一次Golang程式,就需要一次初始化,時間消耗很多
最佳化目標:
- Golang程式只初始化一次(因為初始化很耗時)
- 所有請求不需要走網路
- 盡量不大量修改代碼
解決方案:
- 簡單的Golang封裝,將第三方類庫編譯產生為一個可執行檔
- PHP與Golang通過雙向管道通訊
使用雙向管道通訊優勢:
1:只需要對原有Golang類庫進行很少的封裝
2:效能最佳 (IPC通訊是處理序間通訊的最佳途徑)
3:不需要走網路請求,節約大量時間
4:程式只需初始化一次,並一直保持在記憶體中
具體實現步驟:
1:類庫中的原始調取demo
package main import ( "fmt" "github.com/yanyiwu/gojieba" "strings" ) func main() { x := gojieba.NewJieba() defer x.Free() s := "小明碩士畢業於中國科學院計算所,後在日本京都大學深造" words := x.CutForSearch(s, true) fmt.Println(strings.Join(words, "/")) }
儲存檔案為main.go,就可以運行
2:調整後代碼為:
package main import ( "bufio" "fmt" "github.com/yanyiwu/gojieba" "io" "os" "strings" ) func main() { x := gojieba.NewJieba( "/data/tmp/jiebaDict/jieba.dict.utf8", "/data/tmp/jiebaDict/hmm_model.utf8", "/data/tmp/jiebaDict/user.dict.utf8" ) defer x.Free() inputReader := bufio.NewReader(os.Stdin) for { s, err := inputReader.ReadString('\n') if err != nil && err == io.EOF { break } s = strings.TrimSpace(s) if s != "" { words := x.CutForSearch(s, true) fmt.Println(strings.Join(words, " ")) } else { fmt.Println("get empty \n") } } }
只需要簡單的幾行調整,即可實現:從標準輸入接收字串,經過分詞再輸出
測試:
# go build test # ./test # //等待使用者輸入,輸入”這是一個測試“ # 這是 一個 測試 //程式
3:使用cat與Golang通訊做簡單測試
//準備一個title.txt,每行是一句文本
# cat title.txt | ./test
正常輸出,表示cat已經可以和Golang正常互動了
4:PHP與Golang通訊
以上所示的cat與Golang通訊,使用的是單向管道。即:只能從cat向Golang傳入資料,Golang輸出的資料並沒有傳回給cat,而是直接輸出到螢幕。但文中的需求是:php與Golang通訊。即php要傳資料給Golang,同時Golang也必須把執行結果返回給php。因此,需要引入雙向管道。
在PHP中管道的使用:popen("/path/test")
,具體就不展開說了,因為此方法解決不了文中的問題。
雙向管道:
$descriptorspec = array( 0 => array("pipe", "r"), 1 => array("pipe", "w") ); $handle = proc_open( '/webroot/go/src/test/test', $descriptorspec, $pipes ); fwrite($pipes['0'], "這是一個測試文本\n"); echo fgets($pipes[1]);
解釋:使用proc_open開啟一個進程,調用Golang程式。同時返回一個雙向管道pipes數組,php向$pipe['0']中寫資料,從$pipe['1']中讀資料。
好吧,也許你已經發現,我是標題檔,這裡重點要講的並不只是PHP與Golang如何通訊。而是在介紹一種方法: 通過雙向管道讓任意語言通訊。(所有語言都會實現管道相關內容)
測試:
通過對比測試,計算出各個流程佔用的時間。下面提到的title.txt檔案,包含100萬行文本,每行文本是從b2b平台取的商品標題
1: 整體流程耗時
# time cat title.txt | ./test > /dev/null
耗時:14.819秒,消耗時間包含:
- 進程cat讀出文本
- 通過管道將資料傳入Golang
- Golang處理資料,將結果返回到螢幕
2:計算分詞函數耗時。方案:去除分詞函數的調取,即:注釋掉Golang原始碼中的調取分詞那行的代碼
time cat title.txt | ./test > /dev/null
耗時:1.817秒時間,消耗時間包含:
- 進程cat讀出文本
- 通過管道將資料傳入Golang
- Golang處理資料,將結果返回到螢幕
分詞耗時 = (第一步耗時) - (以上命令所耗時)
分詞耗時 : 14.819 - 1.817 = 13.002秒
3:測試cat進程與Golang進程之間通訊所佔時間
time cat title.txt > /dev/null
耗時:0.015秒,消耗時間包含:
- 進程cat讀出文本
- 通過管道將資料傳入Golang
- go處理資料,將結果返回到螢幕
管道通訊耗時:(第二步耗時) - (第三步耗時)
管道通訊耗時: 1.817 - 0.015 = 1.802秒
4:PHP與Golang通訊的時間消耗
編寫簡單的php檔案:
<?php $descriptorspec = array( 0 => array("pipe", "r"), 1 => array("pipe", "w") ); $handle = proc_open( '/webroot/go/src/test/test', $descriptorspec, $pipes ); $fp = fopen("title.txt", "rb"); while (!feof($fp)) { fwrite($pipes['0'], trim(fgets($fp))."\n"); echo fgets($pipes[1]); } fclose($pipes['0']); fclose($pipes['1']); proc_close($handle);
流程與上面基本一致,讀出title.txt內容,通過雙向管道傳入Golang進程分詞後,再返回給php (比上面的測試多一步:資料再通過管道返回)
time php popen.php > /dev/null
耗時:24.037秒,消耗時間包含:
- 進程PHP讀出文本
- 通過管道將資料傳入Golang
- Golang處理資料
- Golang將返回結果再寫入管道,PHP通過管道接收資料
- 將結果返回到螢幕
結論:
1 :整個分詞過程中的耗時分布
使用cat控制邏輯耗時: 14.819 秒使用PHP控制邏輯耗時: 24.037 秒(比cat多一次管道通訊)單向管道通訊耗時: 1.8 秒Golang中的分詞函數耗時: 13.002 秒
2:分詞函數的效能: 單進程,100萬商品標題分詞,耗時13秒
以上時間只包括分詞時間,不包括詞典載入時間。但在本方案中,詞典只載入一次,所以載入詞典時間可以忽略(1秒左右)
3:PHP比cat慢 (這結論有點多餘了,呵呵)
語言層面慢: (24.037 - 1.8 - 14.819) / 14.819 = 50%
單進程對比測試的話,應該不會有哪個語言比cat更快。
相關問題:
最後,上面都是瞎扯的。如果你瞭解管道、雙向管道,上面的解釋對你基本沒啥用。但如果你不瞭解管道,調試上面的代碼沒問題,但稍有修改就有可能掉坑裡。哈哈,推薦一本書吧,《UNIX網路編程》卷一、二,都看一下,也許要看兩個月,但很有必要!
多讀書、多看報,少看網頁,多睡覺!