這是一個建立於 的文章,其中的資訊可能已經有所發展或是發生改變。
【編者的話】這是採用微服務架構建立自己應用系列第三篇文章。第一篇介紹了微服務架構模式,和單體式模式進行了比較,並且討論了使用微服務架構的優缺點。第二篇描述了採用微服務架構應用用戶端之間如何採用API Gateway方式進行通訊。在這篇文章中,我們將討論系統服務之間如何通訊。
簡介
在單體式應用中,各個模組之間的調用是通過程式設計語言層級的方法或者函數來實現的。但是一個基於微服務的分布式應用是運行在多台機器上的。一般來說,每個服務執行個體都是一個進程。因此,如所示,服務之間的互動必須通過處理序間通訊(IPC)來實現。
後面我們將會詳細介紹IPC技術,現在我們先來看下設計相關的問題。
互動模式
當為某一個服務選擇IPC時,首先需要考慮服務之間如何互動。用戶端和伺服器之間有很多的互動模式,我們可以從兩個維度進行歸類。第一個維度是一對一還是一對多:
•
一對一:每個用戶端請求有一個服務執行個體來響應。
•
一對多:每個用戶端請求有多個服務執行個體來響應
第二個維度是這些互動式同步還是非同步:
• 同步模式:用戶端請求需要服務端即時響應,甚至可能由於等待而阻塞。
• 非同步模式:用戶端請求不會阻塞進程,服務端的響應可以是非即時的。
下表顯示了不同互動模式:
一對一的互動模式有以下幾種方式:
• 請求/響應:一個用戶端向伺服器端發起請求,等待響應。用戶端期望此響應即時到達。在一個基於線程的應用中,等待過程可能造成線程阻塞。
• 通知(也就是常說的單向請求):一個用戶端請求發送到服務端,但是並不期望服務端響應。
• 請求/非同步響應:用戶端發送請求到服務端,服務端非同步響應請求。用戶端不會阻塞,而且被設計成預設響應不會立刻到達。
一對多的互動模式有以下幾種方式:
• 發布/ 訂閱模式:用戶端發布通知訊息,被零個或者多個感興趣的服務消費。
• 發布/非同步響應模式:用戶端發布請求訊息,然後等待從感興趣服務發回的響應。
每個服務都是以上這些模式的組合,對某些服務,一個IPC機制就足夠了;而對另外一些服務則需要多種IPC機制組合。展示了在一個打車服務要求中服務之間是如何通訊的。
中的服務通訊使用了通知、請求/響應、發布/訂閱等方式。例如,乘客通過移動端給『行程管理服務』發送通知,希望申請一次出租服務。『行程管理服務』發送請求/響應訊息給『乘客服務』以確認乘客帳號是有效。緊接著建立此次行程,並用發布/訂閱互動模式通知其他服務,包括定位可用司機的調度服務。
現在我們瞭解了互動模式,接下來我們一起來看看如何定義API。
定義API
API是服務端和用戶端之間的契約。不管選擇了什麼樣的IPC機制,重要的是使用某種互動式定義語言(IDL)來精確定義一個服務的API。甚至有一些關於使用API first的方法(API-first approach)來定義服務的很好的理由。在開發之前,你需要先定義服務的介面,並與用戶端開發人員詳細討論確認。這樣的討論和設計會大幅度提到API的可用度以及滿意度。
在本文後半部分你將會看到,API定義實質上依賴於選擇哪種IPC。如果使用訊息機制,API則由訊息頻道(channel)和訊息類型構成;如果選擇使用HTTP機制,API則由URL和請求、響應格式構成。後面將會詳細描述IDL。
API的演化
服務端API會不斷變化。在一個單體式應用中經常會直接修改API,然後更新給所有的調用者。而在基於微服務架構應用中,這很困難,即使只有一個服務使用這個API,不可能強迫使用者跟服務端保持同步更新。另外,開發人員可能會嘗試性的部署新版本的服務,這個時候,新舊服務就會同事運行。你需要知道如何處理這些問題。
你如何處理API變化,這依賴於這些變化有多大。某些改變是微小的,並且可以和之前版本相容。比如,你可能只是為某個請求和響應添加了一個屬性。設計用戶端和服務端時候應該遵循健壯性原理,這很重要。用戶端使用舊版API應該也能和新版本一起工作。服務端仍然提供預設響應值,用戶端忽略此版本不需要的響應。使用IPC機制和訊息格式對於API演化很有協助。
但是有時候,API需要進行大規模的改動,並且可能與之前版本不相容。因為你不可能強制讓所有的用戶端立即升級,所以支援老版本用戶端的服務還需要再運行一段時間。如果你正在使用基於基於HTTP機制的IPC,例如REST,一種解決方案是把版本號碼嵌入到URL中。每個服務都可能同時處理多個版本的API。或者,你可以部署多個執行個體,每個執行個體負責處理一個版本的請求。
處理部分失敗
在上一篇關於API gateway的文章中,我們瞭解到分布式系統中部分失敗是普遍存在的問題。因為用戶端和服務端是都是獨立的進程,一個服務端有可能因為故障或者維護而停止服務,或者此服務因為過載停止或者反應很慢。
考慮這篇文章中描述的部分失敗的情境。假設建議服務無法響應請求,那用戶端就會由於等待響應而阻塞,這不僅會給客戶帶來很差的體驗,而且在很多應用中還會佔用很多資源,比如線程,以至於到最後由於等待響應被阻塞的用戶端越來越多,線程資源被耗費完了。如所示:
為了預防這種問題,設計服務時候必須要考慮部分失敗的問題。
Netfilix提供了一個比較好的解決方案,具體的應對措施包括:
• 網路逾時:當等待響應時,不要無限期的阻塞,而是採用逾時策略。使用逾時策略可以確保資源不會無限期的佔用。
• 限制請求的次數:可以為用戶端對某特定服務的請求設定一個訪問上限。如果請求已達上限,就要立刻終止請求服務。
• 斷路器模式(Circuit Breaker Pattern):記錄成功和失敗請求的數量。如果失效率超過一個閾值,觸發斷路器使得後續的請求立刻失敗。如果大量的請求失敗,就可能是這個服務不可用,再發請求也無意義。在一個失效期後,用戶端可以再試,如果成功,關閉此斷路器。
• 提供復原:當一個請求失敗後可以進行復原邏輯。例如,返回快取資料或者一個系統預設值。
Netflix Hystrix是一個實現相關模式的開源庫。如果使用JVM,推薦考慮使用Hystrix。而如果使用非JVM環境,你可以使用類似功能的庫。
IPC技術
現在有很多不同的IPC技術。服務之間的通訊可以使用同步的請求/響應模式,比如基於HTTP的REST或者Thrift。另外,也可以選擇非同步、基於訊息的通訊模式,比如AMQP或者STOMP。除以之外,還有其它的訊息格式供選擇,比如JSON和XML,它們都是可讀的,基於文本的訊息格式。當然,也還有二進位格式(效率更高)的,比如Avro和Protocol Buffer。接下來我們將會討論非同步IPC模式和同步的IPC模式,首先來看非同步。
非同步,基於訊息通訊
當使用基於非同步交換訊息的進程通訊方式時,一個用戶端通過向服務端發送訊息提交請求。如果服務端需要回複,則會發送另外一個獨立的訊息給用戶端。因為通訊是非同步,用戶端不會因為等待而阻塞,相反,用戶端理所當然的認為響應不會立刻接收到。
一個訊息由頭部(中繼資料例如發送方)和訊息體構成。訊息通過channel發送,任何數量的生產者都可以發送訊息到channel,同樣的,任何數量的消費者都可以從渠道中接受資料。有兩類channel,
點對點和
發布/訂閱。點對點channel會把訊息準確的發送到某個從channel讀取訊息的消費者,服務端使用點對點來實現之前提到的一對一互動模式;而發布/訂閱則把訊息投送到所有從channel讀取資料的消費者,服務端使用發布/訂閱channel來實現上面提到的一對多互動模式。
展示了打車軟體如何使用發布/訂閱:
行程管理服務在發布-訂閱channel內建立一個行程訊息,並通知調度服務有一個新的行程請求,調度服務發現一個可用的司機然後向發布-訂閱channel寫入司機建議訊息(Driver Proposed message)來通知其他服務。
有很多訊息系統可以選擇,最好選擇一種支援多程式設計語言的。一些訊息系統支援標準協議,例如AMQP和STOMP。其他訊息系統則使用專屬的協議,有大量開源訊息系統可選,比如RabbitMQ、Apache Kafka、Apache ActiveMQ和NSQ。它們都支援某種形式的訊息和channel,並且都是可靠的、高效能和可擴充的;然而,它們的訊息模型完全不同。
使用訊息機制有很多優點:
•
解耦用戶端和服務端:用戶端只需要將訊息發送到正確的channel。用戶端完全不需要瞭解具體的服務執行個體,更不需要一個發現機制來確定服務執行個體的位置。
•
Message Buffering:在一個同步請求/響應協議中,例如HTTP,所有的用戶端和服務端必須在互動期間保持可用。而在訊息模式中,訊息broker將所有寫入channel的訊息按照隊列方式管理,直到被消費者處理。也就是說,線上商店可以接受客戶訂單,即使下單系統很慢或者不可用,只要保持下單訊息進入隊列就好了。
• 彈性用戶端-服務端互動:訊息機制支援以上說的所有互動模式。
•
直接處理序間通訊:基於RPC機制,試圖喚醒遠程服務看起來跟喚醒本地服務一樣。然而,因為物理定律和部分失敗可能性,他們實際上非常不同。訊息使得這些不同非常明確,開發人員不會出現問題。
然而,訊息機制也有自己的缺點:
•
額外的操作複雜性:訊息系統需要單獨安裝、配置和部署。訊息broker(代理)必須高可用,否則系統可靠性將會受到影響。
•
實現基於請求/響應互動模式的複雜性:請求/響應互動模式需要完成額外的工作。每個請求訊息必須包含一個回複渠道ID和相關ID。服務端發送一個包含相關ID的響應訊息到channel中,使用相關ID來將響應對應到發出請求的用戶端。也許這個時候,使用一個直接支援要求/響應的IPC機制會更容易些。
現在我們已經瞭解了基於訊息的IPC,接下來我們來看看基於請求/響應模式的IPC。
同步的,基於請求/響應的IPC
當使用一個同步的,基於請求/響應的IPC機制,用戶端向服務端發送一個請求,服務端處理請求,返迴響應。一些用戶端會由於等待服務端響應而被阻塞,而另外一些用戶端也可能使用非同步、基於事件驅動的用戶端代碼(Future或者Rx Observable的封裝)。然而,不像使用訊息機制,用戶端需要響應及時返回。這個模式中有很多可選的協議,但最常見的兩個協議是REST和Thrift。首先我們來看下REST。
REST
現在很流行使用RESTful風格的API。REST是基於HTTP協議的。另外,一個需要理解的比較重要的概念是,REST是一個資源,一般代表一個業務對象,比如一個客戶或者一個產品,或者一組商業對象。REST使用HTTP文法協議來修改資源,一般通過URL來實現。舉個例子,GET請求返回一個資源的簡單資訊,響應格式通常是XML或者JSON對象格式。POST請求會建立一個新資源,PUT請求更新一個資源。這裡引用下REST之父Roy Fielding說的:
當需要一個整體的、重視模組互動可擴充性、介面概括性、組件部署獨立性和減小延遲、提供安全性和封裝性的系統時,REST可以提供這樣一組滿足需求的架構。
展示了打車軟體是如何使用REST的。
乘客通過移動端向行程管理服務的
/trips資源提交了一個POST請求。行程管理服務收到請求之後,會發送一個GET請求到乘客管理服務以擷取乘客資訊。當確認乘客資訊之後,緊接著會建立一個行程,並向移動端返回201(譯者註:狀態代碼)響應。
很多開發人員都表示他們基於HTTP的API是RESTful的。但是,如同Fielding在他的部落格中所說,這些API可能並不都是RESTful的。Leonard Richardson為REST定義了一個成熟度等級模型,具體包含以下4個層次(摘自IBM):
- 第一個層次(Level 0)的 Web 服務只是使用 HTTP 作為傳輸方式,實際上只是遠程方法調用(RPC)的一種具體形式。SOAP 和 XML-RPC 都屬於此類。
- 第二個層次(Level 1)的 Web 服務引入了資源的概念。每個資源有對應的標識符和表達。
- 第三個層次(Level 2)的 Web 服務使用不同的 HTTP 方法來進行不同的操作,並且使用 HTTP 狀態代碼來表示不同的結果。如 HTTP GET 方法來擷取資源,HTTP DELETE 方法來刪除資源。
- 第四個層次(Level 3)的 Web 服務使用 HATEOAS。在資源的表達中包含了連結資訊。用戶端可以根據連結來發現可以執行的動作。
使用基於HTTP的協議有如下好處:
• HTTP非常簡單並且大家都很熟悉。
• 可以使用瀏覽器延伸(比如Postman)或者curl之類的命令列來測試API。
• 內建支援要求/響應模式的通訊。
• HTTP對防火牆友好的。
• 不需要中間代理,簡化了系統架構。
不足之處包括:
• 只支援要求/響應模式互動。可以使用HTTP通知,但是服務端必須一直發送HTTP響應才行。
• 因為用戶端和服務端直接通訊(沒有代理或者buffer機制),在互動期間必須都線上。
• 用戶端必須知道每個服務執行個體的URL。如之前那篇關於API Gateway的文章所述,這也是個煩人的問題。用戶端必須使用服務執行個體發現機制。
開發人員社區最近重新發現了RESTful API介面定義語言的價值。於是就有了一些RESTful風格的服務架構,包括RAML和Swagger。一些IDL,例如Swagger允許定義請求和響應訊息的格式。其它的,例如RAML,需要使用另外的標識,例如JSON Schema。對於描述API,IDL一般都有工具來定義用戶端和服務端骨架介面。
Thrift
Apache Thrift是一個很有趣的REST的替代品。它是Facebook實現的一種高效的、支援多種程式設計語言的遠程服務調用的架構。Thrift提供了一個C風格的IDL定義API。使用Thrift編譯器可以產生用戶端和伺服器端代碼架構。編譯器可以產生多種語言的代碼,包括C++、Java、Python、PHP、Ruby, Erlang和Node.js。
Thrift介面包括一個或者多個服務。服務定義類似於一個JAVA介面,是一組方法。Thrift方法可以返迴響應,也可以被定義為單向的。傳回值的方法其實就是請求/響應類型互動模式的實現。用戶端等待響應,並可能拋出異常。單向方法對應於通知類型的互動模式,服務端並不返迴響應。
Thrift支援多種訊息格式:JSON、二進位和壓縮二進位。二進位比JSON更高效,因為二進位解碼更快。同樣原因,壓縮二進位格式可以提供更進階別的壓縮效率。JSON,是易讀的。Thrift也可以在裸TCP和HTTP中間選擇,裸TCP看起來比HTTP更加有效。然而,HTTP對防火牆,瀏覽器和人來說更加友好。
訊息格式
瞭解完HTTP和Thrift後,我們來看下訊息格式方面的問題。如果使用訊息系統或者REST,就可以選擇訊息格式。其它的IPC機制,例如Thrift可能只支援部分訊息格式,也許只有一種。無論哪種方式,我們必須使用一個跨語言的訊息格式,這非常重要。因為指不定哪天你會使用其它語言。
有兩類訊息格式:文本和二進位。文字格式設定的例子包括JSON和XML。這種格式的優點在於不僅可讀,而且是自描述的。在JSON中,一個對象就是一組索引值對。類似的,在XML中,屬性是由名字和值構成。消費者可以從中選擇感興趣的元素而忽略其它部分。同時,小幅度的格式修改可以很容器向後相容。
XML文檔結構是由XML schema定義的。隨著時間發展,開發人員社區意識到JSON也需要一個類似的機制。一個選擇是使用JSON Schema,要麼是獨立的,要麼是例如Swagger的IDL。
基於文本的訊息格式最大的缺點是訊息會變得冗長,特別是XML。因為訊息是自描述的,所以每個訊息都包含屬性和值。另外一個缺點是解析文本的負擔過大。所以,你可能需要考慮使用二進位格式。
二進位的格式也有很多。如果使用的是Thrift RPC,那可以使用二進位Thrift。如果選擇訊息格式,常用的還包括Protocol Buffers和Apache Avro。它們都提供典型的IDL來定義訊息架構。一個不同點在於Protocol Buffers使用的是加標記(tag)的欄位,而Avro消費者需要知道模式(schema)來解析訊息。因此,使用前者,API更容易演化。這篇部落格很好的比較了Thrift、Protocol Buffers、Avro三者的區別。
總結
微服務必須使用處理序間通訊機制來互動。當設計服務的通訊模式時,你需要考慮幾個問題:服務如何互動,每個服務如何標識API,如何升級API,以及如何處理部分失敗。微服務架構有兩類IPC機制可選,非同步訊息機制和同步請求/響應機制。在下一篇文章中,我們將會討論微服務架構中的服務發現問題。
原文連結:Building Microservices: Inter-Process Communication in a Microservices Architecture(翻譯:楊峰 校對:李穎傑)