雪崩效應(yīng)

現(xiàn)如今SOA、微服務(wù)風(fēng)愈演愈烈,越來(lái)越多的業(yè)務(wù)和資源被以服務(wù)的形式包裝和發(fā)布,服務(wù)間又可能會(huì)依賴其他各種服務(wù)。由此而來(lái)不可避免的會(huì)產(chǎn)生很多問題。

比如一個(gè)服務(wù),其依賴了另外30個(gè)服務(wù)。假設(shè)每個(gè)服務(wù)的可用率都有三個(gè)9(99.9%),那么我們計(jì)算一下:

99.99%^30 = 99.7%

現(xiàn)實(shí)很殘酷,這個(gè)服務(wù)的實(shí)際可用性只能是99.7%,也就是說(shuō)每個(gè)月這個(gè)服務(wù)都要好宕機(jī)8000+秒~~~

iOS培訓(xùn),Swift培訓(xùn),蘋果開發(fā)培訓(xùn),移動(dòng)開發(fā)培訓(xùn)
正常用戶請(qǐng)求時(shí),服務(wù)內(nèi)部依次請(qǐng)求A\P\H\I服務(wù),兵返回響應(yīng)結(jié)果。

iOS培訓(xùn),Swift培訓(xùn),蘋果開發(fā)培訓(xùn),移動(dòng)開發(fā)培訓(xùn)
非常不幸,我們的I服務(wù)出了某些問題,此時(shí)我們的用戶請(qǐng)求就被堵塞在I服務(wù)處。

iOS培訓(xùn),Swift培訓(xùn),蘋果開發(fā)培訓(xùn),移動(dòng)開發(fā)培訓(xùn)
更加悲劇的是,后續(xù)越來(lái)越多的請(qǐng)求都被堵塞在I服務(wù)處,而這些被堵塞的請(qǐng)求會(huì)占用線程、IO、網(wǎng)絡(luò)等系統(tǒng)資源,隨著資源被占用的越來(lái)越多,本來(lái)不存在的性能問題也會(huì)隨之而來(lái),造成系統(tǒng)中的其他服務(wù)出現(xiàn)問題,甚至導(dǎo)致系統(tǒng)奔潰。

這也就是我們常說(shuō)的雪崩效應(yīng)


服務(wù)容災(zāi)

為了避免出現(xiàn)服務(wù)的雪崩,我們需要對(duì)服務(wù)做容災(zāi)處理。

常規(guī)的服務(wù)容災(zāi)處理思路有:

  • 資源隔離

  • 超時(shí)設(shè)定

  • 服務(wù)降級(jí)

  • 服務(wù)限流

其中每種思路又可以有不同的解決方案。

比如資源隔離可以通過將不同的服務(wù)發(fā)布在獨(dú)立的docker容器或服務(wù)器中,這樣即使一個(gè)服務(wù)出現(xiàn)問題,也不會(huì)殃及池魚。

服務(wù)降級(jí)和服務(wù)限流可以通過前端nginx+lua來(lái)實(shí)現(xiàn),當(dāng)服務(wù)處理延遲或宕機(jī)時(shí),nginx可以直接返回固定的降級(jí)/失敗響應(yīng),已快速跳過問題服務(wù)。


Hystrix

Hystrix,是Netflix的一個(gè)開源熔斷器,通過Hystrix,我們可以很方便的實(shí)現(xiàn)資源隔離、限流、超時(shí)設(shè)計(jì)、服務(wù)降級(jí)等服務(wù)容災(zāi)措施,并且還提供了強(qiáng)大的監(jiān)控,可