當(dāng)數(shù)據(jù)時(shí)效性要求很高時(shí),需要保證緩存中的數(shù)據(jù)與數(shù)據(jù)庫(kù)中的保持一致,而且需要保證緩存節(jié)點(diǎn)和副本中的數(shù)據(jù)也保持一致,不能出現(xiàn)差異現(xiàn)象。這就比較依賴緩存的過(guò)期和更新策略。一般會(huì)在數(shù)據(jù)發(fā)生更改的時(shí),主動(dòng)更新緩存中的數(shù)據(jù)或者移除對(duì)應(yīng)的緩存。
 
緩存并發(fā)問題
緩存過(guò)期后將嘗試從后端數(shù)據(jù)庫(kù)獲取數(shù)據(jù),這是一個(gè)看似合理的流程。但是,在高并發(fā)場(chǎng)景下,有可能多個(gè)請(qǐng)求并發(fā)的去從數(shù)據(jù)庫(kù)獲取數(shù)據(jù),對(duì)后端數(shù)據(jù)庫(kù)造成極大的沖擊,甚至導(dǎo)致 “雪崩”現(xiàn)象。此外,當(dāng)某個(gè)緩存key在被更新時(shí),同時(shí)也可能被大量請(qǐng)求在獲取,這也會(huì)導(dǎo)致一致性的問題。那如何避免類似問題呢?我們會(huì)想到類似“鎖”的機(jī)制,在緩存更新或者過(guò)期的情況下,先嘗試獲取到鎖,當(dāng)更新或者從數(shù)據(jù)庫(kù)獲取完成后再釋放鎖,其他的請(qǐng)求只需要犧牲一定的等待時(shí)間,即可直接從緩存中繼續(xù)獲取數(shù)據(jù)。
 
緩存穿透問題
緩存穿透在有些地方也稱為“擊穿”。很多朋友對(duì)緩存穿透的理解是:由于緩存故障或者緩存過(guò)期導(dǎo)致大量請(qǐng)求穿透到后端數(shù)據(jù)庫(kù)服務(wù)器,從而對(duì)數(shù)據(jù)庫(kù)造成巨大沖擊。
這其實(shí)是一種誤解。真正的緩存穿透應(yīng)該是這樣的:
在高并發(fā)場(chǎng)景下,如果某一個(gè)key被高并發(fā)訪問,沒有被命中,出于對(duì)容錯(cuò)性考慮,會(huì)嘗試去從后端數(shù)據(jù)庫(kù)中獲取,從而導(dǎo)致了大量請(qǐng)求達(dá)到數(shù)據(jù)庫(kù),而當(dāng)該key對(duì)應(yīng)的數(shù)據(jù)本身就是空的情況下,這就導(dǎo)致數(shù)據(jù)庫(kù)中并發(fā)的去執(zhí)行了很多不必要的查詢操作,從而導(dǎo)致巨大沖擊和壓力。
可以通過(guò)下面的幾種常用方式來(lái)避免緩存?zhèn)鹘y(tǒng)問題:
緩存空對(duì)象
對(duì)查詢結(jié)果為空的對(duì)象也進(jìn)行緩存,如果是集合,可以緩存一個(gè)空的集合(非null),如果是緩存單個(gè)對(duì)象,可以通過(guò)字段標(biāo)識(shí)來(lái)區(qū)分。這樣避免請(qǐng)求穿透到后端數(shù)據(jù)庫(kù)。同時(shí),也需要保證緩存數(shù)據(jù)的時(shí)效性。這種方式實(shí)現(xiàn)起來(lái)成本較低,比較適合命中不高,但可能被頻繁更新的數(shù)據(jù)。
單獨(dú)過(guò)濾處理
對(duì)所有可能對(duì)應(yīng)數(shù)據(jù)為空的key進(jìn)行統(tǒng)一的存放,并在請(qǐng)求前做攔截,這樣避免請(qǐng)求穿透到后端數(shù)據(jù)庫(kù)。這種方式實(shí)現(xiàn)起來(lái)相對(duì)復(fù)雜,比較適合命中不高,但是更新不頻繁的數(shù)據(jù)。
 
緩存顛簸問題
緩存的顛簸問題,有些地方可能被成為“緩存抖動(dòng)”,可以看做是一種比“雪崩”更輕微的故障,但是也會(huì)在一段時(shí)間內(nèi)對(duì)系統(tǒng)造成沖擊和性能影響。一般是由于緩存節(jié)點(diǎn)故障導(dǎo)致。業(yè)內(nèi)推薦的做法是通過(guò)一致性Hash算法來(lái)解決。這里不做過(guò)多闡述,可以參照其他章節(jié)
 
緩存的雪崩現(xiàn)象
緩存雪崩就是指由于緩存的原因,導(dǎo)致大量請(qǐng)求到達(dá)后端數(shù)據(jù)庫(kù),從而導(dǎo)致數(shù)據(jù)庫(kù)崩潰,整個(gè)系統(tǒng)崩潰,發(fā)生災(zāi)難。導(dǎo)致這種現(xiàn)象的原因有很多種,上面提到的“緩存并發(fā)”,“緩存穿透”,“緩存顛簸”等問題,其實(shí)都可能會(huì)導(dǎo)致緩存雪崩現(xiàn)象發(fā)生。這些問題也可能會(huì)被惡意攻擊者所利用。還有一種情況,例如某個(gè)時(shí)間點(diǎn)內(nèi),系統(tǒng)預(yù)加載的緩存周期性集中失效了,也可能會(huì)導(dǎo)致雪崩。為了避免這種周期性失效,可以通過(guò)設(shè)置不同的過(guò)期時(shí)間,來(lái)錯(cuò)開緩存過(guò)期,從而避免緩存集中失效。
從應(yīng)用架構(gòu)角度,我們可以通過(guò)限流、降級(jí)、熔斷等手段來(lái)降低影響,也可以通過(guò)多級(jí)緩存來(lái)避免這種災(zāi)難。
此外,從整個(gè)研發(fā)體系流程的角度,應(yīng)該加強(qiáng)壓力測(cè)試,盡量模擬真實(shí)場(chǎng)景,盡早的暴露問題從而防范。
緩存無(wú)底洞現(xiàn)象
該問題由 facebook 的工作人員提出的, facebook 在 2010 年左右,memcached 節(jié)點(diǎn)就已經(jīng)達(dá)3000 個(gè),緩存數(shù)千 G 內(nèi)容。
他們發(fā)現(xiàn)了一個(gè)問題---memcached 連接頻率,效率下降了,于是加 memcached 節(jié)點(diǎn),
添加了后,發(fā)現(xiàn)因?yàn)檫B接頻率導(dǎo)致的問題,仍然存在,并沒有好轉(zhuǎn),稱之為”無(wú)底洞現(xiàn)象”。
 
目前主流的數(shù)據(jù)庫(kù)、緩存、Nosql、搜索中間件等技術(shù)棧中,都支持“分片”技術(shù),來(lái)滿足“高性能、高并發(fā)、高可用、可擴(kuò)展”等要求。有些是在client端通過(guò)Hash取模(或一致性Hash)將值映射到不同的實(shí)例上,有些是在client端通過(guò)范圍取值的方式映射的。當(dāng)然,也有些是在服務(wù)端進(jìn)行的。但是,每一次操作都可能需要和不同節(jié)點(diǎn)進(jìn)行網(wǎng)絡(luò)通信來(lái)完成,實(shí)例節(jié)點(diǎn)越多,則開銷會(huì)越大,對(duì)性能影響就越大。
 
主要可以從如下幾個(gè)方面避免和優(yōu)化:
數(shù)據(jù)分布方式
有些業(yè)務(wù)數(shù)據(jù)可能適合Hash分布,而有些業(yè)務(wù)適合采用范圍分布,這樣能夠從一定程度避免網(wǎng)絡(luò)IO的開銷。
IO優(yōu)化
可以充分利用連接池,NIO等技術(shù)來(lái)盡可能降低連接開銷,增強(qiáng)并發(fā)連接能力。
數(shù)據(jù)訪問方式
一次性獲取大的數(shù)據(jù)集,會(huì)比分多次去獲取小數(shù)據(jù)集的網(wǎng)絡(luò)IO開銷更小。
 
當(dāng)然,緩存無(wú)底洞現(xiàn)象并不常見。在絕大多數(shù)的公司里可能根本不會(huì)遇到。