前言
很多時候數(shù)據(jù)庫的TempDB、日志等文件的暴增可能導(dǎo)致磁盤空間被占滿,如果日常配置不到位,往往會導(dǎo)致數(shù)據(jù)庫故障,業(yè)務(wù)被迫中斷。
這種文件暴增很難排查,經(jīng)驗不足的一些運維人員可能更是無法排查具體原因,導(dǎo)致問題不能徹底解決。
場景描述
客戶系統(tǒng)比較穩(wěn)定,用了5臺機器做了AlwaysOn高可用組,完全實現(xiàn)了讀寫分離。磁盤也做了規(guī)劃,主庫日常操作TempDB需求在20G以下,所以TempDB所在的磁盤只配置了100個G的空間。
本案例是客戶突然接到監(jiān)控報警,顯示TempDB磁盤空間不足,可用空間不斷減小直到耗盡。
比較戲劇的是,這個客戶早上剛剛做了巡檢數(shù)據(jù)庫情況穩(wěn)定,沒有什么異常。
那么我初步判定,這必然是一次特殊操作或應(yīng)用配置出錯導(dǎo)致的問題。