前言
很多時(shí)候數(shù)據(jù)庫(kù)的TempDB、日志等文件的暴增可能導(dǎo)致磁盤(pán)空間被占滿(mǎn),如果日常配置不到位,往往會(huì)導(dǎo)致數(shù)據(jù)庫(kù)故障,業(yè)務(wù)被迫中斷。
這種文件暴增很難排查,經(jīng)驗(yàn)不足的一些運(yùn)維人員可能更是無(wú)法排查具體原因,導(dǎo)致問(wèn)題不能徹底解決。
場(chǎng)景描述
客戶(hù)系統(tǒng)比較穩(wěn)定,用了5臺(tái)機(jī)器做了AlwaysOn高可用組,完全實(shí)現(xiàn)了讀寫(xiě)分離。磁盤(pán)也做了規(guī)劃,主庫(kù)日常操作TempDB需求在20G以下,所以TempDB所在的磁盤(pán)只配置了100個(gè)G的空間。
本案例是客戶(hù)突然接到監(jiān)控報(bào)警,顯示TempDB磁盤(pán)空間不足,可用空間不斷減小直到耗盡。
比較戲劇的是,這個(gè)客戶(hù)早上剛剛做了巡檢數(shù)據(jù)庫(kù)情況穩(wěn)定,沒(méi)有什么異常。
那么我初步判定,這必然是一次特殊操作或應(yīng)用配置出錯(cuò)導(dǎo)致的問(wèn)題。