需求背景
目前node端的服務(wù)逐漸成熟,在不少公司內(nèi)部也開始承擔(dān)業(yè)務(wù)處理或者視圖渲染工作。不同于個(gè)人開發(fā)的簡(jiǎn)單服務(wù)器,企業(yè)級(jí)的node服務(wù)要求更為苛刻:
高穩(wěn)定性、高可靠性、魯棒性以及直觀的監(jiān)控和報(bào)警
想象下一個(gè)存在安全隱患且沒有監(jiān)控預(yù)警系統(tǒng)的node服務(wù)在生產(chǎn)環(huán)境下運(yùn)行的場(chǎng)景,當(dāng)某個(gè)node實(shí)例掛掉的情況下,運(yùn)維人員或者對(duì)應(yīng)開發(fā)維護(hù)人員無(wú)法立即知曉,直到客戶或者測(cè)試人員報(bào)告bugs才開始解決問題。在這段無(wú)人處理的時(shí)間內(nèi),損失的訂單數(shù)和用戶的忠誠(chéng)度和信任度將是以后無(wú)法彌補(bǔ)的,因此對(duì)于node程序的業(yè)務(wù)開發(fā)者而言,這就要求代碼嚴(yán)謹(jǐn)、異常處理完備;對(duì)于node框架的維護(hù)者而言,則需要提供完善的監(jiān)控預(yù)警系統(tǒng)。
功能
當(dāng)一個(gè)服務(wù)進(jìn)程在后端運(yùn)行時(shí)(daemon),作為開發(fā)者我們關(guān)注的信息主要有以下幾點(diǎn):
服務(wù)進(jìn)程是否正在運(yùn)行,isalive
服務(wù)進(jìn)程的內(nèi)存使用率,是否存在未回收(釋放)的內(nèi)存
服務(wù)進(jìn)程的cpu使用率,在計(jì)算量大的情況下是否需要分片處理、延時(shí)處理
服務(wù)進(jìn)程的實(shí)時(shí)響應(yīng)時(shí)間和吞吐量
而作為一個(gè)運(yùn)維人員,關(guān)注的不僅僅是node服務(wù)進(jìn)程的相關(guān)信息,還包括物理主機(jī)的使用狀況:
物理硬盤所剩存儲(chǔ)空間
內(nèi)存、cpu使用率
網(wǎng)絡(luò)接入是否正常
可以看出,不管是針對(duì)主機(jī)還是進(jìn)程進(jìn)行監(jiān)控,我們的關(guān)注點(diǎn)大多數(shù)是資源使用率和業(yè)務(wù)量處理能力,因此我們的監(jiān)控預(yù)警系統(tǒng)也著重實(shí)現(xiàn)這些功能。
系統(tǒng)簡(jiǎn)易架構(gòu)
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動(dòng)安全 [無(wú)線安全]玩轉(zhuǎn)無(wú)線電——不安全的藍(lán)牙鎖 2017-07-26
- 消息隊(duì)列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標(biāo)分割】 2017-07-26
- 詞向量-LRWE模型-更好地識(shí)別反義詞同義詞 2017-07-26
- 從棧不平衡問題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實(shí)現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26
- 阿里移動(dòng)安全 Android端惡意鎖屏勒索應(yīng)用分析 2017-07-26
- 集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來看看(二) 2017-07-26