隨承載用戶數(shù)量的增加和容災(zāi)的需要,越來越多互聯(lián)網(wǎng)后臺(tái)系統(tǒng)從單機(jī)模式切換到分布式集群?;仡欁约寒厴I(yè)五年來的工作內(nèi)容,同樣有這樣的轉(zhuǎn)變。
畢業(yè)頭兩年負(fù)責(zé)維護(hù)運(yùn)行在刀片機(jī)上的業(yè)務(wù),在機(jī)房里拔插單板的日子是我逝去的青春。設(shè)備之間通過VCS組成冷備,但即使有雙機(jī)軟件保護(hù),宕機(jī)、網(wǎng)絡(luò)丟包等問題發(fā)生時(shí)業(yè)務(wù)仍會(huì)受影響。這樣的系統(tǒng)架構(gòu)下為保證SLA,有時(shí)候需要深入Linux系統(tǒng)內(nèi)核或硬件層面分析機(jī)器重啟的原因。
接下來負(fù)責(zé)維護(hù)承載在分布式集群上的業(yè)務(wù),相比前面的工作,這個(gè)階段主要關(guān)注點(diǎn)不是單節(jié)點(diǎn)的異常,更多是系統(tǒng)整體的穩(wěn)定和健壯。面對紛繁復(fù)雜的系統(tǒng),剛開始的時(shí)候有這樣的感覺:
龐大復(fù)雜的分布式系統(tǒng)前,應(yīng)該從哪方面入手提升對其的認(rèn)識和理解、提升專業(yè)性?網(wǎng)上可以找到很多分布式系統(tǒng)相關(guān)的論文和資料,但歸納起來要表達(dá)的主要意思是什么?
結(jié)合自己這幾年的工作經(jīng)驗(yàn),總結(jié)分布式系統(tǒng)的核心就是解決一個(gè)問題:不同節(jié)點(diǎn)間如何達(dá)成共識。
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動(dòng)安全 [無線安全]玩轉(zhuǎn)無線電——不安全的藍(lán)牙鎖 2017-07-26
- 消息隊(duì)列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標(biāo)分割】 2017-07-26
- 詞向量-LRWE模型-更好地識別反義詞同義詞 2017-07-26
- 從棧不平衡問題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實(shí)現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26
- 阿里移動(dòng)安全 Android端惡意鎖屏勒索應(yīng)用分析 2017-07-26
- 集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來看看(二) 2017-07-26