因為這世界上還有一個工種叫運維。
服務(wù)器是非常容易壞的。雖然單體損壞的可能性非常低,這是由服務(wù)器的冗余性設(shè)計來保障的。但是當成百上千的基數(shù)乘以這個概率的時候.....就天天忙到死了。
我?guī)兔S護過一個30多臺的小機房。企業(yè)內(nèi)部自用,條件很一般。
破空調(diào)壞了,萬幸是冬天,直接開窗進冷風(fēng)。平時保持在27度的服務(wù)器降到21左右。壯哉我大東北。
每次設(shè)備清灰都覺得自己會得塵肺阿....黑色非常細的靜電灰。
每次設(shè)備維護和調(diào)整都要選盡量晚阿。我們即使企業(yè)內(nèi)部自用的。也得等公司所有人下班了才能開始操作,而且遇到加班的要繼續(xù)等。
所有操作前第一個想法是備份備份備份。我錯刪過VP兩個虛擬機我說什么了。。帶我的組長獨自恢復(fù)一陣列硬盤100+個虛擬機的數(shù)據(jù)說什么了.....
向不明真相的小伙伴解釋為啥服務(wù)器會壞?還是想辦法做熱備份更容易吧。
也別嘲笑我待的環(huán)境差我們技術(shù)差。每一個運維都在努力讓自己的設(shè)備達到各種6個9乃至9個9的可靠性。只能說我們盡力了。
服務(wù)器在設(shè)計的時候做了大量的備份冗余,在使用的時候運維在不停排除故障。在軟件層面大家一起努力設(shè)計了hadoop,hdfs,lvs等等一系列的維護系統(tǒng)和災(zāi)后修復(fù)策略。
這一切最終在用戶看起來就是“服務(wù)器為什么不會壞”,因為我們100%確定服務(wù)器一定會在不久的將來壞掉。
?