熱搜關(guān)鍵詞: 動(dòng)環(huán)監(jiān)控 , 機(jī)房動(dòng)環(huán) , 機(jī)房監(jiān)控 ,
數(shù)據(jù)中心機(jī)房監(jiān)控體系主要是對(duì)機(jī)房?jī)?nèi)設(shè)備和環(huán)境進(jìn)行集中監(jiān)控和管理,經(jīng)過采集機(jī)房運(yùn)行中的各種數(shù)據(jù)參數(shù),來判斷是否出現(xiàn)異常,對(duì)數(shù)據(jù)中心機(jī)房具有重要意義。機(jī)房監(jiān)控體系包含多個(gè)方面,而不只是簡(jiǎn)單的視頻監(jiān)控,理論上,機(jī)房任何區(qū)域都有出現(xiàn)問題的可能,監(jiān)控體系的覆蓋性一定程度上決議機(jī)房運(yùn)行的穩(wěn)定性。下面就來詳細(xì)介紹一下數(shù)據(jù)中心機(jī)房的三大監(jiān)控體系,以及它們各自具有的功能。
(一)數(shù)據(jù)中心機(jī)房之“設(shè)備監(jiān)控體系”
數(shù)據(jù)中心機(jī)房里的設(shè)備不計(jì)其數(shù),對(duì)這些設(shè)備的運(yùn)行狀況進(jìn)行監(jiān)控非常必要,比如服務(wù)器運(yùn)行的CPU內(nèi)存參數(shù),網(wǎng)絡(luò)設(shè)備的端口流量,業(yè)務(wù)層面的監(jiān)控等等,設(shè)備層面的監(jiān)控就更為雜亂了,需要對(duì)設(shè)備的各種運(yùn)行參數(shù)比較清楚,因此一般設(shè)備的監(jiān)控體系都采用設(shè)備廠家提供的監(jiān)控軟件或許規(guī)范的第三方軟件來進(jìn)行管理。
(1)經(jīng)過這些監(jiān)控軟件,7*24小時(shí)對(duì)設(shè)備運(yùn)行的各種參數(shù)進(jìn)行監(jiān)控,一旦發(fā)現(xiàn)有異常就發(fā)出告警。
(2)告警的方式也比較多,能夠打印到日志主機(jī)上,能夠經(jīng)過短信發(fā)送到運(yùn)維人員的手機(jī)上,也能夠經(jīng)過軟件體系自行嘗試修復(fù)。
(3)監(jiān)控的軟件做的是否完善將決議故障出現(xiàn)時(shí),能否給出告警,所以觸及設(shè)備的監(jiān)控往往是在不斷完善的進(jìn)程,許多監(jiān)控參數(shù)都是經(jīng)驗(yàn)之道,甚至是前史的經(jīng)驗(yàn),只要經(jīng)過不斷地改進(jìn)、優(yōu)化,才能將發(fā)生的風(fēng)險(xiǎn)及時(shí)發(fā)現(xiàn),當(dāng)然要做到所有的故障都可能提前預(yù)知、發(fā)現(xiàn),是非常困難的。
(4)有時(shí)的故障可能無任何預(yù)兆,尤其是硬件故障,會(huì)突然出現(xiàn),而往往監(jiān)控體系是無法監(jiān)測(cè)到硬件級(jí)別的、元器件的故障。
(二)數(shù)據(jù)中心機(jī)房之“視頻監(jiān)控體系”
和其它的商務(wù)建筑一樣,數(shù)據(jù)中心機(jī)房也需要部署視頻監(jiān)控體系。視頻監(jiān)控主要是對(duì)進(jìn)出數(shù)據(jù)中心機(jī)房的人員進(jìn)行監(jiān)控,在數(shù)據(jù)中心機(jī)房的出入口要部署攝像頭,在數(shù)據(jù)中心機(jī)房?jī)?nèi)部樓道,重要的機(jī)房入口都要部署。
在有的非常重要業(yè)務(wù)的機(jī)房?jī)?nèi),有時(shí)也要部署攝像頭,以便防止一些人員的惡意操作或許誤操作,發(fā)現(xiàn)這些異常時(shí)及時(shí)制止,以防止給數(shù)據(jù)中心機(jī)房業(yè)務(wù)帶來影響。數(shù)據(jù)中心機(jī)房里的許多設(shè)備、儀器都是非常貴重的,因?yàn)槿藶榈脑驅(qū)е聯(lián)p壞的狀況是非常多見的,還有便是防止一些偷盜行為。比如數(shù)據(jù)中心機(jī)房里的光模塊,一個(gè)光模塊,尤其是40G/100G光模塊,一個(gè)都要數(shù)千元,順手拿出去幾個(gè),轉(zhuǎn)手能夠獲利上萬元。
有了視頻監(jiān)控體系,就能最大限度地防止這些行為出現(xiàn),或許在出現(xiàn)后能夠經(jīng)過這些監(jiān)控錄像進(jìn)行分析、追責(zé),這些視頻錄像是重要的證據(jù),所以視頻監(jiān)控體系是數(shù)據(jù)中心機(jī)房不可缺少的一部分,有的數(shù)據(jù)中心機(jī)房除了視頻的監(jiān)控,還要在數(shù)據(jù)中心機(jī)房出入做好人員訪問掛號(hào)作業(yè),對(duì)外來人員進(jìn)行管理,防止放入一些惡意分子。
(三)數(shù)據(jù)中心機(jī)房之“煙霧溫濕監(jiān)控體系”
數(shù)據(jù)中心機(jī)房一樣怕火,一旦發(fā)生火災(zāi)對(duì)于數(shù)據(jù)中心機(jī)房來說便是毀滅性的打擊。以往也出現(xiàn)過一些慘痛的經(jīng)驗(yàn),所以對(duì)于放火,數(shù)據(jù)中心機(jī)房且不可大意。數(shù)據(jù)中心機(jī)房和其它的建筑不同,內(nèi)部有太多的電子設(shè)備,并不適用于噴淋體系,只能采用干粉救活或許惰性氣體救活。
當(dāng)機(jī)房?jī)?nèi)的煙霧濃度超過了報(bào)警器設(shè)定的門限,即觸發(fā)監(jiān)控體系,及時(shí)將火滅除,除了煙霧,機(jī)房?jī)?nèi)的溫度和濕度也是需要監(jiān)控的重要部署。數(shù)據(jù)中心機(jī)房?jī)?nèi)部要盡量保持恒溫恒濕,但實(shí)際上在數(shù)據(jù)中心機(jī)房?jī)?nèi)部會(huì)有局部的溫度死角,長(zhǎng)期以往會(huì)大大下降電子設(shè)備的使用壽命,經(jīng)過在數(shù)據(jù)中心機(jī)房?jī)?nèi)多個(gè)區(qū)域部署溫濕度傳感器,建立起溫濕度的監(jiān)控網(wǎng)絡(luò),就能夠及時(shí)地發(fā)現(xiàn)局部區(qū)域過溫過濕的狀況,在一些空氣污染較為嚴(yán)重的地方,還能夠部署空氣清潔度監(jiān)測(cè)的設(shè)備,數(shù)據(jù)中心機(jī)房設(shè)備運(yùn)行在污染嚴(yán)重的環(huán)境里,容易造成靜電、電容擊穿器件等故障,為何我們要求數(shù)據(jù)中心機(jī)房設(shè)備要周期性地進(jìn)行除塵便是這個(gè)道理,本身灰塵中就含有不少的污染物。
數(shù)據(jù)中心機(jī)房在高速的發(fā)展,各種新技術(shù)層出不窮,也讓數(shù)據(jù)中心機(jī)房運(yùn)行變得愈加雜亂,這給監(jiān)控體系也帶來了不小的挑戰(zhàn),如何經(jīng)過監(jiān)控體系及時(shí)發(fā)現(xiàn)運(yùn)行風(fēng)險(xiǎn),是監(jiān)控體系關(guān)心的永久話題。
雖然數(shù)據(jù)中心機(jī)房有各種各樣的監(jiān)控體系,但是能夠確定的是監(jiān)控體系無法提前發(fā)現(xiàn)所有的故障,尤其是設(shè)備級(jí)別的故障,但是經(jīng)過完善的監(jiān)控體系的確能夠大大防止許多故障。就算監(jiān)控體系沒有在發(fā)生故障時(shí),給出告警,但是在事后故障分析中,監(jiān)控體系的各種技術(shù)參數(shù)和記錄依然是可供分析的重要資料,經(jīng)過對(duì)這些監(jiān)控記錄很可能能夠找出故障的原因。 監(jiān)控體系的作用便是將前史經(jīng)驗(yàn)、經(jīng)驗(yàn)轉(zhuǎn)化為一些數(shù)據(jù)參數(shù),然后采集數(shù)據(jù)中心機(jī)房里的各種數(shù)據(jù)信息進(jìn)行對(duì)比,假如發(fā)現(xiàn)異常,就及時(shí)給出告警。數(shù)據(jù)越豐富,監(jiān)控體系的功能就越強(qiáng)大。
總結(jié):
不要以為一個(gè)數(shù)據(jù)中心機(jī)房不是部署了監(jiān)控體系就能夠高枕無憂了,任何的體系都有漏洞,何況是監(jiān)控體系,所以數(shù)據(jù)中心機(jī)房運(yùn)維人員還要在日常的作業(yè)中,多檢查,多分析,及時(shí)發(fā)現(xiàn)隱患,假如監(jiān)控體系未能發(fā)現(xiàn),那么想辦法將這些隱患的判斷加到監(jiān)控體系中,使監(jiān)控體系越來越完善,決不能允許相同的錯(cuò)誤,連續(xù)犯兩次。
關(guān)注我們