數(shù)據(jù)中心如何建設,數(shù)據(jù)中心機房維護方法詳解
為了避免產(chǎn)生昂貴的成本,并充分利用電力系統(tǒng),使數(shù)據(jù)中心具有大小合適的電源和空間,采用模塊化策略是明智的,可以降低成本,而不必犧牲未來擴展的靈活性。
b.運維參與前期規(guī)劃設計,可將運維階段的需求在規(guī)劃設計中得到充分考慮; c.運維參與前期規(guī)劃設計,可充分了解和掌握所維護系統(tǒng)的結構、可靠性薄弱環(huán)節(jié)、遺留問題、潛在風險,有助于提高運維質量、有根據(jù)地制定運維計劃和切實可行的改造計劃。
b.應避免出于傾向、喜好或利益驅動。在規(guī)劃設計階段部分設備廠商可能會通過夸大設備性能、混淆概念等手段影響規(guī)劃設計人員的方案制定和設備選型。
例如,如果正在為托管目的建設數(shù)據(jù)中心,可能有配備交流(UPS)供電系統(tǒng)的需求,而如果是要成為一個電信設施,這可能需要部署直流電源系統(tǒng)。知道這些,就會知道所需要的直流電源或UPS電源系統(tǒng)的大小和規(guī)模。 在部署備份電池時,最好根據(jù)15分鐘備用放電時間進行配置。這樣部署備用電池,不會顯著增加資本支出,雖然這將很難自圓其說,但這更符合成本效益。企業(yè)需要提高備用發(fā)電機組的冗余度,而不是在增加電池數(shù)量浪費更多的資金。
a.先建樓體結構,后規(guī)劃數(shù)據(jù)中心,為數(shù)據(jù)中心規(guī)劃設計帶來難以克服的困難; b.機房建設和設備安裝完畢即開始改造的現(xiàn)象普遍存在; c.先確定設備,再確定方案,由于所購設備功能不滿足方案要求,或場地不滿足安裝條件要求,因而設備尚未運行就要更換; d.建設結構很難滿足數(shù)據(jù)中心場地布局要求,使機房分區(qū)規(guī)劃不合理;空調室外機無法安裝或距離太遠;動力室與主機房距離太遠,增加傳輸和管理困難,增加成本,降低可靠性。
系統(tǒng)三分建設、七分維護,任何設備都可能發(fā)生故障,可快速修復已經(jīng)成為提高可用性的關鍵指標。 忽視可維護性和可修復性的現(xiàn)象表現(xiàn)在: a.規(guī)劃設計階段未考慮后期維護通道、維護空間,例如設備距離墻壁太近,電池靠墻擺放,線纜布局不合理、線纜管路或走線架擋住上方弱電線槽導致后期無法維修、維護工具難以施展等; b.故障發(fā)生時,應急物資和備件無法快速搬運,故障設備和器件更換無維修操作空間等問題,延誤了故障處置時限甚至引發(fā)重大事故; c.未考慮后期發(fā)生故障進行設備維護時系統(tǒng)的冗余保障能力; d.未盡可能采用自動化手段,最大程度減少維護人員手動操作環(huán)節(jié),降低因手動操作存在的不確定性和不可控性。
a.數(shù)據(jù)中心在規(guī)劃設計時都會進行各系統(tǒng)可靠性的推算,但目前各設計院、不同的設計人員對可靠性的推算依據(jù)和數(shù)據(jù)來源尚未統(tǒng)一,造成對同一數(shù)據(jù)中心的設計等級和可靠性存在不同定義和不同的結果; b.對可用性存在著先進行規(guī)劃設計、施工,建設完成后再反推設計等級的案例,并以反推的等級標準向數(shù)據(jù)中心用戶進行推介。此為本末倒置的設計,往往因為設計中的某些關鍵缺陷導致雖然絕大部分設計滿足等級要求,但因為關鍵缺陷的存在造成等級下降; c.只注意設備或環(huán)節(jié)(子系統(tǒng))的可用性,而忽略在整個系統(tǒng)中各子系統(tǒng)之間的相關性對可用性的影響。
在規(guī)劃設計初期,主觀臆斷確定數(shù)據(jù)中心的功能指標,不切實際地一味追求規(guī)模大、高可用性等級、高機架功率密度、低能耗指標PUE。 而具體規(guī)劃設計時,又沒有嚴格按照規(guī)劃原則和程序做詳細的論證,具體方案和實際措施與總體規(guī)劃部匹配,其結果是: a.由于實際需求不明確,缺乏可行性的必要條件,反復設計、修改,不僅造成成本的浪費,還大大延長了建設周期; b.已建成并投入使用的機房得不到充分利用,究其原因或因無預想的業(yè)務需求量,或因機房條件不滿足用戶需求而必須進行再優(yōu)化改造才能使用; c.規(guī)劃設想的功能不能實現(xiàn),如系統(tǒng)可用性達不到規(guī)劃等級、制冷方案不支持規(guī)劃的機架高功率密度、發(fā)電機不支持系統(tǒng)連續(xù)運行條件、過度規(guī)劃使系統(tǒng)能耗指標PUE居高不下等。
業(yè)內(nèi)特別是規(guī)劃設計人員普遍存在著重設備輕系統(tǒng)和重局部忽視大局的現(xiàn)象,主要表現(xiàn)在: a.先確定設備規(guī)格型號甚至生產(chǎn)廠家,然后根據(jù)設備選擇或修改設計方案; b.供電系統(tǒng)按最高可用等級2N冗余設計,但所設計的結果是僅僅UPS系統(tǒng)有2N功能,而整個供電系統(tǒng)卻存在單路徑故障點; c.整個系統(tǒng)按最高等級冗余容錯系統(tǒng)設計,但是空調制冷設備卻是單路徑供電; d.為系統(tǒng)配置了交流備用能源柴油發(fā)電機,但發(fā)電機沒有自動啟動功能,因為規(guī)劃設計者缺乏連續(xù)制冷也是系統(tǒng)連續(xù)運行的重要條件的認識。
提高系統(tǒng)統(tǒng)籌設計能力對優(yōu)質地完成規(guī)劃設計任務是非常重要的。 a.在數(shù)據(jù)中心建設過程中存在著大量因規(guī)劃設計對分階段、分專業(yè)實施階段工程,以及不同專業(yè)施工間銜接問題考慮不足造成交付的數(shù)據(jù)中心不滿足業(yè)務及維護需求,有些問題甚至需要大筆投資進行改造方可完成; b.不同設計人員只關注自身所負責內(nèi)容,對于其他專業(yè)的是否完美銜接,是否與其他專業(yè)設計之間存在矛盾和沖突缺乏全局考慮; c.規(guī)劃設計人員對未來業(yè)務發(fā)展缺乏準確把握,對后期容量管理、擴容等方面考慮不足; d.規(guī)劃設計人員對周圍資源環(huán)境和物理環(huán)境不熟悉,所設計的方案會出現(xiàn)實施可行性差或者為后來運維工作帶來難以克服的困難。