供電系統(tǒng)的模塊化設(shè)計(jì)與模塊化UPS
系統(tǒng)模塊化是數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)計(jì)的重要理念和基本策略,數(shù)據(jù)中心設(shè)計(jì)建造中的很多問(wèn)題都與系統(tǒng)模塊化程度有關(guān)。模塊化以及與之關(guān)系緊密的標(biāo)準(zhǔn)化,為數(shù)據(jù)中心帶來(lái)了廣泛的好處,它不僅簡(jiǎn)化了從初始規(guī)劃到日常操作的每一個(gè)流程,還顯著改進(jìn)了數(shù)據(jù)中心商業(yè)價(jià)值的所有三個(gè)主要組成部分 – 可用性、適應(yīng)性和總擁有成本。模塊化UPS是可用性級(jí)別最高的模塊化系統(tǒng),引領(lǐng)著數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)計(jì)建造的理念和方向。
一、可修復(fù)和可快速修復(fù)功能是提高系統(tǒng)可用性的關(guān)鍵
現(xiàn)代數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)計(jì)和運(yùn)行的一個(gè)最基本也是最重要的要求是系統(tǒng)必須能連續(xù)工作。而工作連續(xù)性的程度通常是用系統(tǒng)的可用性來(lái)描述的。系統(tǒng)可用性A(t)的定義為:電子系統(tǒng)在使用過(guò)程中(尤其在不間斷連續(xù)使用的條件下)可以正常使用的時(shí)間與總時(shí)間之比??捎眯允怯煽煽啃詤?shù)MTBF(平均無(wú)故障時(shí)間)和故障后平均修復(fù)時(shí)間參數(shù)MTTR表示的。
可靠性MTBF愈高,系統(tǒng)的可用性愈高,這是不言而喻的事,但設(shè)備的可靠性是有限的,特別是由若干不同功能不同廠家的設(shè)備組成的復(fù)雜的系統(tǒng),可靠性很難達(dá)到設(shè)計(jì)要求的水平,使數(shù)據(jù)中心基礎(chǔ)設(shè)施特別是供電系統(tǒng)變得很脆弱。于是,設(shè)計(jì)者和用戶很自然的想到必須從系統(tǒng)的可修復(fù)和可快速修復(fù)上找出路,因?yàn)楸M管系統(tǒng)和設(shè)備的可靠性達(dá)不到要求的高度,故障隨時(shí)都可能發(fā)生,但只要系統(tǒng)中的所有設(shè)備故障后都是可修復(fù)并可快速修復(fù)的,故障后平均修復(fù)時(shí)間MTTR數(shù)值很小甚至趨近于零,那末系統(tǒng)的可用性同樣可以很高。
可修復(fù)和可快速修復(fù)成為數(shù)據(jù)中心用戶和設(shè)計(jì)者在系統(tǒng)設(shè)計(jì)時(shí)追求的首要目標(biāo)。只要組成系統(tǒng)的所有具備獨(dú)立功能的子系統(tǒng),在系統(tǒng)投入運(yùn)行后都是可拆卸、可移動(dòng)、可更換的,那末這個(gè)系統(tǒng)必然是可修復(fù)的。
可快速修復(fù)通常指可無(wú)工具拆卸和可拔插更換子系統(tǒng)和設(shè)備。但是,如果功能相同的兩個(gè)設(shè)備可冗余配置,當(dāng)一個(gè)設(shè)備故障停止運(yùn)行后,另一個(gè)與之冗余并機(jī)的設(shè)備可繼續(xù)工作而保證系統(tǒng)正常運(yùn)行,那末,對(duì)于整個(gè)系統(tǒng)而言,我們可以認(rèn)為冗余并機(jī)環(huán)節(jié)沒(méi)有發(fā)生造成系統(tǒng)宕機(jī)的故障,可靠性很高;也可以認(rèn)為雖然設(shè)備發(fā)生故障,但是在修復(fù)過(guò)程中沒(méi)有影響整個(gè)系統(tǒng)正常運(yùn)行,修復(fù)時(shí)間為零。
以上設(shè)計(jì)理念已在數(shù)據(jù)中心基礎(chǔ)設(shè)施用戶和設(shè)計(jì)者中取得了最廣泛的共識(shí),并在系統(tǒng)方案設(shè)計(jì)和建造中取得了廣泛的應(yīng)用和顯著的效果。
二、“系統(tǒng)模塊化”是可修復(fù)和可快速修復(fù)的根本條件
我們把具有獨(dú)立功能,在系統(tǒng)中可整體安裝、拆卸、移動(dòng)、更換的子系統(tǒng)稱之為模塊,那末上面的設(shè)計(jì)理念可概括為以下三句話:
1、現(xiàn)代的數(shù)據(jù)中心要求基礎(chǔ)設(shè)施必須是一個(gè)能連續(xù)工作的系統(tǒng);
2、一個(gè)能連續(xù)工作的系統(tǒng)必然是可修復(fù)和可快速修復(fù)的系統(tǒng);
3、一個(gè)可修復(fù)和可快速修復(fù)的系統(tǒng),組成該系統(tǒng)的所有子系統(tǒng)必然要具備模塊化特征;
模塊化即將完整的產(chǎn)品或流程按功能分成小塊,即模塊。根據(jù)上面講的,模塊的特征應(yīng)該是:
模塊是系統(tǒng)中一個(gè)具有獨(dú)立功能和可獨(dú)立運(yùn)行的單元;
結(jié)構(gòu)上可整體安裝、拆卸、更換、移動(dòng);
相同單元可冗余并機(jī)運(yùn)行;
在系統(tǒng)中,根據(jù)需要對(duì)這些模塊進(jìn)行組裝,以產(chǎn)生原始產(chǎn)品/流程的各種變體。以我們很熟悉的手電筒電池為例:可以將不同數(shù)量的電池(模塊)進(jìn)行組合,從而獲得不同功率的電源。在 IT 設(shè)備中,刀片式服務(wù)器和 RAID 陣列也是模塊化的典型例子 – 將多個(gè)設(shè)備組合在一起獲得不同數(shù)量的服務(wù)器或不同大小的存儲(chǔ)容量。模塊無(wú)需完全相同:以 Lego? 積木為例,這些模塊在某些方面相同,某些方面卻不同,譬如,其顏色、大小和形狀各不相同,但連接方式和尺寸均采用標(biāo)準(zhǔn)形式,以便可以將積木(模塊)組裝成一個(gè)集成系統(tǒng)。不同的模塊化系統(tǒng)可以根據(jù)所需的功能劃分目標(biāo),將不同數(shù)量的相同模塊或不同模塊(表示不同的標(biāo)準(zhǔn)化級(jí)別)并入集成的模塊或系統(tǒng)中。
數(shù)據(jù)中心基礎(chǔ)設(shè)施是集成了多種功能的復(fù)雜系統(tǒng),需要進(jìn)行仔細(xì)的工程設(shè)計(jì),以按照在標(biāo)準(zhǔn)化級(jí)別與用戶靈活性之間取得最佳平衡的方式進(jìn)行模塊化。系統(tǒng)中存在各種級(jí)別的模塊化設(shè)計(jì)的可能性。下面是一些示例:
可互換的 UPS 功率模塊和電池模塊:在功率、冗余和運(yùn)行時(shí)間方面均實(shí)現(xiàn)了可擴(kuò)展性,而且能夠進(jìn)行熱插拔,從而在不需要停止系統(tǒng)運(yùn)行的條件下進(jìn)行維修;
標(biāo)準(zhǔn)化的模塊化布線:將房間布線細(xì)分為行級(jí)模塊或機(jī)架級(jí)模塊。避免了混亂并易于出錯(cuò)的布線狀態(tài),并簡(jiǎn)化和加速了斷開(kāi)-重新排列-重新連接的流程。模塊化配電系統(tǒng)的方式很多,可以采用為整排負(fù)載供電的機(jī)架大小的模塊化設(shè)備,也可以采用服務(wù)于單個(gè)機(jī)架的電源插板(機(jī)架PDU);
機(jī)架級(jí)通風(fēng)裝置:將房間氣流細(xì)分為各機(jī)架局部控制,以便對(duì)高溫區(qū)域進(jìn)行精確制冷。
高密度機(jī)架系統(tǒng):將機(jī)架、配電系統(tǒng)和制冷系統(tǒng)集成為一個(gè)獨(dú)立的封閉“空間”,以冷卻和隔離發(fā)熱量密集的 IT 設(shè)備。(此時(shí),“模塊”指集成的整個(gè)系統(tǒng));
根據(jù)模塊的特征,在數(shù)據(jù)中心基礎(chǔ)設(shè)施中,一根線纜、一臺(tái)整機(jī)UPS或空調(diào)機(jī),都是一個(gè)模塊,但是由于設(shè)計(jì)時(shí)的疏忽,有時(shí)它們?cè)谙到y(tǒng)中卻失去了模塊化功能:一根線纜可能因?yàn)閿?shù)量多并相互擠壓而無(wú)法識(shí)別和更換,以至于一個(gè)老鼠啃壞一條線纜的絕緣就會(huì)使系統(tǒng)癱瘓而且不能迅速恢復(fù);一臺(tái)大型UPS或空調(diào)機(jī)因走道空間狹窄或搬運(yùn)工具進(jìn)不去而不能運(yùn)出更換;一臺(tái)裝入機(jī)柜的變壓器故障后因工具無(wú)法在機(jī)柜內(nèi)伸展而無(wú)法更換等,這些事例屢見(jiàn)不鮮,使具有這種隱患的系統(tǒng)也就不再具備可修復(fù)或可快速修復(fù)的功能。
這里引伸出的是一個(gè)新的概念-系統(tǒng)模塊化概念。在一個(gè)復(fù)雜的系統(tǒng)中,盡管組成系統(tǒng)地所有子系統(tǒng)都是模塊化的,但是由于缺乏系統(tǒng)模塊化設(shè)計(jì),使部分模塊失去可更換、可移動(dòng)的功能,最終使整個(gè)系統(tǒng)變成一個(gè)不可修復(fù)或不可快速修復(fù)的系統(tǒng),可用性大大降低。
“系統(tǒng)模塊化設(shè)計(jì)”已經(jīng)成為數(shù)據(jù)中心設(shè)計(jì)建造必須遵守的原則。模塊化使一切事情變得更加便利、更可預(yù)測(cè)、更為經(jīng)濟(jì)、更易于理解以及更加安全?!跋到y(tǒng)模塊化設(shè)計(jì)”觀念在行業(yè)中已上升到一個(gè)新的高度,成為了一種富有創(chuàng)造性并具突出戰(zhàn)略意義的設(shè)計(jì)哲學(xué)。
三、模塊化系統(tǒng)的優(yōu)勢(shì)
從上面所述可知,模塊化系統(tǒng)設(shè)計(jì)是建造可修復(fù)和可快速修復(fù)系統(tǒng)的基礎(chǔ),采用標(biāo)準(zhǔn)化結(jié)構(gòu)和連接方式的模塊化組件使一切變得更容易、更迅速,且成本更低。從供應(yīng)商的制造與庫(kù)存,到設(shè)計(jì)與工程規(guī)劃過(guò)程,再到客戶現(xiàn)場(chǎng)的安裝與運(yùn)營(yíng),無(wú)不如此。以下幾點(diǎn)突顯了模塊化系統(tǒng)的優(yōu)勢(shì):
模塊化系統(tǒng)是可擴(kuò)展的:模塊化的基礎(chǔ)設(shè)施可以根據(jù)當(dāng)前的 IT 需求進(jìn)行部署,并且能在以后根據(jù)需要添加更多組件。這種“系統(tǒng)規(guī)模塊化”能力顯著降低了總擁有成本;
模塊化系統(tǒng)是可更改的:在系統(tǒng)中可通過(guò)模塊的重新配置,為滿足不斷變化的 IT 需求提供了極大的靈活性;
模塊化系統(tǒng)是可移植的:在安裝、升級(jí)、重新配置或移動(dòng)模塊化時(shí),獨(dú)立組件、標(biāo)準(zhǔn)接口以及易于理解的結(jié)構(gòu)既節(jié)省了時(shí)間又節(jié)約了資金;
模塊化組件是可替換的:發(fā)生故障的模塊可以很容易被換下,以便進(jìn)行升級(jí)或修理,而且通常無(wú)需停止系統(tǒng)運(yùn)行;
模塊化可提高故障修復(fù)的質(zhì)量:模塊的可移植和可插拔特性使得很多工作可以在工廠進(jìn)行,既包括交貨之前(如配電設(shè)備的預(yù)先布線),也包括交貨之后(如電源模塊的修理)。從統(tǒng)計(jì)學(xué)角度上分析,同樣的工作,在工廠內(nèi)完成要比在現(xiàn)場(chǎng)操作的性能降低、降容使用和再故障率低得多,例如,與在現(xiàn)場(chǎng)修復(fù)的 UPS 電源模塊相比,在工廠修復(fù)的模塊在引起斷電、發(fā)生新的故障或無(wú)法恢復(fù)到滿負(fù)荷工作狀態(tài)方面的概率要低上千倍。
模塊化是標(biāo)準(zhǔn)化的基礎(chǔ),是標(biāo)準(zhǔn)化不可或缺的基本條件。幾乎所有好處都能以某種方式追溯至標(biāo)準(zhǔn)化的兩個(gè)強(qiáng)大的基礎(chǔ)屬性:模塊化構(gòu)件結(jié)構(gòu)和提高的人類(lèi)學(xué)習(xí)能力,如圖1所示。
正是這兩個(gè)特征產(chǎn)生了遍及整個(gè)基礎(chǔ)設(shè)施的好處,為基礎(chǔ)設(shè)施的幾乎每個(gè)方面帶來(lái)了累積的正面影響。
人類(lèi)學(xué)習(xí)-理解的力量:
模塊化提高了設(shè)備的效率,易于理解性則提高了人的效率。模塊化標(biāo)準(zhǔn)化系統(tǒng)在各個(gè)層面上使人類(lèi)的學(xué)習(xí)更加方便。事物不僅更易于理解,而且可預(yù)測(cè)性和可重復(fù)性也更強(qiáng),因而發(fā)生問(wèn)題的概率更低,并且當(dāng)發(fā)生問(wèn)題時(shí)更容易識(shí)別。
事物越易于理解、可預(yù)測(cè)性越強(qiáng),便越容易解釋、編制文檔、操作、查明問(wèn)題并修復(fù)。這些效應(yīng)往往互為基礎(chǔ),從而使安裝、維護(hù)工作可以做到:
減少人為錯(cuò)誤:標(biāo)準(zhǔn)化對(duì)于人類(lèi)學(xué)習(xí)最突出的貢獻(xiàn)莫過(guò)于減少了數(shù)據(jù)中心中的人為錯(cuò)誤,從標(biāo)準(zhǔn)化模塊化組裝流程到系統(tǒng)的故障診斷、文檔編制、培訓(xùn)等都更加簡(jiǎn)單、有效,從而使員工更熟練、更不容易出錯(cuò);
預(yù)見(jiàn)問(wèn)題:對(duì)工作原理的了解,再加上此類(lèi)事物的標(biāo)準(zhǔn)化程序(如設(shè)備監(jiān)控和預(yù)測(cè)性維護(hù)程序),形成了一個(gè)足以應(yīng)對(duì)那些“意外”事故的強(qiáng)大防御手段;
提高效率:由于這些學(xué)習(xí)效果相互影響并互相推動(dòng),效率得到了全面提高。員工的知識(shí)越全面,在相關(guān)問(wèn)題上所花費(fèi)時(shí)間的利用率就越高。人為錯(cuò)誤的減少不但減少了在糾正人為引發(fā)問(wèn)題上所需的時(shí)間,而且也減少了答復(fù)與此類(lèi)問(wèn)題有關(guān)的電話幫助熱線的時(shí)間。使人力資源得到更好地釋放和合理使用;
批量生產(chǎn)的優(yōu)勢(shì):部件和流程的標(biāo)準(zhǔn)化模塊化使批量生產(chǎn)成為可能,批量生產(chǎn)的優(yōu)勢(shì)體現(xiàn)在以下幾個(gè)方面:成本更低、質(zhì)量更高、更易于維修、產(chǎn)量更大、交貨速度更快。
評(píng)論