六種方法 實(shí)現(xiàn)數(shù)據(jù)中心電能管理
直到最近,許多機(jī)構(gòu)都沒有考慮他們的數(shù)據(jù)中心基礎(chǔ)設(shè)施已經(jīng)不止一個(gè)十年了。只要有足夠的空間來(lái)容納新的服務(wù)器機(jī)架,現(xiàn)有的冷卻和電力能力和容量暫時(shí)還可以滿足新增加的需求。但是,隨著計(jì)算能力需求的不斷增加,現(xiàn)在這種狀況不會(huì)維持很久,因?yàn)樵诓痪玫膶?lái),就會(huì)出現(xiàn)電力供應(yīng)得緊張。
據(jù)市場(chǎng)調(diào)研公司IDC (CIO.com出版商的一個(gè)姊妹公司)的調(diào)查結(jié)果,在數(shù)據(jù)中心經(jīng)理所關(guān)心的事情中,容納和運(yùn)行服務(wù)器所需要的計(jì)算機(jī)支持基礎(chǔ)設(shè)施是僅次于價(jià)格的第二大問(wèn)題。IDC公司的高性能計(jì)算研究部副總裁Steve Conway說(shuō),“在三、四年前,這些問(wèn)題是排在第12位的,這意味著,在那時(shí)它們根本就是不被重視的問(wèn)題。”
這一狀況的改變,優(yōu)先反映了技術(shù)的變化和處理能力需求的急劇增長(zhǎng)。虛擬化和多核處理器使我們能夠在一個(gè)很小的地方擺放更高密度的計(jì)算能力。所有類型企業(yè)與日俱增的核心業(yè)務(wù)處理,對(duì)電腦計(jì)算依賴的程度的提高,推動(dòng)企業(yè)把越來(lái)越多的計(jì)算機(jī)機(jī)架放到它們現(xiàn)有的數(shù)據(jù)中心。與此同時(shí),Gartner預(yù)測(cè)表示,到2008年底,世界上一半的數(shù)據(jù)中心的基礎(chǔ)設(shè)施將不能滿足近年來(lái)的高密度的設(shè)備對(duì)電力和冷卻的要求。
這些變化帶給像我自己這樣的(在一個(gè)高端科技超級(jí)計(jì)算機(jī)中心的管理者)主流數(shù)據(jù)中心的管理者,在今后的十年里要面對(duì)的一些問(wèn)題:如何正確選定基礎(chǔ)設(shè)施支持設(shè)備,如何優(yōu)化冷卻為高密度服務(wù)器機(jī)架服務(wù),如何平衡數(shù)據(jù)中心的效率與業(yè)務(wù)需求,以及如何跟蹤所有的可能影響執(zhí)行成敗的細(xì)節(jié)。
我工作的數(shù)據(jù)中心(設(shè)在美國(guó)陸軍工程師研究與發(fā)展中心( ERDC )的國(guó)防部超級(jí)計(jì)算機(jī)中心),正處于一個(gè)為期兩年的、對(duì)數(shù)據(jù)中心的基礎(chǔ)設(shè)施,進(jìn)行完全徹底地檢查過(guò)程中。設(shè)計(jì)一個(gè)新的數(shù)據(jù)中心或改造一個(gè)舊的,是一個(gè)復(fù)雜的過(guò)程,但以下的六個(gè)想法,可以讓您在開始這項(xiàng)工作的初期,就保持一個(gè)正確的方向。這六個(gè)想法是根據(jù)在過(guò)去的十年里我們的經(jīng)驗(yàn)總結(jié)出來(lái)的,并且是在陸軍工程師研究與發(fā)展中心正在進(jìn)行的基礎(chǔ)設(shè)施現(xiàn)代化的過(guò)程中受到實(shí)地檢驗(yàn)的。
1 決定您是否真的需要自己的數(shù)據(jù)中心
越來(lái)越多的計(jì)算機(jī)基礎(chǔ)設(shè)施是一項(xiàng)具有挑戰(zhàn)性的,投資昂貴的過(guò)程。在您決定下次升級(jí)前,一定要問(wèn)問(wèn)自己,“我是真的需要自己的數(shù)據(jù)中心嗎?”
一個(gè)最小的基礎(chǔ)設(shè)施將包括電源開關(guān)設(shè)備和發(fā)電機(jī)。但是,幾乎沒有一個(gè)數(shù)據(jù)中心的基礎(chǔ)設(shè)施僅僅就是這么多。還要增加容錯(cuò)功能,包括電池或飛輪的不間斷電源( UPS )、后備供水(以防萬(wàn)一您的市政供水中斷)、冗余組件、甚至可能是多個(gè)獨(dú)立的商業(yè)供電的接入。然后,你必須保護(hù)自己免受火災(zāi)和自然災(zāi)害。一旦數(shù)據(jù)中心的建成,你需要雇人來(lái)監(jiān)測(cè)和維護(hù)它。
正如Amazon公司首席技術(shù)官(CTO )Werner Vogels在最近的“下一代數(shù)據(jù)中心會(huì)議”中表示:除非你是在一個(gè)具有高效率的行業(yè),運(yùn)行數(shù)據(jù)中心的本身就能直接得到回報(bào),否則,在別人的數(shù)據(jù)中心運(yùn)行您的應(yīng)用程序可能會(huì)更好。
這個(gè)解決方案不見得對(duì)每個(gè)人都是正確的,但是,當(dāng)公用事業(yè)費(fèi)用上升和緊縮基礎(chǔ)設(shè)施的需求不斷增長(zhǎng)時(shí),它至少是值得考慮的。
2 權(quán)衡綠色設(shè)計(jì)的成本和效益
成本和消費(fèi)的上升,使得對(duì)電力的關(guān)注推到數(shù)據(jù)中心規(guī)劃的前面。如變壓器,電線,冷卻系統(tǒng)和UPS,都存在著很大的的、固定的電力損耗,在電力到達(dá)第一臺(tái)服務(wù)器之前將有效功率切割掉一部分。
Green Grid(綠色網(wǎng)格),一個(gè)旨在提高數(shù)據(jù)中心能源效率的信息技術(shù)公司的協(xié)會(huì),推薦通過(guò)去除冗余的組件來(lái)合理精簡(jiǎn)基礎(chǔ)設(shè)施,僅僅安裝您需要的、使數(shù)據(jù)中心目前能夠滿足運(yùn)行的設(shè)備。跟據(jù)該組織的《節(jié)能數(shù)據(jù)中心指南》,合理精簡(jiǎn)基礎(chǔ)設(shè)施可以節(jié)省多達(dá)百分之五十的電費(fèi)。
但是,還有一個(gè)日漸衰老的能源故事,在數(shù)據(jù)中心的升級(jí)規(guī)劃剛剛嶄露頭角時(shí),美國(guó)的公用事業(yè)基礎(chǔ)設(shè)施已經(jīng)開始顯示出衰老的跡象,因?yàn)?,電力供?yīng)似乎總是有問(wèn)題。
在Minneapolis的大橋坍塌和近十年內(nèi)最初幾年的大規(guī)模停電,這些都是國(guó)家的重要基礎(chǔ)設(shè)施迅速下降的征兆。2003年8月14日,停電造成Great Lakes附近,大約 5000萬(wàn)人沒有電力供應(yīng),像這樣的事件預(yù)計(jì)在未來(lái)幾年內(nèi),將變得更加普遍,除非采取重大措施來(lái)抑制需求,并增加老化電網(wǎng)的可靠性的能力。
根據(jù)最近的一份北美電力可靠性委員會(huì)(North American Electric Reliability Council)的關(guān)于長(zhǎng)期電力可靠性的報(bào)告指出,在未來(lái)10年,對(duì)電力的需求預(yù)計(jì)將增長(zhǎng)19%,但是,發(fā)電能力預(yù)計(jì)將僅能增長(zhǎng)6%。這意味著供電的余量正在下降,每年激增的需求或區(qū)域性氣候事件,很可能比以往任何時(shí)候都更容易造成全國(guó)各地的停電事故。
隨著在短期內(nèi),市政電力中斷的可能變得更加頻繁,數(shù)據(jù)中心管理人員應(yīng)當(dāng)積極地設(shè)計(jì)自己的基礎(chǔ)設(shè)施以保證電力的可靠性,包括冗余電源分布和發(fā)電系統(tǒng),以防止在商業(yè)電力中斷時(shí),系統(tǒng)出現(xiàn)故障。
顯然,你需要將你的基礎(chǔ)設(shè)施設(shè)計(jì)成盡可能地高效率(甚至可以把基礎(chǔ)設(shè)施的高效率當(dāng)成設(shè)計(jì)要求)。但是,電力分配基礎(chǔ)設(shè)施節(jié)能的程度將取決于機(jī)構(gòu)對(duì)持續(xù)可用性和增加能力的成本評(píng)估。例如,在ERDC,我們的超級(jí)計(jì)算任務(wù)需要非常強(qiáng)大的電腦可用性。我們的電力分配基礎(chǔ)設(shè)施包括:有冗余的開關(guān)、電池和發(fā)電機(jī)。這些使我們能夠在進(jìn)行日常維護(hù)時(shí),不用中斷運(yùn)行。在組件發(fā)生故障時(shí),也可以繼續(xù)長(zhǎng)時(shí)間地緊急運(yùn)行。這些冗余的設(shè)備雖然增加了我們固定的電力損耗,但是也考慮到我們的業(yè)務(wù)不能中斷的需求。
本文引用地址:http://butianyuan.cn/article/201706/354150.htm 3 通過(guò)設(shè)計(jì)達(dá)到“緊密結(jié)合冷卻”并提高靈活性
電腦在兩件事上是非常有效的:處理數(shù)字和將電力轉(zhuǎn)為熱量。進(jìn)入數(shù)據(jù)中心的電量,大約有百分之三十在服務(wù)器內(nèi)轉(zhuǎn)變成熱量。
傳統(tǒng)的做法是,用設(shè)施以外的大型冷卻機(jī)組冷卻水,然后將冷卻水注入到在機(jī)房地板上的電腦室空調(diào)( CRAC )裝置。這種做法實(shí)質(zhì)上是使整個(gè)房間充滿冷空氣,但針對(duì)具體的熱源點(diǎn),只提供了非常小的靈活性。
“緊密結(jié)合冷卻”的概念已經(jīng)流行于超級(jí)計(jì)算中心多年了,我們發(fā)現(xiàn)它是有效率的和有效力的。這個(gè)想法是把冷卻放在非常接近熱源的地方,目的是刪除熱源。這種做法可以有針對(duì)性地冷卻和控制熱源點(diǎn),并能縮短空氣路徑,比將冷空氣移動(dòng)到全房間需要更少的風(fēng)扇電力。“緊密結(jié)合冷卻”可以使機(jī)架密度達(dá)到通常情況的4倍。根據(jù)客戶提高機(jī)架密度的需求,所有主要服務(wù)器廠商現(xiàn)在都能提供適合“緊密結(jié)合冷卻”的配置。
有許多基于“緊密結(jié)合冷卻”解決方案的機(jī)架和芯片。例如,有將冷卻裝置安裝在一個(gè)機(jī)架內(nèi),橫靠在服務(wù)器機(jī)架側(cè)面的設(shè)計(jì),或?qū)⑵浞胖迷诿總€(gè)機(jī)架的頂部的 “自上而下”的冷卻辦法。也有的解決方案直接將冷卻水提供到機(jī)架的后門,或?qū)⒗鋮s器放置在機(jī)架的抽屜內(nèi),與電腦抽屜交錯(cuò)安排。
以芯片為基礎(chǔ)的冷卻解決方案有兩個(gè)基本的形式。最簡(jiǎn)單的是將冷卻水輸送到一個(gè)或多個(gè)位于服務(wù)器的熱源上方的冷卻器中。更為復(fù)雜的系統(tǒng)使用惰性液體,直接將其應(yīng)用于服務(wù)器芯片的閉環(huán)系統(tǒng)。雖然這項(xiàng)技術(shù)最近才被通常的服務(wù)器采用,但超級(jí)計(jì)算機(jī)行業(yè)一直在使用這項(xiàng)技術(shù),已經(jīng)幾十年了。2006年,ERDC的超級(jí)計(jì)算中心在它的一些Cray超級(jí)計(jì)算機(jī)上使用了芯片級(jí)的汽化熱交換冷卻系統(tǒng)。
所有這些方法都要求冷卻水的管道剛好到達(dá)計(jì)算機(jī)機(jī)架,你需要在設(shè)計(jì)你的數(shù)據(jù)中心的管道時(shí),考慮好這一點(diǎn)。如果將冷卻水移動(dòng)到數(shù)據(jù)中心的核心區(qū)域的這種想法使你的心跳停止、非常害怕的話,這里有大量的、如何最大限度地減少風(fēng)險(xiǎn)的工程方面的知識(shí)可以讓你放心。你需要采取措施包括:使水管在抬高的地板下面盡可能的低位置,安裝檢漏儀,將電與水管管道隔離,并提供泄漏控制功能裝置,如重力排水管道及接漏水盤。
4 地板磚方面的考慮也不容忽視
如果您沒有規(guī)劃或不能計(jì)劃“緊密結(jié)合冷卻”,這里仍然有一些你可以采取的措施,來(lái)提高冷卻效率。
盡量減少在機(jī)房抬高地板下的電纜和管道數(shù)量。這是空調(diào)裝置(CRAC)正在使用的空間,空調(diào)裝置把冷空氣推向您的計(jì)算機(jī),并且,如果你能最大限度地減少冷空氣在流動(dòng)過(guò)程中與電纜和管道相遇的中斷,那么,用于冷卻的能源效力將可以大大增加。盡量減少地板下的障礙物,也可以幫助消除數(shù)據(jù)中心的熱源點(diǎn)。
另一個(gè)措施是:你可以是委托流體動(dòng)力學(xué)研究機(jī)構(gòu)對(duì)數(shù)據(jù)中心進(jìn)行研究,或購(gòu)買您需要的軟件,自己執(zhí)行該項(xiàng)研究。這種方法使用了一個(gè)計(jì)算機(jī)模型來(lái)模擬圍繞數(shù)據(jù)中心的氣流,可以幫助您找出冷卻問(wèn)題的原因和解決辦法,包括穿孔地板磚的最佳鋪設(shè)位置。
幾年前,ERDC超級(jí)計(jì)算中心采用了這種方法,以確認(rèn)我們獲得了冷卻系統(tǒng)的最大能力。在數(shù)據(jù)中心,穿孔地板磚往往只是鋪設(shè)在服務(wù)器機(jī)架冷通道的前面。數(shù)據(jù)中心的綜合領(lǐng)導(dǎo)Paula Lindsey說(shuō):“令人驚訝的是,最有效的穿孔地板磚的鋪設(shè)并非總是在機(jī)器的前面。”在流體動(dòng)力學(xué)的研究表明,我們需要在一些地板磚上,增加穿孔直徑,在關(guān)鍵位置上,讓更多地線纜和管道通過(guò)。
5 將支持設(shè)備移到外面
正確選擇您的計(jì)算機(jī)基礎(chǔ)設(shè)施支持系統(tǒng)的位置將提高數(shù)據(jù)中心能源效率,并讓您在將來(lái)更容易擴(kuò)展規(guī)模。其中,您可以采取的最重要措施之一是:盡可能地將電源和冷卻設(shè)備移到數(shù)據(jù)中心以外的地方。事實(shí)上,如果你有空間,一個(gè)好的辦法是,將這些設(shè)備的大部分移到建筑物以外的地方。
下面是一個(gè)例子。對(duì)于在ERDC的一個(gè)新的超級(jí)計(jì)算中心,我們需要一個(gè)短期安裝以取得2兆瓦的額外電源。我們發(fā)現(xiàn),需要添加的UPS和發(fā)電機(jī)設(shè)備,不適合安裝在放置其余電力基礎(chǔ)設(shè)施的這個(gè)建筑物內(nèi)。在10年前,我們的數(shù)據(jù)中心選址在一個(gè)陡峭的山坡和道路之間的區(qū)域。其解決方案(將設(shè)備放置在室外由切割山坡形成的平地區(qū)域)是非常昂貴的,并在日程已經(jīng)很緊迫的情況下,這將增加時(shí)間延誤。
我們新的長(zhǎng)期設(shè)計(jì)是,將這些組件的大部分放置在建筑物以外的一個(gè)模塊化新規(guī)劃出的公用設(shè)施區(qū)域。負(fù)責(zé)執(zhí)行升級(jí)的工程師Greg Rottman說(shuō):“當(dāng)我們需要擴(kuò)大規(guī)模時(shí),這種將設(shè)備的移動(dòng),消除了建筑物圍墻對(duì)我們的限制,并在至少另一個(gè)10年內(nèi),應(yīng)該能夠提供給我們靈活性,滿足我們擴(kuò)容升級(jí)的需要。”
將傳輸和外部設(shè)備移到室外也有利于環(huán)保。在今年早些時(shí)候發(fā)表的一份報(bào)告中, Green Grid(綠色網(wǎng)格)發(fā)現(xiàn),進(jìn)入數(shù)據(jù)中心的電力在電力輸送的單元、UPS設(shè)備和開關(guān)設(shè)備中,高達(dá)百分之二十五轉(zhuǎn)換成為熱量。將這些設(shè)備的移到數(shù)據(jù)中心以外,如果可能的話,移到建筑物的外面,這會(huì)降低您的整體能源消耗,因?yàn)椴辉傩枰芰縼?lái)消除移走由這些設(shè)備所產(chǎn)生的熱量。
6 電源管理的監(jiān)控
你知道您的數(shù)據(jù)中心使用了多少電力嗎?您的服務(wù)器用電量比供應(yīng)商所說(shuō)的用電量是多了,還是少了?明年設(shè)備升級(jí)的耗電量與您的設(shè)施電容量是不是很接近?
一個(gè)用于電源和冷卻系統(tǒng)基礎(chǔ)設(shè)施監(jiān)測(cè)的系統(tǒng),必須是你對(duì)數(shù)據(jù)中心任何升級(jí)規(guī)劃的一部分。對(duì)能源使用積極的管理和監(jiān)控將幫助您計(jì)劃未來(lái)和評(píng)估您為提高數(shù)據(jù)中心的能源效率所采取措施的有效性。
對(duì)于要說(shuō)服不直接管理數(shù)據(jù)中心業(yè)務(wù)的高級(jí)管理人員,讓其投資數(shù)據(jù)中心的升級(jí),可以說(shuō)是一種挑戰(zhàn)。您可以一點(diǎn)一滴地,在可以負(fù)擔(dān)得起的情況下,逐步建立數(shù)據(jù)中心的電源監(jiān)控系統(tǒng)。并觀察節(jié)約能源和提高效率的措施是否有效和有意義。這將有助于您建立一個(gè)長(zhǎng)遠(yuǎn)電源改進(jìn)評(píng)價(jià)體系,并更有效地規(guī)劃未來(lái)。
作者介紹:John E. West是美國(guó)國(guó)防部高性能計(jì)算現(xiàn)代化計(jì)劃的高級(jí)研究員和在Vicksburg的美國(guó)陸軍工程師研究與發(fā)展中心的超級(jí)計(jì)算機(jī)中心的負(fù)責(zé)該計(jì)劃的執(zhí)行主任。
評(píng)論