新聞中心

EEPW首頁 > 網(wǎng)絡(luò)與存儲 > 業(yè)界動態(tài) > 首個商業(yè)化液冷服務(wù)器推動中國HPC生態(tài)圈蓬勃發(fā)展

首個商業(yè)化液冷服務(wù)器推動中國HPC生態(tài)圈蓬勃發(fā)展

—— 首個商業(yè)化冷服務(wù)器推動中國HPC生態(tài)圈蓬勃發(fā)展
作者: 時間:2018-03-13 來源:電子產(chǎn)品世界 收藏

在近幾年的國際超級展會上,中國企業(yè)憑借豐碩的成果在國際舞臺上贏得了業(yè)界的關(guān)注和認可。中國的超級也首次在最新的全球超級500強排行榜上以202臺的總數(shù)反超了美國,并從2013年開始穩(wěn)居全球超算速度之首。除了在計算速度上取得的矚目成就,國內(nèi)企業(yè)在商用超級計算機環(huán)保節(jié)能方面也大放異彩。其中一款備受矚目的“地球數(shù)值模擬裝置”來自中科:此裝置運用了我國首款成功商業(yè)化的冷板式液冷TC4600E-LP,可以完全模擬地球土壤、海洋和大氣運動變化,同時大幅提升速度、降低能耗,是一臺協(xié)助人工智能更進一步的深度學習一體機。該項目在幫助人類社會進一步了解地球環(huán)境的同時也做到了全年自然冷卻,可謂在綠色發(fā)展道路上邁出了意義非凡的一步。

本文引用地址:http://butianyuan.cn/article/201803/376838.htm

引領(lǐng)液冷商業(yè)化

計算能力的突飛猛進使人工智能在各個行業(yè)都具備無限的可能性。大量的計算芯片需要高密度部署,一個服務(wù)器機柜的發(fā)熱量也將增至數(shù)十千瓦。CPU作為服務(wù)器的主要驅(qū)動力對電源和散熱有著極高的要求——電源系統(tǒng)需要提供更大的功率,冷卻系統(tǒng)也要做到與之相匹配的散熱能力。這是傳統(tǒng)的風冷技術(shù)無法達到的。因此,能夠精確到CPU的液冷技術(shù)成了節(jié)能技術(shù)(北京)股份有限公司(以下簡稱節(jié)能)主要的研究方向,也是解決目前數(shù)據(jù)中心節(jié)能問題的必然趨勢。相較風冷,液冷能達到更低的PUE值、有效降低風扇噪音和大幅降低耗電量。

雖然液冷技術(shù)問世已有一段時間,但囿于技術(shù)成熟度和成本等因素,液冷高性能計算機始終未能得到大規(guī)模應(yīng)用。對于習慣運營風冷機房的用戶來說,從風冷到液冷的過度也是一個充滿挑戰(zhàn)的過程。除了服務(wù)器架構(gòu)搭建上的不同,機房的維護方法和程序也需要做出相應(yīng)的改變。

以此為出發(fā)點,曙光節(jié)能開始與曙光服務(wù)器事業(yè)部、上下游廠商合作,致力研發(fā)性價比和用戶接受度高的產(chǎn)品,使其滿足科技商業(yè)化的必要條件。這一研發(fā)項目的成果就是TC4600E-LP冷板式液冷服務(wù)器。它采用風冷和液冷混合散熱模式對服務(wù)器主要部件進行冷卻,將液冷散熱占比提高至90%以上,從而降低了風機功耗。TC4600E-LP采用了集成管理模塊設(shè)計,在整箱刀片式液冷服務(wù)器中的CPU芯片和內(nèi)存上安裝固定水冷板,冷媒通過進出口循環(huán)流動。TC4600E-LP投入市場2年來,先后為中科院大氣所“地球數(shù)值模擬裝置原型系統(tǒng)”和國家電網(wǎng)電力科學研究院仿真中心超級計算系統(tǒng)項目提供了超過2000節(jié)點的計算能力,整柜密度超過25kW,空調(diào)系統(tǒng)功耗直接降低70%,PUE值始終控制在1.2左右。

冷板式服務(wù)器因其對計算機系統(tǒng)較小的改動要求成為液冷技術(shù)商業(yè)化最合適的選擇,只需將原風冷散熱片替換為液冷板,并將冷媒管路引出機箱即可。快速插拔管路連接也使運行維護更加接近用戶現(xiàn)有的使用習慣,安全便捷。

建設(shè)中國HPC生態(tài)圈

據(jù)曙光節(jié)能總經(jīng)理何繼盛介紹,曙光節(jié)能專注于自己的專業(yè)領(lǐng)域,其價值在于讓其它應(yīng)用液冷技術(shù)的產(chǎn)業(yè)能夠?qū)P你@研自身的工作,取得經(jīng)濟與資源上的最高效率。這不僅需要曙光節(jié)能本身技術(shù)實力雄厚,也需要一個生機盎然的產(chǎn)業(yè)生態(tài)圈來幫助國內(nèi)高科技企業(yè)實現(xiàn)更快的技術(shù)應(yīng)用和大項目部署。

近年來,曙光節(jié)能通過研發(fā)制造過程中與上下游合作伙伴的接觸與溝通,將創(chuàng)新鏈與產(chǎn)業(yè)鏈結(jié)合,深度利用特定的應(yīng)用進行各類產(chǎn)品的開發(fā)和優(yōu)化。由于國內(nèi)的HPC產(chǎn)業(yè)鏈尚未成熟,曙光節(jié)能十分看重上游廠商的研發(fā)定制能力,在不同的應(yīng)用中與供應(yīng)商進行深入的技術(shù)交流,借此希望更多的廠家能在液冷技術(shù)配套原材料和零部件研發(fā)方面投入更多的精力。

對此,曙光節(jié)能液冷系統(tǒng)研發(fā)總監(jiān)崔新濤強調(diào):“液冷系統(tǒng)各個部件都是非常關(guān)鍵的,哪個部件出現(xiàn)問題對服務(wù)器來說都是致命的影響。正因為有了這些關(guān)鍵供應(yīng)商的支持,才促成這個液冷系統(tǒng)的誕生。”

上游零部件廠商合作:小部件,大作用

在液冷系統(tǒng)的設(shè)計中,液冷管路連接是其中重要的一環(huán)。機房的空間結(jié)構(gòu)、管路的安全性和易維護性是選擇與設(shè)計管路接頭關(guān)鍵的考量。崔總監(jiān)解釋道:“管路接頭是水冷模塊中比較核心的部件,需要保證用戶在使用和維護過程中可以快速插拔,并且冷卻液不泄露?!?/p>

在這一環(huán)節(jié)上與曙光節(jié)能合作的上游廠商是快速插拔接頭研發(fā)制造商CPC。早在2010年,CPC由于意識到無溢漏接頭在液冷系統(tǒng)解決方案中所起到的重要作用開始與曙光節(jié)能進行聯(lián)系,并于2013年正式建立合作關(guān)系。曙光節(jié)能也注意到CPC的產(chǎn)品曾多次被應(yīng)用在國際名企的液體傳輸和處理系統(tǒng)中。漂亮的成績單和不斷的溝通使雙方對彼此的專業(yè)度都有著極高的信賴。

在研發(fā)初期,服務(wù)器液冷系統(tǒng)技術(shù)尚處摸索階段,項目因此以原型機的測試為主導。曙光節(jié)能在全浸沒前置式驗證機上試用了CPC的PMC12塑料接頭,對其氣密性和安全性進行了長期觀察和測試。

由于PMC12接頭在各方面表現(xiàn)理想,一年之后,曙光節(jié)能對CPC要求試用金屬接頭,以滿足用戶對連接器材質(zhì)的新需求。隨著技術(shù)的進步和雙方研發(fā)人員不斷的討論和溝通,曙光節(jié)能開始在冷板式服務(wù)器上對CPC的LQ6金屬接頭進行測試。這款專為液冷應(yīng)用設(shè)計的快速插拔接頭采用鍍鉻黃銅、聚砜和不銹鋼材料制造,確保了可信賴的強度以及對大范圍應(yīng)用的化學相容性。在保障電子設(shè)備安全方面,接頭具有特殊的斷面和閥門技術(shù),使其在長時間保持連接之后還能在斷開時實現(xiàn)無滴漏,符合超級計算機的使用維護特點。除此之外,LQ6還優(yōu)化了流量效率、配備了具有符合人體工程學的拇指鎖,并運用藍、紅兩種顏色編碼為運維人員提供視覺提示,以預防誤接。預緊螺紋設(shè)計也有效避免了設(shè)備在運行中由于振動所導致接頭松動的風險。

在接下來的合作中,曙光節(jié)能根據(jù)客戶反饋和冷板式服務(wù)器的結(jié)構(gòu)提出了盲插設(shè)計的想法,讓服務(wù)器刀片在有誤差的情形下也能保證接頭順利連接。CPC于2015年為TC4600E-LP冷板式服務(wù)器訂制了RP-LQ2盲插產(chǎn)品, 其獨特的自對中設(shè)計容許刀片和機架在對接時位置發(fā)生少許偏移,以確保其它電子連接準確無誤為前提自動校對到中心,實現(xiàn)盲插接頭的無損對接。盲插使液冷服務(wù)器的維護方式與風冷散熱服務(wù)器基本無差別,加上多層泄漏檢測和溢流技術(shù),提高了數(shù)據(jù)中心的安全和穩(wěn)定。

研發(fā)總監(jiān)崔新濤如此評價與CPC的合作:“CPC具有強大的技術(shù)實力,并在研發(fā)制造易維護的快速插拔連接器方面具有豐富的經(jīng)驗。因此,曙光節(jié)能樂意與CPC這樣技術(shù)成熟的廠商進行合作,選擇它作為曙光節(jié)能液冷模塊接頭的主要供應(yīng)商?!?/p>

對于CPC 來說,與曙光節(jié)能的技術(shù)交流也是提高自身研發(fā)訂制能力的最佳平臺。CPC工程經(jīng)理張欣說道:“我相信雙方的合作能促使液體冷卻技術(shù)更加完善,推動行業(yè)成長?!?/p>

未來的推廣與創(chuàng)新之路

為何要大力推廣商業(yè)化?對此,崔總監(jiān)一針見血地指出:“雖然我們的服務(wù)器在技術(shù)上已經(jīng)是國際水平,但不同的是,在需求上,國外的大用戶在節(jié)能環(huán)保意識上更為超前,也更為積極地部署液冷系統(tǒng)。相比之下,國內(nèi)的環(huán)保節(jié)能意識開始得稍微晚一些,但我們產(chǎn)業(yè)的發(fā)展速度卻是超前的?!庇纱丝梢姡瑖鴥?nèi)市場需要依靠高科技企業(yè)的不斷推廣和商業(yè)化研發(fā)來使液冷技術(shù)更為普及,這也包括了對未來趨勢的展望和研究。崔總監(jiān)提到,浸沒式服務(wù)器雖然是不可避免的趨勢,但在世界范圍內(nèi)都是一個應(yīng)用難題,需要控制液體的相變或保證空間壓力。正因如此,現(xiàn)在能實現(xiàn)真正商用的全浸沒液冷服務(wù)器在世界上也是極為罕見。

這并沒有阻止HPC產(chǎn)業(yè)對浸沒式商業(yè)化的追求。自2010年起,曙光節(jié)能聯(lián)合曙光服務(wù)器事業(yè)部就在實驗室中同時開展了冷板式和浸沒式兩種液冷方案的科研。繼2015年曙光TC4600E-LP冷板式液冷服務(wù)器亮相并成功競標多個大型項目之后,曙光節(jié)能也在竭力開發(fā)商用浸沒式液冷系統(tǒng)。

為了更好地推動這一切的發(fā)展,曙光節(jié)能持續(xù)主動地與生態(tài)圈內(nèi)的合作伙伴保持溝通。CPC作為曙光節(jié)能重要的零部件供應(yīng)商之一也在這個過程中不斷完善液體處理技術(shù)。雙方工程師以更好響應(yīng)液冷發(fā)展趨勢為目標,通過不懈的專業(yè)交流讓高性能計算走出實驗室,攜手研發(fā)開辟未來的創(chuàng)新產(chǎn)品。



關(guān)鍵詞: 計算機 服務(wù)器 曙光

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉