Facebook透露為AI和VR打造硬件的原因
新的設計提升了處理器和處理器之間、處理器和內存之間的通信效率。
本文引用地址:http://butianyuan.cn/article/201604/289905.htm「我們將CPU簡化至正好能滿足我們要求,」這兩位工程師表示,「我們移除了QPI鏈接,縮減了英特爾的成本??紤]到我們的服務器將基于同一的插槽,這也解決了我們NUMA問題。我們將其設計為整合芯片集的系統(tǒng)芯片,更加簡單。這種接口一致的CPU散熱設計功耗(TDP)更低。與此同時,我們重新設計的服務器基礎設施,在同等電源條件下,容納每個機架雙倍的CPUs數(shù)量?!?/p>
這使得Facebook制造出一個可以在每個機架上獲得更高性能的服務器體系結構,同時確保每個機柜能量消耗密度保持在11千瓦以下。
強大的人工智能數(shù)據分析服務器
Facebook 在會上還分享了GPUs最新進展,近年來,GPU在高性能計算中發(fā)揮了重要作用。GPUs 最初是用于提升桌面PC性能,處理圖形運算,但是現(xiàn)在卻幫助提升全球一些性能最強大的超級計算機。
Facebook 使用GPUs給人工智能和機器學習數(shù)據分析帶來更強大的計算能力。其人工智能實驗室訓練神經網絡去解決新問題。這就需要強大的計算能力。
「我們已經在人工智能技術方面投入了很多。」Facebook 工程和基礎設施(Engineering and Infrastructure)部門 全球老大Jay Parikh說,「目前,人工智能應用于Facebook的Newsfeed,幫助我們提供更好的廣告服務。也能幫助用戶在日常生活中更安全地使用Facebook?!?/p>
△ Facebook 的 Big Sur
Big Sur 系統(tǒng)使用了英偉達Tesla 加速計算平臺,擁有8個高性能GPUs,每個功率達300瓦特,在多個PCI-e連接之間靈活配置。Facebook已經優(yōu)化了這些新型服務器的發(fā)熱和功耗控制,使其可以與數(shù)據中心中配備標準CPU的服務器協(xié)同工作。
Big Sur 系統(tǒng)優(yōu)化了性能和反應時間,幫助Facebook處理更多的數(shù)據,極大地縮短了其訓練神經網絡的時間。
「性能有了極大的提升,」Parikh說,「我們在數(shù)月間就部署了數(shù)千臺這種機器。使得我們有能力將該技術應用于公司更多的產品實例?!?/p>
存儲:Just a buch of Flash
多年來,F(xiàn)acebook已經在用閃存來加速服務器引導驅動,提升緩存效率。隨著公司基礎設備進一步擴大規(guī)模,F(xiàn)acebook創(chuàng)造了一種新型「模塊」,在服務器運算中整合更多的閃存。Facebook已經改進了初代開放計算機——即Knox——的存儲驅動器,使用固態(tài)硬盤(SSDs)取代存儲硬盤存儲(HDDs),存儲單元從磁盤簇(JBOD)轉到了閃存簇(JBOF)。
Facebook和英特爾合作開發(fā)這種新型的閃存簇單元,稱之為Lighting,反應了使用NVMe帶來了速度提升,NVMe是為SSDs優(yōu)化的高速PCI總線接口。下面我們通過Parikh 在開放計算峰會上展示的幻燈片來看看具體的參數(shù)。
△ 參數(shù)
作為一個分散式(disaggregated)存儲設備,Lightning 支持各種不同的應用?!高@為我們正在開發(fā)的應用帶來了一個高性能存儲式的新型建造模塊。」Parikh說。Parikh表示將來會有更多存儲方面的創(chuàng)新,尤其是創(chuàng)新地使用非易失性存儲器(NVM)。
評論