新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 數(shù)據(jù)中心加速芯片需求大爆發(fā),F(xiàn)PGA正領跑市場

數(shù)據(jù)中心加速芯片需求大爆發(fā),F(xiàn)PGA正領跑市場

作者: 時間:2022-12-16 來源:Mouser 收藏

中國信通院《白皮書2022》報告顯示,2021年全球市場規(guī)模超過679億美元,較2020年增長9.8%。隨著數(shù)據(jù)視頻化趨勢加強,以及遠程辦公普及程度提高,市場呈現(xiàn)出穩(wěn)健增長的趨勢。但這也帶來聯(lián)網(wǎng)數(shù)據(jù)的爆炸式增長,對數(shù)據(jù)中心的數(shù)據(jù)處理能力提出巨大挑戰(zhàn)。各種加速方案因而成為數(shù)據(jù)中心不可或缺的應用。

本文引用地址:http://butianyuan.cn/article/202212/441708.htm


數(shù)據(jù)中心加速解決方案


中國信通院《數(shù)據(jù)中心白皮書2022》報告顯示,2021年全球數(shù)據(jù)中心市場規(guī)模超過679億美元,較2020年增長9.8%。隨著數(shù)據(jù)視頻化趨勢加強,以及遠程辦公普及程度提高,數(shù)據(jù)中心市場呈現(xiàn)出穩(wěn)健增長的趨勢。但這也帶來聯(lián)網(wǎng)數(shù)據(jù)的爆炸式增長,對數(shù)據(jù)中心的數(shù)據(jù)處理能力提出巨大挑戰(zhàn)。各種加速方案因而成為數(shù)據(jù)中心不可或缺的應用。


在數(shù)據(jù)中心里,加速芯片主要應用于三個方面:計算、存儲和網(wǎng)絡。其中,傳統(tǒng)的GPU芯片,以及新興的DPU、APU等加速芯片能夠解決一部分需求,剩下很大一部分加速需求都是基于來解決。


根據(jù)Semico Research在2019年提出的預測,2018年-2023年全球數(shù)據(jù)中心加速卡市場規(guī)模將從28.4億美元增長至211.9億美元,年復合增長率高達49.47%,是其中增速最快的細分產(chǎn)品,需求主要來自企業(yè)級工作負載加速應用。


本文我們就來具體看一下,為什么能夠在數(shù)據(jù)中心加速領域領跑?具體的優(yōu)勢有哪些?并為大家推薦貿(mào)澤電子官網(wǎng)在售的可用于數(shù)據(jù)中心加速的FPGA產(chǎn)品。


為何FPGA適合數(shù)據(jù)中心加速


在傳統(tǒng)數(shù)據(jù)中心部署方案中,計算和數(shù)據(jù)處理都是由CPU完成,存儲和網(wǎng)絡資源也是圍繞CPU進行部署。然而,由于人工智能和物聯(lián)網(wǎng)市場的爆發(fā),云端數(shù)據(jù)量呈指數(shù)級增長,CPU便成為系統(tǒng)規(guī)模和效率提升的瓶頸,GPU、FPGA、ASIC等高性能芯片開始涌入數(shù)據(jù)中心市場,其中FPGA的典型產(chǎn)品形態(tài)就是加速卡。


不過,對于FPGA產(chǎn)品而言,數(shù)據(jù)中心算是一個比較新的應用領域。比如,已經(jīng)被AMD收購的賽靈思在2018年伊始才正式宣布“數(shù)據(jù)中心優(yōu)先”的發(fā)展戰(zhàn)略。但是,憑借著高吞吐和低延遲的天然優(yōu)勢,再加上部署靈活,F(xiàn)PGA在數(shù)據(jù)中心一經(jīng)采用便迅速成為主流加速方案。


在數(shù)據(jù)中心應用里,F(xiàn)PGA能夠全面減輕CPU的任務負擔,包括計算、存儲和網(wǎng)絡。傳統(tǒng)數(shù)據(jù)中心的模型是基于CPU集群構(gòu)建,寶貴的CPU內(nèi)核被消耗殆盡,圍繞CPU配備的網(wǎng)絡接口控制器(NIC)等初步緩解資源也無法解決根本問題?;贔PGA的異構(gòu)計算體系此時開始顯現(xiàn)出優(yōu)勢,根據(jù)微軟Catapult項目公布的數(shù)據(jù),通過FPGA對應用于必應搜索引擎文件排名運算的服務器做加速,獲得了95%的吞吐量提升,處理必應的自定義算法速度提高了40倍,加速效果顯著。


29.jpg

圖1:FPGA加速必應的搜索排序過程

(圖源:微軟技術白皮書)


剖析微軟Catapult項目能夠發(fā)現(xiàn),數(shù)據(jù)中心的硬件加速器需要滿足幾個條件:


一、需要具備靈活性和可擴展性,以云計算為主要服務方式的數(shù)據(jù)中心,其需要處理的任務是不固定的,面向不同的任務,加速器要全部能夠自如地應對;


二、需要具備硬件資源虛擬化的能力,以完成和現(xiàn)有數(shù)據(jù)中心的同構(gòu)并行,而不需要對現(xiàn)有架構(gòu)進行大刀闊斧的修改;


三、需要具備分析推理的能力,提升較大應用模型部署的容錯率。


方案商在評估各種硬件加速器之后發(fā)現(xiàn),F(xiàn)PGA相較于其他硬件,可以提供更高的性能,更好的實時性,以及足夠的靈活性,可以根據(jù)未來算法與需求變更及時做調(diào)整。并且,F(xiàn)PGA虛擬化的軟件架構(gòu)和接口資源大幅提升了和現(xiàn)有運算體系的同構(gòu)屬性,在方案升級時具備明顯的成本優(yōu)勢。


我們再看一個具有代表性的例子——亞馬遜AWS F1,基于FPGA對公有云進行加速服務。AWS F1實例進一步優(yōu)化了FPGA在云服務加速方面的軟硬件功能,主要原因是公有云的用戶并不像私有云用戶一樣,具備強大的技術研發(fā)實力,并能夠得到FPGA廠商的一定支持。因此,在AWS F1項目里,亞馬遜將底層FPGA的邏輯資源抽象化,使得用戶不需要去擔心接口資源和IP部署等細節(jié)問題,同時以完整的FPGA開發(fā)配套工具幫助用戶實現(xiàn)對應用方案的加速。


亞馬遜AWS F1更好地體現(xiàn)了FPGA的高度定制化,這其實也是FPGA的天然優(yōu)勢,這種可編輯的特性也就是上面提到的靈活性,單個FPGA可以根據(jù)各種不用的應用重新配置,無需將特定的硬件變成ASIC,用戶可以在機器學習、網(wǎng)絡、安全等各個關鍵環(huán)節(jié)使用FPGA。


除了國際廠商,在中國云服務市場,F(xiàn)PGA也廣受歡迎。目前,阿里云、騰訊云、百度云等國內(nèi)云服務公司都已經(jīng)在硬件加速方面選用FPGA。比如,我們看到騰訊于2017年就曾推出國內(nèi)首款高性能異構(gòu)計算基礎設施FPGA云服務器,這款采用異構(gòu)計算架構(gòu)的云服務器相較于傳統(tǒng)CPU服務器,性能提升在30倍以上。和亞馬遜的理念類似,通過這種FPGA云服務器,騰訊將只有大公司才能夠長期部署的FPGA帶入到大眾市場。目前,在騰訊云的硬件基礎設施里,F(xiàn)PGA已經(jīng)在計算、網(wǎng)絡、存儲三大重要節(jié)點充當加速器角色。


主流云服務大廠對FPGA的支持使得FPGA在國內(nèi)數(shù)據(jù)中心市場快速崛起。


根據(jù)Frost&Sullivan數(shù)據(jù),2020年中國應用于數(shù)據(jù)中心領域的FPGA芯片市場規(guī)模約 16.1億元,占中國FPGA芯片市場份額的10.7%,預計2021年-2025年的年均復合增速將達到16.6%。能夠看到,隨著FPGA的加速性能在數(shù)據(jù)中心獲得認可,未來該領域的市場增速非常快。


當然,必須要說明的是,在數(shù)據(jù)中心市場,F(xiàn)PGA以及其他所有硬件加速器都不是CPU的“革命者”,而是協(xié)作者。未來隨著數(shù)據(jù)中心計算體量和復雜度提升,CPU的精力會越來越多集中在復雜任務的調(diào)度和處理上,重復性和局部性的任務將更大規(guī)模地從CPU上轉(zhuǎn)移。而FPGA憑借上述提到的可編程、高吞吐、低延遲的特性,將承擔更多的加速任務,為機器學習等典型的人工智能應用賦能。


與FPGA靈活性類似的是,貿(mào)澤電子也為工程師提供了靈活多樣的檢索與支付方式,幫助工程師更快地購置好產(chǎn)品開發(fā)所需的元器件,從而提升研發(fā)效率。接下來,我們?yōu)榇蠹彝扑]幾款貿(mào)澤電子平臺在售的FPGA產(chǎn)品,它們都是硬件加速方面的好手。


業(yè)界首款FPGA加速卡支持軟件定義硬件


在數(shù)據(jù)中心領域,F(xiàn)PGA加速卡是一種典型的產(chǎn)品形態(tài),實現(xiàn)了基于FPGA的系統(tǒng)集成。和傳統(tǒng)的FPGA開發(fā)板不同,F(xiàn)PGA加速卡是更加完整的系統(tǒng)級方案。我們?yōu)榇蠹規(guī)淼牡谝豢町a(chǎn)品就是來自制造商AMD的Alveo? SN1000 SmartNIC加速卡,貿(mào)澤電子官網(wǎng)上,該器件的料號為A-SN1022-P4E-PQ。


30.jpg

圖2:SN1022-P4E-PQ

(圖源:貿(mào)澤電子)


Alveo? SN1000 SmartNIC加速度卡是一款提供軟件定義硬件加速的SmartNIC,在單一解決方案中集成有網(wǎng)絡連接、計算和存儲加速功能,實現(xiàn)面向數(shù)據(jù)中心領域的任務負擔轉(zhuǎn)移。并且,由于FPGA的可編程特性,這款加速卡支持各種廣泛的定制卸載,包括支持客戶構(gòu)建和第三方卸載。


Alveo? SN1000加速卡提供的硬件資源包括:


●   PCIe Gen 4 x8或Gen 3 x16

●   100G QSFP28 DA銅纜或光纖收發(fā)器

●   基于XCU26(XCU26-L2VSVA1365E)FPGA,采用Xilinx 16nm UltraScale+架構(gòu)

●   板載CPU:16個64位Arm Cortex-A72內(nèi)核,頻率為2.0GHz,具有8MB緩存

●   1個4GB x 72 DDR4-2666(處理器)

●   2個4GB x 72 DDR4-2666(FPGA)

●   總智能卡負載:75W

●   70W熱設計功耗(TDP)

●   被動散熱


在可編程方面,Alveo? SN1000加速卡支持全面協(xié)議級卸載加速定制、專用數(shù)據(jù)路徑以及便捷的P4高級語言編程,并提供P4工具套件Vitis Networks,可讓客戶自定義卸載和調(diào)整現(xiàn)有卸載,以處理新協(xié)議和應用,而無需更換硬件。這些定制性的硬件加速包括:開放式vSwitch和虛擬化加速(Virtio.net)的網(wǎng)絡加速;IPsec、kTLS和SSL/TLS安全加速;Virtio.blk、基于TCP的NVMe?、Ceph、壓縮和加密服務類型的存儲加速。通過這些加速功能,Alveo? SN1000加速卡幫助數(shù)據(jù)中心更好地應對機器學習、數(shù)據(jù)分析、視頻轉(zhuǎn)碼、視頻和圖像處理、基因組學、安全、金融計算等方面的加速需求。


高性能和高效率的Alveo? U50加速卡


第二款推薦產(chǎn)品同樣是一款來自AMD的FPGA加速卡——Alveo? U50加速卡,貿(mào)澤電子官網(wǎng)上該器件的料號為A-U50-P00G-LV-G。


31.jpg

圖3:A-U50-P00G-LV-G

(圖源:貿(mào)澤電子)


Alveo? U50數(shù)據(jù)中心加速器卡基于UltraScale+? 架構(gòu)打造,率先使用半高半長的外形尺寸和低于75W的低包絡功耗。該加速卡的產(chǎn)品規(guī)格如下:


●   UltraScale+架構(gòu)

●   半高、半長、單插槽薄型外形尺寸

●   查找表數(shù)量:872,000

●   HBM2內(nèi)存:8GB

●   HBM2帶寬:316GB/s1

●   網(wǎng)絡接口:1個QSFP28(100GbE)

●   時鐘精度:IEEE 1588

●   PCI express:PCIe Gen3 x 16、雙PCIe;Gen4 x 8、CCIX

●   被動散熱解決方案

●   功耗(TDP):75W


Alveo? U50加速卡擁有三大典型的產(chǎn)品優(yōu)勢:


●   首先是高性能和高效率,8GB HBM2、100GbE網(wǎng)絡和PCI Express 4.0為這款加速卡帶來了高速度,并通過支持4x10GbE、4x 25GbE或1x 40GbE、1x 100GbE的100G網(wǎng)絡,實現(xiàn)了低時延網(wǎng)絡功能;


●   其次是靈活應變,可全面應對計算、存儲和網(wǎng)絡方面的任務負載,隨著工作負載和算法通過可重新配置的架構(gòu)(與固定架構(gòu)不同)不斷發(fā)展,能夠以更大幅度地提高應用性能;


●   最后是方便易用,Alveo? U50加速卡經(jīng)過精心構(gòu)建,可為在云端或本地部署(可互換)的解決方案擴展架構(gòu)。


借助這三大典型的產(chǎn)品優(yōu)勢,Alveo? U50加速卡可為金融計算、機器學習、計算存儲以及數(shù)據(jù)搜索和分析領域的任務負載提供加速支持。


可用于10G至100G網(wǎng)絡的Virtex?-7 FPGA


隨著流量的不斷激增,各大數(shù)據(jù)中心如何經(jīng)濟、平滑地提升網(wǎng)絡帶寬性能,成為產(chǎn)業(yè)關注的熱門話題,以求在路由、交換、安全等方面實現(xiàn)全面調(diào)優(yōu)。接下來,我們?yōu)榇蠹彝扑]一款可用于10G至100G網(wǎng)絡的Virtex?-7 FPGA,同樣是來自制造商AMD,貿(mào)澤電子官網(wǎng)上該器件的料號為XC7VX485T-1FFG1761C。


Virtex?-7 FPGA是AMD 7系列FPGA中的一個系列,基于低功耗(HPL)、28nm、高K金屬柵極(HKMG)工藝技術打造,提供高達2M邏輯單元,具有出色的功耗性能比架構(gòu)、DSP性能以及I/O帶寬。Virtex?-7 FPGA提供超高端連接帶寬,總串行帶寬高達2.8TB/s,最多支持96 x 13.1G GT、16 x 28.05G GT、5,335 GMAC、68Mb BRAM、DDR3-1866。


1671016286125853.png

表1:AMD 7系列FPGA產(chǎn)品參數(shù)表

(圖源:AMD)


Virtex?-7 FPGA適合小尺寸、成本敏感、大容量應用,比如100GE線路卡。


幫助數(shù)據(jù)中心應對復雜多變的新場景


隨著數(shù)據(jù)中心里面的數(shù)據(jù)體量越來越大,并且行業(yè)應用對于低時延的要求越來越苛刻,F(xiàn)PGA通過對數(shù)據(jù)中心計算效能的提升,對通信網(wǎng)絡的持續(xù)優(yōu)化,推動了數(shù)據(jù)中心的智能化升級,并幫助其應對愈加復雜的新場景、新AI模型,最終幫助社會各行業(yè)實現(xiàn)更深層的數(shù)字化運營。在貿(mào)澤電子官網(wǎng)上,無論是FPGA產(chǎn)品還是基于FPGA實現(xiàn)的加速卡,都有豐富的產(chǎn)品選擇,借助這些高性能器件,開發(fā)人員可以為數(shù)據(jù)中心加速再加速。


來源:



評論


相關推薦

技術專區(qū)

關閉