新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 編輯觀點 > 數(shù)據(jù)中心加速器芯片年增50%,Achoronix聯(lián)手BittWare推出FPGA加速卡

數(shù)據(jù)中心加速器芯片年增50%,Achoronix聯(lián)手BittWare推出FPGA加速卡

作者:王瑩 時間:2019-11-07 來源:電子產(chǎn)品世界 收藏

數(shù)據(jù)中心加速器的芯片市場預測

本文引用地址:http://www.butianyuan.cn/article/201911/406845.htm

數(shù)據(jù)中心市場的加速芯片主要包括CPU、GPU、和ASIC等。據(jù)Semico Research于2019年5月的預測,從2018年到2023年的5年間,數(shù)據(jù)中心加速器市場預計將從28.4億美元增長211.9億美元,年均增長率為49.47%。其中,預計將是年均增長率最高的細分市場(如下圖),該增長將由企業(yè)級工作負載加速應用驅(qū)動。

1573118545227812.png

數(shù)據(jù)加速可以分成計算、網(wǎng)絡(luò)和存儲三大類。有一部分是GPU可以做的,但是另外很大一部分更適合于用來做加速。

業(yè)界普遍認為的性能對比顯示,相比于傳統(tǒng)CPU,F(xiàn)PGA提升的性能是10~100倍,倍數(shù)變化主要來自不同的應用。不僅如此,在提高性能的同時,F(xiàn)PGA的功耗也會大幅降低。

從市場上來看,這幾年FPGA的應用越來越多。從下圖右可以看出,F(xiàn)PGA和服務(wù)器是新的技術(shù),目前正處于上升期。

1573118579776761.png

業(yè)界的Tier 1客戶,諸如亞馬遜和微軟的數(shù)據(jù)中心在二三年前就已經(jīng)把FPGA加速方案用到他們的數(shù)據(jù)中心。只不過因為他們是Tier 1,工程師資源和軟件都有雄厚的實力,所以可以把芯片直接做進服務(wù)器主板里,即嵌入到他們的硬件系統(tǒng)中。但是對于很多Tier 2和Tier 3的OEM(生產(chǎn)商),或一些小型的數(shù)據(jù)中心及純做軟件的客戶,并不具備這樣的工程資源,所以可以通過采購基于標準的PCIe接口的FPGA,快速地部署到自己的業(yè)務(wù)和應用中。

數(shù)據(jù)中心部署FPGA加速方案有很多好處。①效率方面,F(xiàn)PGA相對于GPU和CPU有更高的能效比。②FPGA可以根據(jù)客戶的特殊需求重新配置。③FPGA加速卡可以快速部署,使客戶的實驗室應用快速地推向市場,而無需把更多的精力和資源放在底層的開發(fā)上。④對于hyperscaler(超大規(guī)模廠商),也可以做大規(guī)模的部署。

采用Speedster7t獨立FPGA芯片的VectorPath加速卡

2019年10月,基于FPGA的數(shù)據(jù)加速器件和高性能嵌入式FPGA(eFPGA)半導體知識產(chǎn)權(quán)(IP)的領(lǐng)導性企業(yè)Achronix半導體公司,與Molex旗下的一家領(lǐng)先企業(yè)級FPGA加速器產(chǎn)品供應商BittWare聯(lián)合宣布:推出面向高性能計算和數(shù)據(jù)加速應用的FPGA加速卡。

1573118666713177.png

新推出的VectorPath S7t-VG6加速卡搭載了Achronix采用7nm工藝打造的Speedster7tAC7t1500獨立FPGA芯片,它在同類PCIe FPGA加速卡中,提供了目前業(yè)界最高性能的接口。這些高性能接口包括1x400GbE和2x100GbE接口,以及總帶寬為4Tbps的8組GDDR6的板上存儲器,使該加速卡成為高帶寬數(shù)據(jù)加速應用的理想選擇。

為此,Achronix市場營銷副總裁Steve Mensor和Molex副總裁Sam Bichara向電子產(chǎn)品世界記者介紹了其特色。

1573118695749293.png

圖 從左至右:Achronix市場營銷副總裁Steve Mensor,Molex副總裁Sam Bichara

VectorPath加速卡是基于Achronix新一代的7t的高性能,針對高帶寬優(yōu)化的一個FPGA。優(yōu)勢有兩點:①二維的高速片上網(wǎng)絡(luò),②針對人工智能、機器學習優(yōu)化的MLR單元(如下圖)。

1573118731569161.png

因此,數(shù)據(jù)中心開發(fā)人員可以不用關(guān)注硬件,只要采用現(xiàn)成可用的硬件,加上自己的軟件、算法就可實現(xiàn)應用,這樣就可以大大加速部署和開發(fā)。

Achronix的合作伙伴BittWare非常有實力:有約30年的FPGA加速卡的設(shè)計和生產(chǎn)制造經(jīng)驗,于2018年被Molex收購,成為更大規(guī)模公司——Molex的子公司,可以充分利用Molex更廣闊的技術(shù)支持和銷售團隊服務(wù)客戶。

VetcorPath加速卡所具有的功能

VectorPath加速卡系專為高性能和高帶寬數(shù)據(jù)應用而設(shè)計,具有以下硬件功能:400GbE QSFP-DD和100GbE QSFP56接口;8組GDDR6存儲器可提供4 Tbps的總帶寬;1組帶有錯誤檢查和糾正(ECC)功能的、運行頻率為2666MHz的DDR4存儲器;Speedster7t FPGA芯片集成了帶寬為20 Tbps的二維片上網(wǎng)絡(luò)(NoC);692K的6輸入查找表(LUT);40K Int8 MAC提供高于80 TOps的算力;OCuLink – 用于連接擴展卡的4通道PCIe Gen 4連接器。

VectorPath加速卡包括一整套Achronix的ACE開發(fā)工具,以及BittWare的基板管理控制器和開發(fā)工具包,其中包括API、PCIe驅(qū)動程序、診斷自測和應用示例設(shè)計,以提供快速的、開箱即用的體驗。

TeraBox FPGA服務(wù)器

TeraBox是基于FPGA的服務(wù)器(如下圖)。在過去BittWare注意到,客戶在買獨立的FPGA芯片,或者是基于FPGA板卡的加速卡時,獨立的板卡放在服務(wù)器中進行設(shè)計,但是對于很多Tier 2、Tier 3甚至更小的客戶,沒有時間、精力以及工程資源去把FPGA卡給集成到服務(wù)器中,因此有一部分客戶需要更高的集成,這樣客戶只需簡單的配置就可以應用起來。

1573118788192859.png

TeraBox主要有兩大類客戶,一類是有特殊需求的客戶,他需要把上層軟件快速部署到業(yè)務(wù)中,或客戶需要快速地去展示他們的軟件。另一類是對于一些IT經(jīng)理,他的技術(shù)水準不是那么深,因此無需關(guān)注底層,還可以降低風險,同時可以簡單部署,縮短整個業(yè)務(wù)的上線時間。

采購TeraBox的另一優(yōu)勢是:傳統(tǒng)的FPGA加速卡,一般只提供一年的質(zhì)保和技術(shù)服務(wù),但是服務(wù)器一般是3年。

與競品的差異化

除了Achronix之外,另外兩大FPGA廠商此前已推出了加速卡;2019年下半年,兩大FPGA廠商忙于發(fā)布各自的“統(tǒng)一軟件開發(fā)平臺”,Achronix有類似的軟件平臺產(chǎn)品嗎?

實際上,競品的芯片不僅有FPGA、處理器(Arm SoC),還有另外的處理器(例如AI引擎)等。例如AI引擎,X公司的AI引擎底層是Synopsys公司的矢量處理器,但是這種矢量處理器跟Arm CPU是不同架構(gòu)的處理器,再加上外部的高速接口,客戶要面對3種不同的硬件底層。

“統(tǒng)一軟件平臺”從表面上看是用同一個軟件的思維去開發(fā),但是作為開發(fā)者,處理數(shù)據(jù)時要考慮哪部分放在FPGA里,哪部分放在CPU里,哪部分放在AI引擎/矢量處理器;另外要考慮互相之間的數(shù)據(jù)怎樣去流動,而不是只是簡單的有一個工具讓你去用。因此,怎樣讓設(shè)計者很好地利用你的架構(gòu),對于軟件工程師是非常有挑戰(zhàn)的。

對于Achronix而言,走的是另外一個方向:對傳統(tǒng)的FPGA做了很多優(yōu)化,諸如二維的高速網(wǎng)絡(luò);另外,為了提高算力,雖然名字叫機器學習處理器(MLP),但它不是處理器,它實際上最底層是一種乘累加陣列(MAC,如下圖),是硬件。所以所有底層的思維還是硬件的思維。

1573118835323881.png

圖 MLP架構(gòu):專為計算密集的人工智能/機器學習(AI/ML)應用而優(yōu)化的Speedster7t

當然Achronix也有開發(fā)工具,但是整個底層架構(gòu)是硬件架構(gòu),沒有不同類型的單元。Achronix的開發(fā)思路是讓原有的FPGA工程師很容易地去用Achronix的平臺,而且Achronix的平臺性能有大幅的提升,甚至軟件工程師通過Achronix的工具也可以很容易去用這個硬件平臺。

總之,Achronix的思路是延續(xù)傳統(tǒng)模式,在傳統(tǒng)模式上做進一步的優(yōu)化。即硬件軟件化——有很容易用起來的硬件,好像用軟件一樣。例如Speedster7t的二維片上網(wǎng)絡(luò)(如下圖),讓整個的硬件的設(shè)計,更像軟件的思維去做。

另外,關(guān)于競品的加速卡,例如I公司,采用的存儲是HBM2,而Achronix采用的是GDDR6,特點是速度快,同時價格便宜(相對于目前業(yè)界通用的HBM2,價格會便宜很多),而且HBM2實現(xiàn)起來也比較復雜,需要封裝到FPGA上,制造也比較困難。

1573118865283508.png

上市時間和售價

VectorPath現(xiàn)在就可以接受訂單,預計在2020年第2季度發(fā)貨到客戶。在客戶拿到這個加速卡之前,客戶現(xiàn)在就可以開始做開發(fā)。加速卡的價格是7500美元。

總結(jié)

對于數(shù)據(jù)中心、邊緣計算等需要計算加速的領(lǐng)域,整個硬件加速市場正在快速增長,CPU已經(jīng)趕不上性能的需求,F(xiàn)PGA是一種高效選擇。

除了極少數(shù)超大數(shù)據(jù)中心有能力和用量可支撐自己建立FPGA團隊,包括硬件團隊去開發(fā)加速卡以外,絕大部分的Tier 2或Tier 3需要去外部采購加速卡,包括相應的底層軟件。因此,F(xiàn)PGA廠商紛紛祭出FPGA加速卡。Achronix和BittWare聯(lián)手推出了采用Speedster7t獨立FPGA芯片的VectorPath加速卡,可以快速部署,簡單易用。相比競品,VectorPath還具有超高性能的特點。

1573119714916133.png



關(guān)鍵詞: FPGA 加速卡

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉