新聞中心

EEPW首頁 > 編輯觀點(diǎn) > 各大巨頭紛紛入局DPU: DPU真正的魅力何在?

各大巨頭紛紛入局DPU: DPU真正的魅力何在?

作者:陳玲麗 時(shí)間:2020-12-14 來源:電子產(chǎn)品世界 收藏

過去十年中,計(jì)算已經(jīng)不僅僅局限在個(gè)人電腦和服務(wù)器內(nèi),CPU和GPU已經(jīng)被廣泛地用于各個(gè)新型超大規(guī)模數(shù)據(jù)中心。這些數(shù)據(jù)中心通過功能強(qiáng)大的新型處理器連接在一起,( Data Processing Unit ,數(shù)據(jù)處理器)已經(jīng)成為了以數(shù)據(jù)為中心的加速計(jì)算模型的第三個(gè)計(jì)算單元。

本文引用地址:http://butianyuan.cn/article/202012/421172.htm

CPU用于通用計(jì)算,GPU用于加速計(jì)算,而數(shù)據(jù)中心中傳輸數(shù)據(jù)的則進(jìn)行數(shù)據(jù)處理。

截屏2020-12-14 22.32.45.png

歡迎來到啟用的數(shù)據(jù)革命時(shí)代

根據(jù)現(xiàn)今最著名的歷史學(xué)家之一Yuval Noah Harari的說法 ,人類面臨著四次重大革命:

截屏2020-12-14 22.33.46.png

· 公元前70,000年發(fā)生的認(rèn)知革命定義了語言的誕生和交流的能力。它也克服了尼安德特人,將智人帶到了舞臺(tái)的前列。

· 農(nóng)業(yè)革命發(fā)生在公元前10000年,它定義了人類馴養(yǎng)家畜和種植農(nóng)作物的能力,加速了人類人口的增長,推動(dòng)了城市的崛起。

· 科學(xué)革命是一系列事件,標(biāo)志著現(xiàn)代科學(xué)在早期現(xiàn)代時(shí)期的出現(xiàn),當(dāng)時(shí)數(shù)學(xué)、物理、天文學(xué)和科學(xué)的發(fā)展為我們現(xiàn)代生活方式奠定了基礎(chǔ)。

· 我們今天目睹的第四次革命是數(shù)據(jù)革命。

與之前的重大技術(shù)變革(例如個(gè)人計(jì)算機(jī)、客戶端服務(wù)器甚至虛擬化)不同,數(shù)據(jù)革命比以前的革命更隱蔽。這種轉(zhuǎn)變的核心是需要發(fā)動(dòng)下一次重大技術(shù)飛躍,其中機(jī)器學(xué)習(xí)是實(shí)現(xiàn)真正人工智能的起點(diǎn)。為了達(dá)到這個(gè)目標(biāo),我們需要處理大量的數(shù)據(jù)。

隨著我們進(jìn)入數(shù)據(jù)革命時(shí)代,對(duì)更高計(jì)算性能的不斷增長的需求正在推動(dòng)新的數(shù)據(jù)中心加速器和處理單元的誕生。以前CPU和GPU是計(jì)算能力的主要來源。數(shù)據(jù)量和復(fù)雜性的指數(shù)級(jí)增長推動(dòng)了以數(shù)據(jù)為中心的體系結(jié)構(gòu)和新型加速器單元的創(chuàng)建。

在以數(shù)據(jù)為中心的設(shè)計(jì)中,完整的基礎(chǔ)架構(gòu)堆棧(包括計(jì)算,存儲(chǔ)和網(wǎng)絡(luò))的架構(gòu)旨在快速有效地捕獲、分析、分類、管理和存檔大量數(shù)據(jù),新一代加速器應(yīng)運(yùn)而生 —— DPU。

CPU,GPU和DPU的組合是協(xié)同處理的下一個(gè)飛躍,它將利用這些革命性的硬件加速技術(shù)和軟件定義的可編程性來應(yīng)對(duì)以數(shù)據(jù)為中心和邊緣計(jì)算架構(gòu)的挑戰(zhàn),最大程度地提高投資回報(bào)率,并使不可能成為可能。

DPU有什么與眾不同之處?

為什么人們?nèi)绱丝释褂肈PU?首先,它更安全,因?yàn)榭刂破矫婵梢栽谙到y(tǒng)內(nèi)和系統(tǒng)集群之間與數(shù)據(jù)平面分離。目前服務(wù)器要處理的資料日益增多,除了原有的加解密、封包壓縮外,加速器也讓服務(wù)器要處理的資料量變得更龐大,就會(huì)造成原有CPU在處理安全能力表現(xiàn)上出現(xiàn)瓶頸。

DPU可以執(zhí)行原本需要CPU處理的網(wǎng)絡(luò)、存儲(chǔ)和安全等任務(wù)。這就意味著如果在數(shù)據(jù)中心中采用了DPU,那么CPU的不少運(yùn)算能力可以被釋放出來,去執(zhí)行廣泛的企業(yè)應(yīng)用。

DPU的主要作用就在于替代了數(shù)據(jù)中心原本用來處理分布式存儲(chǔ)和網(wǎng)絡(luò)通信的CPU處理器資源。在DPU之前,智能網(wǎng)卡(SmartNIC)正在網(wǎng)絡(luò)安全和網(wǎng)絡(luò)互連協(xié)議方面逐漸取代CPU。而現(xiàn)在DPU的出現(xiàn),相當(dāng)于是智能網(wǎng)卡的升級(jí)替代版本,一方面增強(qiáng)了智能網(wǎng)卡對(duì)網(wǎng)絡(luò)安全和網(wǎng)絡(luò)協(xié)議的處理能力,一方面又整合和加強(qiáng)了分布式存儲(chǔ)的處理能力,從而在這兩個(gè)領(lǐng)域更好地替代CPU,從而釋放CPU的算力給到其他更多應(yīng)用。

有了DPU的出現(xiàn),就可以先在DPU將大量的信息先做消化,接著再傳遞給CPU做其他的分配,如此一來能減少CPU約30%的消耗。

DPU是一種新型可編程處理器,是一種SOC(System On Chip),它結(jié)合了:

· 行業(yè)標(biāo)準(zhǔn)的、高性能及軟件可編程的多核CPU,通?;谝褢?yīng)用廣泛的Arm架構(gòu),與其的SOC組件密切配合。

· 高性能網(wǎng)絡(luò)接口,能以線速或網(wǎng)絡(luò)中的可用速度解析、處理數(shù)據(jù),并高效地將數(shù)據(jù)傳輸?shù)紾PU和CPU。

· 各種靈活和可編程的加速引擎,可以卸載AI、機(jī)器學(xué)習(xí)、安全、電信和存儲(chǔ)等應(yīng)用,并提升性能。

DPU引入機(jī)器學(xué)習(xí)算法可對(duì)數(shù)據(jù)進(jìn)行智能管理、控制和分析,從而減少閃存擦寫次數(shù),延長SSD使用壽命;還可減少盤內(nèi)計(jì)算和總線數(shù)據(jù)量,減輕主機(jī)CPU的負(fù)擔(dān)。所有這些DPU功能對(duì)于實(shí)現(xiàn)安全的、裸性能的、原生云計(jì)算的下一代云上大規(guī)模計(jì)算至關(guān)重要。

CPU、GPU、DPU將代表未來計(jì)算的三大支柱。這三者之間,CPU用于通用計(jì)算,GPU用于加速計(jì)算,而DPU在數(shù)據(jù)中心周圍移動(dòng)數(shù)據(jù)進(jìn)行數(shù)據(jù)處理。DPU可以和CPU、GPU相結(jié)合,構(gòu)成完全可編程的單一AI計(jì)算單元,實(shí)現(xiàn)前所未有的安全性和算力支持。

截屏2020-12-14 22.35.53.png

國際巨頭開始紛紛提前布局

自1950年代以來,中央處理器“ CPU”一直是每臺(tái)計(jì)算機(jī)或智能設(shè)備的核心;到1990年代以來,GPU或圖形處理單元扮演了重要角色。在過去的十年中,計(jì)算已經(jīng)擺脫了PC和服務(wù)器的繁瑣局限,CPU和GPU為龐大的新超大規(guī)模數(shù)據(jù)中心提供了動(dòng)力。然而最近幾年,隨著系統(tǒng)中的CPU承受越來越多的網(wǎng)絡(luò)和存儲(chǔ)工作負(fù)載,DPU已成為以數(shù)據(jù)為中心的加速計(jì)算模型的第三個(gè)成員。

根據(jù)THENEXTPLATFORM的分析指出,在2020年,在這個(gè)領(lǐng)域的玩家或者潛在玩家主要包括Broadcom、Intel、英偉達(dá)、Netronome、Pensando、Fungible和Xilinx,還包括云供應(yīng)商三大巨頭。

DPU是英偉達(dá)最新的一個(gè)布局。英偉達(dá)對(duì)DPU尤為重視,最主要的布局就在于2019年3月,花費(fèi)69億美元收購了以色列芯片公司Mellanox —— Mellanox在2015年9月以8.11億美元的天價(jià)收購了EZchip公司,該公司擁有多核芯片創(chuàng)業(yè)公司Tilera的資產(chǎn),Tilera是最早使用知識(shí)產(chǎn)權(quán)的高度并行SmartNIC實(shí)施之一,該實(shí)施源自更早的MIT研究項(xiàng)目。

Mellanox所擅長的正是為服務(wù)器、存儲(chǔ)和超融合基礎(chǔ)設(shè)施提供包括以太網(wǎng)交換機(jī)、芯片和InfiniBand智能互連解決方案在內(nèi)的大量的數(shù)據(jù)中心產(chǎn)品。英偉達(dá)的GPU與Mellanox的互連技術(shù)結(jié)合,可以使得數(shù)據(jù)中心工作負(fù)載將在整個(gè)計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)堆棧中得以優(yōu)化,并能實(shí)現(xiàn)更高的性能、更高的利用率和更低的運(yùn)營成本。

黃仁勛把Mellanox的技術(shù)看作是公司的“X因素”,也就是把數(shù)據(jù)中心改造成一個(gè)可以解決高性能計(jì)算要求的大型處理器架構(gòu)。而如今我們看到DPU的出現(xiàn),已經(jīng)是具有這一架構(gòu)雛形的一種嘗試了。

英偉達(dá)在DPU上的技術(shù)突破,是在收購Mellanox之后,在這家公司的硬件基礎(chǔ)上開發(fā)出BlueFeild系列的兩款DPU —— 英偉達(dá)BlueField-2 DPU與BlueField-2X DPU。

截屏2020-12-14 22.37.40.png

英偉達(dá)發(fā)力DPU建設(shè)的深層目的:一個(gè)是DPU試圖再一次復(fù)制GPU替代顯示加速卡成為通用顯示芯片的路徑;再一個(gè)是DOCA試圖再一次復(fù)制CUDA在GPU通用化過程中所起到的開創(chuàng)生態(tài)之功。

與此同時(shí),隨著數(shù)據(jù)中心網(wǎng)絡(luò)中傳送的數(shù)據(jù)量以每年25%的速度增長,英特爾也對(duì)DPU很感興趣。因?yàn)轭A(yù)算不能以這種速度增長,而且由于對(duì)原始CPU計(jì)算的偏見投資(與構(gòu)建平衡的系統(tǒng)以更充分地利用可用的計(jì)算能力相反),網(wǎng)絡(luò)通常不超過分布式成本的10%系統(tǒng)。面對(duì)所有這些壓力,英特爾必須創(chuàng)新并幫助改善網(wǎng)絡(luò),英特爾認(rèn)為集成顯得很重要。

在DPU上,英特爾主要是將CPU和FPGA結(jié)合在一起,但英特爾并自己做,而是由Inventec和Silicom制造的。前者對(duì)于hyperscalers和云構(gòu)建者來說是日益重要的ODM,而后者則是過去二十年來的網(wǎng)絡(luò)接口供應(yīng)商。

另外,英特爾收購了深度學(xué)習(xí)芯片公司Nervana Systems,以及移動(dòng)和嵌入式機(jī)器學(xué)習(xí)公司Movidius,給未來的深度學(xué)習(xí)下了重注。而英特爾所做的這一切,正是在為未來適應(yīng)深度學(xué)習(xí)的數(shù)據(jù)流(DPU)架構(gòu)升級(jí)布局。

越來越多供應(yīng)商紛紛涌入DPU架構(gòu)。DPU能否演繹CPU和GPU的佳話?十年前,隨著硬件加速技術(shù)的第一次重大沖擊,我們對(duì)GPU產(chǎn)品充滿了興趣?,F(xiàn)在,隨著FPGA擴(kuò)展到超過300萬個(gè)邏輯單元,F(xiàn)PGA得以與其他可組合的處理模塊緊密地結(jié)合在一起,以實(shí)現(xiàn)網(wǎng)絡(luò)、內(nèi)存、存儲(chǔ)和計(jì)算。有了這些進(jìn)步,我們開始認(rèn)識(shí)到第二次硬件加速浪潮的形成。讓我們靜待其變。

英偉達(dá)挑戰(zhàn)英特爾,距離還有多遠(yuǎn)

另外一個(gè)值得注意的是英偉達(dá)提出配合DPU處理器的軟件開發(fā)工具包 —— DOCA(Data-Center-Infrastructure-On-A-Chip Architecture)。英偉達(dá)的專家將DOCA類比為數(shù)據(jù)中心服務(wù)器領(lǐng)域的CUDA,其意圖在于幫助開發(fā)人員在DPU加速的數(shù)據(jù)中心基礎(chǔ)設(shè)施上構(gòu)建相應(yīng)的應(yīng)用程序,從而豐富DPU的應(yīng)用開發(fā)生態(tài)。

如果和不久前英偉達(dá)收購ARM的消息結(jié)合起來,我們看到英偉達(dá)的一個(gè)重要考量,就是以ARM架構(gòu)的CPU為核心,從服務(wù)器的應(yīng)用加速擴(kuò)展到服務(wù)器的全部應(yīng)用場景,從而實(shí)現(xiàn)在數(shù)據(jù)中心服務(wù)器領(lǐng)域的更大突破,目標(biāo)自然是英特爾CPU為代表的X86服務(wù)器生態(tài)。

自從英偉達(dá)開始收購ARM,外界能夠看到英偉達(dá)已經(jīng)多次顯示出其試圖利用ARM處理器進(jìn)一步占領(lǐng)數(shù)據(jù)中心服務(wù)器市場的決心,而集成了ARM核心的DPU將成為其打入數(shù)據(jù)中心存量市場取代X86 CPU的第一個(gè)切入點(diǎn)。

英偉達(dá)推出DPU來切入這個(gè)市場,而非直接用ARM核心CPU來與X86 CPU直接競爭,其實(shí)是一種比較討巧的做法,相當(dāng)于用集成了網(wǎng)絡(luò)、存儲(chǔ)、安全等任務(wù)的下一代CPU產(chǎn)品來達(dá)到逐漸替換CPU的目的,即使其中所內(nèi)涵的ARM CPU性能無法對(duì)標(biāo)同一代的X86 CPU,但是整體機(jī)由于在DPU SoC上集成了專用的處理加速模塊,因此總體性能一定是超過X86 CPU的。

但是英偉達(dá)想要在中高端處理器市場來挑戰(zhàn)英特爾,還要面臨一系列的困難。首先,正是英偉達(dá)的GPU與X86 CPU已經(jīng)形成一種非常穩(wěn)定的強(qiáng)互補(bǔ)關(guān)系。英偉達(dá)想要采用基于ARM架構(gòu)的處理器做高端服務(wù)器,還需要ARM處理器性能出現(xiàn)大幅的提升,而現(xiàn)在這一進(jìn)程并不明朗。

英偉達(dá)在數(shù)據(jù)中心領(lǐng)域的成功與否,都與能否實(shí)現(xiàn)數(shù)據(jù)中心的規(guī)?;\(yùn)算有關(guān),從發(fā)展自研的DGX系列服務(wù)器到整合Mellanox的技術(shù),再到借助ARM生態(tài)發(fā)展全新的數(shù)據(jù)中心計(jì)算架構(gòu),都是為轉(zhuǎn)型數(shù)據(jù)中心業(yè)務(wù)所作的準(zhǔn)備。當(dāng)然,想要實(shí)現(xiàn)這一目標(biāo),還要看下英特爾如何應(yīng)對(duì)。

英特爾早已為應(yīng)對(duì)英偉達(dá)的種種挑戰(zhàn)進(jìn)行了相應(yīng)的回應(yīng)和布局。早在2017年,英特爾就宣布要開發(fā)全棧的GPU產(chǎn)品組合,而預(yù)計(jì)明年英特爾的首批GPU將在使用GPU的各個(gè)市場上發(fā)布。

目前來說,數(shù)據(jù)中心當(dāng)中,95%左右的GPU仍然還是連接到x86的CPU之上,英偉達(dá)如果單純只是做GPU的增量,仍然無法撼動(dòng)英特爾在數(shù)據(jù)中心服務(wù)器的霸主地位。

數(shù)據(jù)中心業(yè)務(wù)對(duì)于英特爾來說,也正在成為其最核心的業(yè)務(wù)組成。2019年Q4英特爾的數(shù)據(jù)中心業(yè)務(wù)超越PC業(yè)務(wù),成為其收入的主要來源;而在今年,英特爾對(duì)其技術(shù)組織和執(zhí)行團(tuán)隊(duì)的重組,也被外界視為全面轉(zhuǎn)型數(shù)據(jù)中心業(yè)務(wù)的開始。

可以想見在未來的數(shù)據(jù)中心處理器業(yè)務(wù)上,英偉達(dá)將迎來英特爾最為強(qiáng)勁的保衛(wèi)戰(zhàn)和反擊戰(zhàn),而廣大的服務(wù)器集成商或?qū)⒊蔀檫@場角力賽的受益方。

英偉達(dá)還要面對(duì)ADM這一新對(duì)手的追趕,不久前ADM曝出要花費(fèi)300億美金收購賽靈思,就被看作是叫板英特爾,阻擊英偉達(dá)的雙戰(zhàn)略。

除此之外,英偉達(dá)還要在數(shù)據(jù)中心處理器業(yè)務(wù)中面臨來自客戶自研芯片的挑戰(zhàn)。云服務(wù)商本身也不愿意完全將自身的計(jì)算核心完全交給英偉達(dá),無論是AWS、還是谷歌、阿里巴巴、華為,都已經(jīng)在布局自己的云端處理器。

數(shù)據(jù)中心已經(jīng)成為英特爾、英偉達(dá)、AMD這些老牌芯片巨頭未來爭奪的主戰(zhàn)場,DPU是數(shù)據(jù)中心戰(zhàn)場中重要一役。

作為一個(gè)“芯”生事物,走穩(wěn)是當(dāng)下的要?jiǎng)?wù)。DPU還在早期階段,這走的或是類似GPU的革命路線。GPU剛出來時(shí)業(yè)界均不看好,但英偉達(dá)卻矢志不渝,不斷迭代和優(yōu)化,最終GPU一路狂奔,到最后全面接管了圖形圖像的顯示控制,并在AI時(shí)代成為主力核心。但DPU真的會(huì)成另一個(gè)GPU嗎?



關(guān)鍵詞: DPU

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉