收購(gòu)兩家公司后，AMD推出新型DPU

發(fā)布人：旺材芯片時(shí)間：2022-08-28 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

來(lái)源：內(nèi)容由半導(dǎo)體行業(yè)觀察（ID：icbank）編譯自hpcwire

AMD 剛剛完成對(duì) FPGA 供應(yīng)商Xilinx（2022 年 2 月）和 DPU 供應(yīng)商Pensando （2022 年 5 月）的收購(gòu)，日前在Hot Chips上，他們預(yù)覽了它所謂的 400 Gig Adaptive smartNIC SOC 。在日益擁擠和模糊的 smartNIC/DPU 領(lǐng)域，它是另一個(gè)競(jìng)爭(zhēng)者，區(qū)分兩者并不總是那么容易。

從 Xilinx 加入 AMD 的 Jaideep Dastidar 提出的這些設(shè)備類型的動(dòng)機(jī)與近年來(lái)Nvidia、Intel 和其他公司的演示非常相似。主機(jī) CPU 忙于處理家務(wù)（網(wǎng)絡(luò)、存儲(chǔ)、安全任務(wù)）。由于性能和帶寬需求的增加、資源的分解以及軟件定義一切的興起，這使情況變得復(fù)雜。

Dastidar 說(shuō)：“轉(zhuǎn)向 smartNIC 和 DPU 的原因是始于行業(yè)向軟件定義網(wǎng)絡(luò)的發(fā)展，它迅速擴(kuò)展到軟件定義的存儲(chǔ)，在你知道之前，你已經(jīng)擁有了軟件定義的一切. 同時(shí)，速度和饋送的無(wú)情發(fā)展仍在繼續(xù)，網(wǎng)絡(luò)帶寬迅速增加了 25、50、100、200 gig。虛擬化水平也擴(kuò)大了，你擁有虛擬機(jī)，個(gè)位數(shù) (VM) 已經(jīng)上升到 10 位，并且通過(guò)容器化，你正在處理 1000 多個(gè)虛擬實(shí)體。”

“所有這些都導(dǎo)致了 CPU 負(fù)擔(dān)過(guò)重的情況。因此，CPU 不是運(yùn)行多租戶應(yīng)用程序，而是被運(yùn)行數(shù)據(jù)中心基礎(chǔ)設(shè)施所吸收。因此，smartNIC 和 DPU 提供了幫助，因?yàn)樗鼈冇兄趶闹鳈C(jī) CPU 卸載這些工作負(fù)載，然后主機(jī) CPU 可以重新專注于多租戶云應(yīng)用程序。”Dastidar接著說(shuō)。

到目前為止，這是一個(gè)熟悉的信息。觀察市場(chǎng)如何演變將會(huì)很有趣。AMD 正在將其 smartNIC 推廣為一種靈活高效的 SOC，它在適當(dāng)?shù)那闆r下利用固定邏輯 ASIC 技術(shù)、在適當(dāng)情況下利用更靈活的可編程邏輯 (FPGA) 和嵌入式處理器內(nèi)核。當(dāng)然，AMD 將自己定位為所有三種技術(shù)（ASIC、FPGA 和 CPU/內(nèi)核）的強(qiáng)大供應(yīng)商。

與其他公司一樣，AMD 也在其系統(tǒng)中加入了先進(jìn)的安全管理。用例可能非常多樣，涵蓋網(wǎng)絡(luò)管理、存儲(chǔ)管理和安全性。對(duì) CXL 2.0 的支持值得注意。

“CXL 絕對(duì)是一項(xiàng)新興技術(shù)。在第二類設(shè)備中，您可以緩存主機(jī)內(nèi)存，也可以擁有加速的設(shè)備附加內(nèi)存?，F(xiàn)在，通過(guò)可編程邏輯，我們只是想提供靈活性，以便您可以將 smartNIC 作為傳統(tǒng)的 PCIe 端點(diǎn)連接，但您也可以探索用例。從 CXL 的角度來(lái)看，您需要大量的生態(tài)系統(tǒng)支持，因此我們只是在創(chuàng)建能力——?jiǎng)?chuàng)建基礎(chǔ)技術(shù)——以便人們可以去探索可能作為第二類 CXL 運(yùn)行得更好的不同用例設(shè)備，”Dastidar說(shuō)。

Dastidar 提供了 AMD 設(shè)計(jì)思維之旅：“我們決定采用傳統(tǒng)的硬件-軟件協(xié)同設(shè)計(jì)范式，并將其擴(kuò)展到硬件-軟件-可編程邏輯協(xié)同設(shè)計(jì)。您在右圖（上圖）中看到的內(nèi)容，在頂部，我們將 ASIC 邏輯應(yīng)用在它最擅長(zhǎng)的地方：加密卸載、DMA 卸載，甚至是完整的網(wǎng)絡(luò)數(shù)據(jù)平面卸載。然后，當(dāng)您按順時(shí)針?lè)较蚯斑M(jìn)時(shí)，我們添加了 ASIC 到可編程邏輯適配器，您開(kāi)始希望在其中進(jìn)行分層，例如custom header extensions。繼續(xù)順時(shí)針?lè)较颍€可以在可編程邏輯中完全熱添加或刪除新的加速器功能。然后，如果您想一直傾斜天平，我們還希望能夠讓 SOC 執(zhí)行完整的自定義數(shù)據(jù)平面卸載。

“繼續(xù)順時(shí)針?lè)较?。?dāng)您有需要與嵌入式處理子系統(tǒng)交互的可編程邏輯代理時(shí)，我們有軟件到可編程邏輯適配器接口，這樣您就可以創(chuàng)建與嵌入式處理器子系統(tǒng)交互的一致 IO 代理?，F(xiàn)在，嵌入式處理子系統(tǒng)的尺寸已被確定為運(yùn)行網(wǎng)絡(luò)控制平面。如果您注意到，這是我們第一次提到控制平面。與此同時(shí)，數(shù)據(jù)平面正在被完全執(zhí)行，無(wú)論是在 ASIC 邏輯還是可編程邏輯或兩者的組合中，”他說(shuō)。

在遙測(cè)功能（ telemetry functionality）方面，Dastidar 表示，雖然遙測(cè)數(shù)據(jù)是 SOC 范圍的，但嵌入式處理子系統(tǒng)是“收集所有遙測(cè)數(shù)據(jù)、合成數(shù)據(jù)、然后將其上傳到云管理平面（如果他們選擇）的最佳位置?！?/p>

SOC將采用臺(tái)積電的7nm工藝制造，由功能塊組成。雖然 Dastidar 提供了大量有關(guān)功能和支持的特性的材料，但他很少提及所需的編程工具是什么。

如上圖所示，AMD 已將這些設(shè)計(jì)理念映射到自適應(yīng) SOC 內(nèi)的特定子系統(tǒng)中。主機(jī)子系統(tǒng)包含主機(jī)連接和主機(jī)域加速。包含網(wǎng)絡(luò)連接和網(wǎng)絡(luò)域加速的網(wǎng)絡(luò)子系統(tǒng)。處理子系統(tǒng)包含所有嵌入式處理核心。

Dastidar 說(shuō)：“雖然這里以視覺(jué)方式顯示，但我希望您將可編程邏輯元件和內(nèi)存子系統(tǒng)視為具有芯片普遍連接和訪問(wèn)的芯片普遍資源。片上可編程網(wǎng)絡(luò)進(jìn)一步增強(qiáng)了這種連接性，[它]允許子系統(tǒng)到子系統(tǒng)的數(shù)據(jù)移動(dòng)，并且任何子系統(tǒng)都可以根據(jù)架構(gòu)選擇訪問(wèn)公共內(nèi)存位置?！?/p>

Dastidar 還遍歷了每個(gè)子系統(tǒng)。這是他對(duì)主機(jī)子系統(tǒng)的描述的片段。

“主機(jī)連接可以是單個(gè)主機(jī) PCIe Gen 5 x16 連接到 smartNIC。或者，它可以一直連接到 smartNIC 的四主機(jī) 4x Gen 5 x4 連接。此外，控制器支持 CXL 2.0，它們可以支持第一類、第二類或第三類 CXL 設(shè)備。現(xiàn)在，正如我之前提到的，PCIe 控制器已升級(jí)到最新的 PCIe ECN 安全標(biāo)準(zhǔn)。例如，PCIe CMA（組件測(cè)量和身份驗(yàn)證）、PCIe DOE（設(shè)備對(duì)象交換）、PCIe IDE（完整性和數(shù)據(jù)加密）和控制器還支持 TDISP，它允許受信任的 VM 以機(jī)密計(jì)算方式與端點(diǎn)通信， ”達(dá)Dastidar說(shuō)。

“中間的塊是可組合的 DMA 引擎。這是一個(gè)分層的數(shù)據(jù)移動(dòng)器。雖然它可以繼續(xù)進(jìn)行主機(jī)到卡 [和] 卡到主機(jī)數(shù)據(jù)移動(dòng)的傳統(tǒng)卸載，它還可以促進(jìn)子系統(tǒng)到子系統(tǒng)的數(shù)據(jù)移動(dòng)，并且它可以引導(dǎo)主機(jī)到卡的數(shù)據(jù)數(shù)據(jù)傳輸?shù)教囟ㄗ酉到y(tǒng)，無(wú)論是網(wǎng)絡(luò)子系統(tǒng)、可編程邏輯還是處理子系統(tǒng)。”

顯示其他三個(gè)子系統(tǒng)的幻燈片包含在文章的末尾。

還有很多東西需要消化和解包。Dastidar 沒(méi)有透露該產(chǎn)品何時(shí)推出。值得注意的是，新的 smartNIC 基于 Xilinx 的 Versal ACAP（自適應(yīng)計(jì)算加速平臺(tái)）smartNIC 架構(gòu)。在問(wèn)答期間，Dastidar 對(duì)有關(guān)區(qū)分 AMD 的新 smartNIC 與 Pensando DPU 和 Xilinx 的 Versal smartNIC 的問(wèn)題的回答有點(diǎn)模糊。

“[我們發(fā)現(xiàn)] Xilinx smartNIC 技術(shù)和 Pensando DPU 技術(shù)的結(jié)合非常相得益彰。數(shù)據(jù)中心的不同客戶有不同的參與模式?，F(xiàn)在 AMD 提供的這種廣泛的產(chǎn)品組合讓客戶可以選擇參與其中的任何一種模式。您知道數(shù)據(jù)中心中的部署不是同質(zhì)的。在某些情況下，客戶可能會(huì)發(fā)現(xiàn)基于自適應(yīng) SOC 的智能網(wǎng)卡對(duì)數(shù)據(jù)中心中的某個(gè)節(jié)點(diǎn)特別有吸引力，而 Pensando 的基于 DPU 的智能網(wǎng)卡也非常有吸引力。我們注意到的一個(gè)常見(jiàn)元素是對(duì)客戶易用性的高度關(guān)注。從文化的角度來(lái)看，在客戶如何與這個(gè) SOC 以及 Pensando 交互方面，無(wú)論是從自適應(yīng) SOC 來(lái)看，兩者都非常接近。有很多投資。

AMD 與 Xilinx 和 Pensando 的合并仍處于早期階段，產(chǎn)品線整合和協(xié)調(diào)尚未解決也許不足為奇。smartNIC/DPU 市場(chǎng)正迅速變得更加擁擠，這值得關(guān)注。