AMD 正式出擊，推出最新AI芯片挑戰(zhàn)英偉達(dá)

作者：時(shí)間：2023-06-15 來源：半導(dǎo)體產(chǎn)業(yè)縱橫

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

盡管近段時(shí)間，英偉達(dá)在 AI 領(lǐng)域嶄露頭角，但 AMD 今日的發(fā)布，勢(shì)必要在算力芯片領(lǐng)域掀起一場(chǎng)「腥風(fēng)血雨」。

本文引用地址：http://www.butianyuan.cn/article/202306/447698.htm

今天，AMD 數(shù)據(jù)中心和人工智能首映式上，推出了針對(duì)云和技術(shù)應(yīng)用程序的 Epyc 處理器，以及其 Instinct MI300 系列加速器的詳細(xì)計(jì)劃。

首先是新一代的 Epyc 處理器，Bergamo 是針對(duì)云原生應(yīng)用的產(chǎn)品線，也是第一款使用 Zen 4c 架構(gòu)的產(chǎn)品。

其次，AMD 還在活動(dòng)中展示了其最新的緩存堆疊 X 芯片，代號(hào)為 Genoa-X。Genoa-X 與具有相同內(nèi)核數(shù)的 Intel Xeon 的比較，性能提高了 2.2 倍和 2.9 倍。

最后，AMD 宣布新款 GPU 專用的 MI300X AI 加速器，并表示 MI300X 和 8-GPU Instinct 平臺(tái)將在第三季度出樣，并在第四季度推出。

在會(huì)議開始時(shí)，AMD 全球總裁兼 CEO 蘇姿豐表示：「今天，我們?cè)跀?shù)據(jù)中心戰(zhàn)略上又向前邁出了重要一步，因?yàn)槲覀償U(kuò)展了第四代 EPYC 處理器系列，為云和技術(shù)計(jì)算工作負(fù)載提供了新的領(lǐng)先解決方案，并宣布了與最大的云提供商的新公共實(shí)例和內(nèi)部部署?！?/span>

「人工智能是塑造下一代計(jì)算的決定性技術(shù)，也是 AMD 最大的戰(zhàn)略增長(zhǎng)機(jī)會(huì)。我們專注于加速 AMD AI 平臺(tái)在數(shù)據(jù)中心的大規(guī)模部署，計(jì)劃于今年晚些時(shí)候推出我們的 Instinct MI300 加速器，以及為我們的硬件優(yōu)化的企業(yè)級(jí) AI 軟件生態(tài)系統(tǒng)不斷壯大?！?/span>

AMD 再次讓人發(fā)出歡呼：「AMD YES！」

Bergamo

AMD 宣布為數(shù)據(jù)中心推出代號(hào)為 Bergamo 的第四代 EPYC(霄龍) 處理器。

Bergamo 是針對(duì)云原生應(yīng)用的產(chǎn)品線，也是第一款使用 Zen 4c 架構(gòu)的產(chǎn)品。Bergamo 在架構(gòu)進(jìn)行精簡(jiǎn)，但著重保有與 Zen 4 一脈相承的 x86 架構(gòu)，并重新設(shè)計(jì) L3 快取系統(tǒng)，相較完整的 Zen 4 架構(gòu)縮減 35% 的裸片面積。

AMD 的 Bergamo Epyc 處理器具有 128 個(gè)核心和 256 個(gè)線程，分布在八個(gè)核心復(fù)合芯片上

同時(shí)單一 CCD 具備 16 個(gè) Zen 4c，一顆 Bergamo 最多由 8 個(gè) CCD 構(gòu)成，具備最高 128 核心的特質(zhì)，采用臺(tái)積電 5nm 制程共有高達(dá) 820 億個(gè)晶體管。

Bergamo 芯片目前正在向大型云計(jì)算客戶「批量出貨」。Meta 就是其客戶之一，Meta 代表與 Lisa Su 一起上臺(tái)討論了 Meta 在其基礎(chǔ)架構(gòu)中使用 AMD EPYC 處理器的情況。

Meta 計(jì)劃為其基礎(chǔ)架構(gòu)使用 Bergamo，它的性能比上一代 Milan 芯片高出 2.5 倍。Meta 還將使用 Bergamo 作為其存儲(chǔ)平臺(tái)。

Genoa-X

AMD 在會(huì)議上展示了最新的緩存堆疊 X 芯片，代號(hào)為 Genoa-X。Genoa-X 主要針對(duì)高性能計(jì)算應(yīng)用程序，包括計(jì)算流體動(dòng)力學(xué)、電子設(shè)計(jì)自動(dòng)化、有限元分析、地震層析成像和其他帶寬敏感型工作負(fù)載。

AMD 于去年 6 月首次透露，Genoa-X 是 AMD 現(xiàn)在強(qiáng)制配備 V-cache 的 EPYC 服務(wù)器 CPU。

AMD 的 Genoa-X CPU 在每個(gè)芯片計(jì)算芯片上堆疊了 64MB SRAM 塊，總共有 1.1GB 的三級(jí)緩存

AMD 正在使用緩存芯片堆疊為其他常規(guī)的 Genoa Zen 4 CCD 添加更多的 L3 緩存，從而為 AMD 提供了一種生產(chǎn)高緩存芯片設(shè)計(jì)的新穎方法，而無需實(shí)際布置一個(gè)完整的獨(dú)立芯片。在這種情況下，Genoa/Genoa-X 芯片上有 12 個(gè) CCD，這允許 AMD 向芯片添加 768MB 的額外 L3 緩存。

這種高緩存 SKU 針對(duì)的是工作負(fù)載的利基細(xì)分市場(chǎng)，如上文提到的計(jì)算流體動(dòng)力學(xué)、電子設(shè)計(jì)自動(dòng)化等，這些工作負(fù)載特別受益于額外的緩存。AMD 表示 Genoa-X 可提供多達(dá) 96 個(gè)內(nèi)核和總計(jì)「1.1GB」的三級(jí)緩存。

Genoa-X 與具有相同內(nèi)核數(shù)的 Intel Xeon 的比較，緩存提升意味著在各種計(jì)算流體動(dòng)力學(xué)和有限元分析工作負(fù)載負(fù)載方面的性能提高了 2.2 倍和 2.9 倍。

MI300 正面決戰(zhàn)英偉達(dá) H100

接下來，Lisa Su 開始了今天的重頭戲——Instinct MI300。ADM 表示，AMD Instinct GPU 已經(jīng)為許多世界上最快的超級(jí)計(jì)算機(jī)提供動(dòng)力。

AMD Instinct MI300 于去年 6 月首次發(fā)布，并在 2023 年國(guó)際消費(fèi)電子展上進(jìn)行了更深入的詳細(xì)介紹，這是 AMD 在 AI 和 HPC 市場(chǎng)的重要一步。

AMD 展示「AMD Instinct MI300 系列加速器」（以下簡(jiǎn)稱 Instinct MI300 系列）。有純 GPU「AMD Instinct MI300X 加速器」（以下簡(jiǎn)稱 Instinct MI300X）和 APU（CPU+GPU）「AMD Instinct MI300A」（以下簡(jiǎn)稱 Instinct MI300A）兩款產(chǎn)品。

首先看來 Instinct MI300X，全新的 MI300X 服務(wù)器 GPU，它是 MI300A APU 的變體。Instinct MI300X 是繼傳統(tǒng) Instinct MI200 系列加速器之后的一款面向數(shù)據(jù)中心的 GPU，采用 CDNA 3，即傳統(tǒng) MI200 系列使用的 GPU 架構(gòu) CDNA 2 的后繼產(chǎn)品。

其將三個(gè) Zen 4 芯片替換為三個(gè) CDNA 3 芯片，并增加了 64GB 的 HBM3，總?cè)萘繛?192GB。與 MI250 相比，提高了 8 倍的性能和 5 倍的效率。

Instinct MI300X 由 12 個(gè)不同的小芯片組成，其中包括八個(gè) GPU 和幾個(gè) I/O 芯片，總共有令人驚訝的 1530 億個(gè)晶體管。

這款 Instinct MI300X 的一個(gè)模塊具有處理 LLM 的「Falcon-40B」400 億參數(shù)的能力。提供了 192GB 的 HBM3、5.2TB/s 的帶寬和 896GB/s 的 Infinity Fabric 帶寬。

MI300X 提供的 HBM 密度是 Nvidia H100 的 2.4 倍，HBM 帶寬是 H100 的 1.6 倍，這意味著 AMD 可以運(yùn)行比 Nvidia 芯片更大的模型。

Lisa Su 當(dāng)場(chǎng)對(duì)運(yùn)行 Hugging Face AI 模型的 MI300X 進(jìn)行了演示，讓寫了一首關(guān)于舊金山的詩。這是第一次在單個(gè) GPU 上運(yùn)行這么大的模型，單個(gè) MI300X 可以運(yùn)行一個(gè)高達(dá) 800 億個(gè)參數(shù)的模型。

再來看 Instinct MI300A，Instinct MI300A 是一款數(shù)據(jù)中心 APU，它混合了總共 13 個(gè)小芯片，其中許多小芯片是 3D 堆疊的。具有 24 個(gè) Zen 4 CPU 內(nèi)核、融合了 CDNA 3 圖形引擎和 8 個(gè) HBM3 內(nèi)存堆棧的單芯片封裝總計(jì) 128GB。

九個(gè)計(jì)算裸片混合了 5nm CPU 和 GPU，它們以 3D 方式堆疊在四個(gè) 6nm 基礎(chǔ)裸片之上，這些裸片是處理內(nèi)存和 I/O 流量以及其他功能的有源中介層。

總體來看，Instinct MI300A 擁有 1460 億個(gè)晶體管，是 AMD 投入生產(chǎn)的最大芯片。

此外，Lisa Su 還發(fā)布了 AMD Instinct 平臺(tái)，該平臺(tái)擁有 8 個(gè)采用行業(yè)標(biāo)準(zhǔn) OCP 設(shè)計(jì)的 MI300X，提供總計(jì) 1.5TB 的 HBM3 內(nèi)存。

MI300A，CPU+GPU 機(jī)型，現(xiàn)已出樣。MI300X 和 8-GPU Instinct 平臺(tái)將在第三季度出樣，并在第四季度推出。最先進(jìn)的人工智能 GPU MI300X 將于今年晚些時(shí)候開始向部分客戶發(fā)貨。

AMD Pensando DPU

除此之外，AMD 已經(jīng)公布了「AMD Pensando DPU」。Pensando DPU 是 AMD 在去年（2022 年）5 月宣布完成收購(gòu)的 Pensando Systems 衍生出來的產(chǎn)品，可以擺脫這種處理，提高整個(gè)數(shù)據(jù)中心的 CPU 處理能力。可以說，該產(chǎn)品與 NVIDIA 稱為 DPU、Intel 稱為 IPU 的產(chǎn)品具有相同的功能。

此次除了在數(shù)據(jù)中心和 AI 技術(shù)首映會(huì)上展示之外，還公開了下一代 DPU 產(chǎn)品「Giglio」（開發(fā)代號(hào)，Giglio）的存在。據(jù) AMD 稱，與目前的同類產(chǎn)品相比，它將提供更高的性能和能效，并將于 2023 年底上市。

此外，AMD 宣布將開始向客戶提供 Pensando Software-in-Silicon Developer Kit (Pensando SSDK) 作為 AMD Pensando DPU 的軟件開發(fā)套件。因此，AMD 解釋說，將有可能將使用 Pensando DPU 的網(wǎng)絡(luò)虛擬化和安全功能等功能整合到軟件中。

新聞中心

AMD 正式出擊，推出最新AI芯片挑戰(zhàn)英偉達(dá)

Bergamo

Genoa-X

MI300 正面決戰(zhàn)英偉達(dá) H100

AMD Pensando DPU

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)