新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 谷歌下月上線 A3 實例:搭載英偉達 H100,可提供 26 exaFlops AI 性能

谷歌下月上線 A3 實例:搭載英偉達 H100,可提供 26 exaFlops AI 性能

作者: 時間:2023-08-31 來源:IT之家 收藏

IT之家 8 月 31 日消息,Google Cloud 在今天召開的云 Next 大會上,宣布下月上線 A3 虛擬機實例。谷歌云在今年 5 月召開的 I / O 開發(fā)者大會上宣布 A3 實例,最大的亮點在于配備 Tensor Core GPU,滿足生成式 AI 和大語言模型的需求。

本文引用地址:http://www.butianyuan.cn/article/202308/450105.htm

IT之家此前報道,A3 實例采用了第 4 代英特爾至強可擴展處理器、2TB DDR5-4800 內(nèi)存,以及 8 張 “Hopper”GPU,通過 NVLink 4.0 和 NVSwitch 實現(xiàn)了 3.6 TBps 的對分帶寬。

新的 A3 超級計算機“專門用于訓(xùn)練和服務(wù)要求最苛刻的人工智能模型,這些模型為當今的生成人工智能和大型語言模型創(chuàng)新提供動力”。據(jù)介紹,這款超級計算機可以提供 26 exaFlops 的人工智能性能。

谷歌云在今天的發(fā)布會上還介紹了全新的 TPU v5e,是迄今為止最具成本效益和可訪問的云 TPU。這些 TPU 或定制 ASIC 旨在加速 AI 和 ML 工作負載。

SDxCentral 報道稱,TPU v5e 相比較前代,每美元的訓(xùn)練性能提高了一倍,每美元的推理性能提高了 2.5 倍。



關(guān)鍵詞: 英偉達 H100

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉