NVIDIA發(fā)表新款A(yù)I平臺(tái) 將HPC數(shù)據(jù)中心停機(jī)時(shí)間降到最低
NVIDIA今日宣布將推出 NVIDIA Mellanox UFM Cyber-AI 平臺(tái),這款平臺(tái)將利用搭載人工智能 (AI) 的分析功能來(lái)偵測(cè)安全威脅和運(yùn)作問(wèn)題,以及預(yù)測(cè)網(wǎng)絡(luò)故障等情況,進(jìn)而將 InfiniBand 數(shù)據(jù)中心的停機(jī)時(shí)間降到最低。
NVIDIA指出,過(guò)去使用 UFM 平臺(tái)產(chǎn)品組合來(lái)管理 InfiniBand 系統(tǒng),已有近十年的時(shí)間,而這款最新產(chǎn)品加入 AI 技術(shù),運(yùn)用實(shí)時(shí)與歷史遙測(cè)及作業(yè)負(fù)載數(shù)據(jù),學(xué)習(xí)數(shù)據(jù)中心的運(yùn)行節(jié)奏和網(wǎng)絡(luò)工作量處理模式。此平臺(tái)在這個(gè)基礎(chǔ)上追蹤系統(tǒng)健全及網(wǎng)絡(luò)修改情況,以及偵測(cè)效能表現(xiàn)下降、使用情況和配置文件的變化情形。
新平臺(tái)會(huì)提醒管理員系統(tǒng)與應(yīng)用程序的異常行為,以及潛在的系統(tǒng)故障和威脅,并且執(zhí)行修正。如果發(fā)現(xiàn)有黑客企圖進(jìn)入系統(tǒng),以運(yùn)行不受歡迎的應(yīng)用程序(例如加密貨幣挖礦等情況)等安全情況,也會(huì)通知管理員。如此便降低了數(shù)據(jù)中心的停機(jī)時(shí)間,ITIC 指出通常停機(jī)一小時(shí)的成本高達(dá) 30 萬(wàn)美元。
NVIDIA Mellanox 網(wǎng)絡(luò)部門(mén)營(yíng)銷(xiāo)資深副總裁 Gilad Shainer 表示:「UFM Cyber-AI 平臺(tái)可以判斷數(shù)據(jù)中心獨(dú)特的生命征象,用它們來(lái)辨識(shí)效能下降、零組件故障和異常使用模式。它讓系統(tǒng)管理員能夠快速偵測(cè)和因應(yīng)潛在的安全威脅,解決即將出現(xiàn)的故障情況,進(jìn)而節(jié)省成本與確保提供客戶一致的服務(wù)?!?/p>
澳洲國(guó)家計(jì)算基礎(chǔ)設(shè)施(NCI)副主任(服務(wù)和技術(shù))Allan Williams說(shuō):「 NCI在國(guó)家研究領(lǐng)域中起著舉足輕重的作用。我們的超級(jí)運(yùn)算基礎(chǔ)架構(gòu)可為5,000名研究人員提供服務(wù),服務(wù)重要的國(guó)家和全球活動(dòng)。 UFM使我們能夠有效地管理超級(jí)計(jì)算機(jī)并優(yōu)化效能。我們期待利用UFM Cyber-AI的新功能來(lái)進(jìn)一步提高我們的超級(jí)運(yùn)算利用率并提高投資回報(bào)率。」
美國(guó)俄亥俄州超級(jí)計(jì)算機(jī)中心副主任 Douglas Johnson 說(shuō):「我們的 InfiniBand 數(shù)據(jù)中心多年來(lái)一直在使用 UFM 平臺(tái),UFM 加上 Mellanox 網(wǎng)絡(luò)團(tuán)隊(duì)的專(zhuān)業(yè)長(zhǎng)才是我們管理網(wǎng)絡(luò)與維持網(wǎng)絡(luò)穩(wěn)定運(yùn)作的基本要素。我們見(jiàn)到 UFM Cyber-AI 平臺(tái)有著無(wú)比的優(yōu)點(diǎn)。
評(píng)論