AVX-512在英特爾Emerald Rapids CPU上是一項顛覆性技術(shù)——第五代至強(qiáng)平均運(yùn)行速度提高了一倍,功耗略微增加
AVX-512在某些工作負(fù)載中提升性能高達(dá)10倍。
本文引用地址:http://butianyuan.cn/article/202401/454575.htm第五代至強(qiáng)Emerald Rapids CPU Linux基準(zhǔn)測試網(wǎng)站Phoronix對英特爾的第五代至強(qiáng)Emerald Rapids可擴(kuò)展CPU進(jìn)行了測試,以查看啟用AVX-512指令后其運(yùn)行速度提高了多少,結(jié)果顯示平均性能翻倍。在一些工作負(fù)載中,性能甚至提升了十倍以上,而功耗卻沒有大幅增加。
Phoronix使用了一臺服務(wù)器進(jìn)行測試,配備兩顆英特爾頂級的Xeon Platinum 8592+ 64核CPU,1TB DDR5內(nèi)存,3TB SSD,運(yùn)行在Intel Eagle Stream上,搭載Ubuntu Linux發(fā)行版。該網(wǎng)站對各種工作負(fù)載進(jìn)行了基準(zhǔn)測試,如Embree、OpenVKL和Y-Cruncher,并啟用AVX-512,使平均性能翻倍。
其中大部分的平均性能是基于OpenVINO的性能結(jié)果,Phoronix使用不同參數(shù)多次測試了OpenVINO。大多數(shù)啟用AVX-512的OpenVINO運(yùn)行顯示,性能至少提升了兩倍,最快的結(jié)果甚至提升了十倍以上。這主要?dú)w功于OpenVINO支持AVX-VNNI和BF16,對于AI工作負(fù)載尤為有用。啟用AVX-512與關(guān)閉AVX-512時的峰值頻率差異微小。啟用AVX-512時,Xeon Platinum 8592+在所有核心上的頻率達(dá)到2.95 GHz,而在關(guān)閉AVX-512時為3.01 GHz。64核Emerald Rapids芯片在啟用或關(guān)閉AVX-512時都達(dá)到了3.9 GHz的提升時鐘。
平均而言,啟用或關(guān)閉AVX-512并未改變功耗,盡管許多單獨(dú)的工作負(fù)載需要多達(dá)10%的額外功耗。最大功耗約高出120瓦,這在一定程度上是典型的,因為難以獲得無需權(quán)衡的免費(fèi)性能。較高的功耗也導(dǎo)致了稍微更高的溫度。此外,啟用AVX-512會稍微降低頻率,這可能是由于更高的功耗和溫度。
廣泛支持AVX-512指令是Emerald Rapids的主要賣點(diǎn)。盡管在原始性能方面,該CPU輸給了AMD的96核第四代EPYC Genoa芯片,正如我們在Emerald Rapids評論中所見,但AVX指令可以改變英特爾和AMD服務(wù)器CPU之間的動態(tài),尤其是對于AI。這可能是微軟選擇上一代Sapphire Rapids芯片而非EPYC與AMD的MI300X GPU搭配的原因之一。
評論