2倍RTX 2080 Ti性能 RTX 3090 1萬(wàn)多個(gè)核心怎么來(lái)的?老黃變戲法
NVIDIA的RTX 30系列顯卡今天凌晨發(fā)布了,旗艦RTX 3090顯卡雖然價(jià)格漲到了1.2萬(wàn)元,但是性能比RTX 2080 Ti翻倍,簡(jiǎn)直是開(kāi)掛一樣。
本文引用地址:http://butianyuan.cn/article/202009/417873.htm就跟2018年圖靈GPU發(fā)布時(shí)一樣,老黃這次在發(fā)布會(huì)上再次強(qiáng)調(diào)安培GPU是有史以來(lái)性能提升最大的一次,這點(diǎn)上也沒(méi)錯(cuò),畢竟顯卡性能翻倍是這10年來(lái)都少見(jiàn)的。
RTX 3090顯卡是怎樣做到性能翻倍的?除了第二代RT單元、第三代Tensor單元之外,CUDA核心數(shù)也猛增到了10496個(gè),要知道RTX 2080 Ti也不過(guò)4352個(gè)。
CUDA核心數(shù)一下子從4000+翻倍到了10000+,這規(guī)模提升也太恐怖了,NVIDIA到底是怎么做到的?
特別是在發(fā)布之前,連AIC顯卡廠(chǎng)商拿到的數(shù)據(jù)都顯示RTX 3090是5248個(gè)CUDA核心而已,怎么就一下子翻倍了?
現(xiàn)在NVIDIA還沒(méi)公布安培GPU的架構(gòu),具體如何還不好說(shuō),不過(guò)我們可以分析下幾種可能。
上面是7nm安培GA100的架構(gòu)圖,每組SM單元中有64個(gè)INT32單元、64個(gè)FP32單元及32個(gè)FP64單元。
8nm安培游戲GPU跟A100主要架構(gòu)應(yīng)該差不多,但是不需要多少FP64單元,多了RT Core光追單元。
所以第一種FP32單元翻倍的可能就是——A100中的FP64單元被游戲GPU中的FP32取代了,這樣帶來(lái)額外一倍的FP32單元。
不過(guò)算起來(lái)簡(jiǎn)單,實(shí)際上就不好說(shuō)了,因?yàn)锳100是7nm工藝,核心面積依然有826mm,安培游戲GPU才8nm工藝,晶體管密度更低,280億只有A100的540億的一半,核心面積會(huì)小很多,還要加上RT Core單元,所以這種可能性非常小。
第二種可能在推上有人分析過(guò),那就是游戲GPU不僅砍掉了FP64單元,同時(shí)還做到了INT32單元跟FP32一樣的功能——可以同時(shí)計(jì)算整數(shù)或者浮點(diǎn),這樣一來(lái)64個(gè)INT32搖身一變也是FP32單元了,直接數(shù)量翻倍。
這個(gè)可能性比較大,也是NVIDIA之前稱(chēng)CUDA核心數(shù)是5248個(gè),臨到頭改成10496個(gè)的合理解釋了。
當(dāng)然,最后一種可能就是陰謀論了,老黃并沒(méi)有做到1萬(wàn)多個(gè)FP32,就是馬甲忽悠——不過(guò)真要是這么做,以后會(huì)有法律麻煩,老黃不會(huì)這么輕易讓人抓到把柄的。
總之,在沒(méi)有官方公布的細(xì)節(jié)之前,1萬(wàn)多個(gè)CUDA核心的由來(lái)比較迷,但不論那種解釋?zhuān)琋VIDIA肯定是技術(shù)上可以做到,否認(rèn)也不會(huì)有如此大的性能提升了。
評(píng)論